-
[論文紹介#150]パーソナライズされたマルチモーダル大規模言語モデル:調査
in テックブログPersonalized Multimodal Large Language Models: A Survey…
-
[論文紹介#148]Inst-IT: 明示的な視覚プロンプト指示チューニングによるマルチモーダルインスタンス理解の強化
in テックブログInst-IT: Boosting Multimodal Instance Understanding via…
-
[論文紹介#147]モヒート:動画生成のための動きの軌跡と強度制御
in テックブログMojito: Motion Trajectory and Intensity Control for Vid…
-
[論文紹介#146]ウェブエージェント研究のためのBrowserGymエコシステム
in テックブログThe BrowserGym Ecosystem for Web Agent Research この論文は、ウ…
-
[論文紹介#145]大規模言語モデルを活用したGUIエージェント: サーベイ
in テックブログLarge Language Model-Brained GUI Agents: A Survey この論文は…
-
[論文紹介#144]xRAG: 一つのトークンによる検索強化生成のための極限コンテキスト圧縮
in テックブログxRAG: Extreme Context Compression for Retrieval-augment…
-
[論文紹介#143]生成から判断へ:LLMを裁判官として使うことの機会と課題
in テックブログFrom Generation to Judgment: Opportunities and Challeng…
-
[論文紹介#142]情報取得強化生成のリスク制御:反事実的プロンプティングフレームワーク
in テックブログControlling Risk of Retrieval-augmented Generation: A C…