カテゴリー: テックブログ
-
[論文紹介#81]LLMを活用した会話型音声アシスタント:インタラクションパターン、機会、課題、およびデザインガイドライン
in テックブログLLM-Powered Conversational Voice Assistants: Interactio…
-
[論文紹介#78]画面を見つめるだけ:マルチモーダルチェーン・オブ・アクションエージェント
in テックブログYou Only Look at Screens: Multimodal Chain-of-Action Ag…
-
[論文紹介#77]TART: 説明可能なテーブルベースの推論のためのオープンソースツール拡張フレームワーク
in テックブログTART: An Open-Source Tool-Augmented Framework for Expla…
-
[論文紹介#76]P-RAG: 進行的情報検索強化生成による具現化された日常タスクの計画
in テックブログP-RAG: Progressive Retrieval Augmented Generation For P…
-
[論文紹介#75]MolmoとPixMo:最先端のマルチモーダルモデルのためのオープンウェイトとオープンデータ
in テックブログMolmo and PixMo: Open Weights and Open Data for State-o…
-
[論文紹介#74]構成可能な基盤モデル:モジュールの視点からのLLMの構築
in テックブログConfigurable Foundation Models: Building LLMs from a Mo…
-
[論文紹介#73]CoCA: 憲法的キャリブレーションによるマルチモーダルLLMの安全意識の回復
in テックブログCoCA: Regaining Safety-awareness of Multimodal Large La…