-
[論文紹介#83]目標指向インタラクティブエージェントのための複雑なタスクに関する調査
in テックブログA Survey on Complex Tasks for Goal-Directed Interactive…
-
[論文紹介#82]AudioGPT: 音声、音楽、音、トーキングヘッドの理解と生成
in テックブログAudioGPT: Understanding and Generating Speech, Music, S…
-
[論文紹介#81]LLMを活用した会話型音声アシスタント:インタラクションパターン、機会、課題、およびデザインガイドライン
in テックブログLLM-Powered Conversational Voice Assistants: Interactio…
-
[論文紹介#78]画面を見つめるだけ:マルチモーダルチェーン・オブ・アクションエージェント
in テックブログYou Only Look at Screens: Multimodal Chain-of-Action Ag…
-
[論文紹介#77]TART: 説明可能なテーブルベースの推論のためのオープンソースツール拡張フレームワーク
in テックブログTART: An Open-Source Tool-Augmented Framework for Expla…
-
[論文紹介#76]P-RAG: 進行的情報検索強化生成による具現化された日常タスクの計画
in テックブログP-RAG: Progressive Retrieval Augmented Generation For P…
-
[論文紹介#75]MolmoとPixMo:最先端のマルチモーダルモデルのためのオープンウェイトとオープンデータ
in テックブログMolmo and PixMo: Open Weights and Open Data for State-o…