-
[論文紹介#87]LLaVA-Critic:マルチモーダルモデルを評価するための学習
in テックブログLLaVA-Critic: Learning to Evaluate Multimodal Models この…
-
[論文紹介#86]MinerU: 精密な文書内容抽出のためのオープンソースソリューション
in テックブログMinerU: An Open-Source Solution for Precise Document Co…
-
[論文紹介#85]LLMは見せる以上のことを知っている:LLMの幻覚の内在的表現について
in テックブログLLMs Know More Than They Show: On the Intrinsic Represe…
-
[論文紹介#83]目標指向インタラクティブエージェントのための複雑なタスクに関する調査
in テックブログA Survey on Complex Tasks for Goal-Directed Interactive…
-
[論文紹介#82]AudioGPT: 音声、音楽、音、トーキングヘッドの理解と生成
in テックブログAudioGPT: Understanding and Generating Speech, Music, S…
-
[論文紹介#81]LLMを活用した会話型音声アシスタント:インタラクションパターン、機会、課題、およびデザインガイドライン
in テックブログLLM-Powered Conversational Voice Assistants: Interactio…