-
[論文紹介#75]MolmoとPixMo:最先端のマルチモーダルモデルのためのオープンウェイトとオープンデータ
in テックブログMolmo and PixMo: Open Weights and Open Data for State-o…
-
[論文紹介#74]構成可能な基盤モデル:モジュールの視点からのLLMの構築
in テックブログConfigurable Foundation Models: Building LLMs from a Mo…
-
[論文紹介#73]CoCA: 憲法的キャリブレーションによるマルチモーダルLLMの安全意識の回復
in テックブログCoCA: Regaining Safety-awareness of Multimodal Large La…
-
[論文紹介#72]生成型エージェントを用いた調査データ報告のためのヒントシート作成
in テックブログUsing Generative Agents to Create Tip Sheets for Invest…
-
[論文紹介#71]ソフトウェア工学におけるエージェント:調査、ランドスケープ、ビジョン
in テックブログAgents in Software Engineering: Survey, Landscape, and …
-
[論文紹介#70]VisionTasker: ビジョンベースのUI理解とLLMタスク計画を用いたモバイルタスク自動化
in テックブログVisionTasker: Mobile Task Automation Using Vision Based…
-
[論文紹介#69]Moshi:リアルタイム対話のための音声-テキスト基盤モデル
in テックブログMoshi: a speech-text foundation model for real-time dia…
-
[論文紹介#68]LLMエージェント統一モデリングフレームワーク:マルチアクティブ/パッシブコアエージェントのシームレスな統合のためのLLMベースのエージェント
in テックブログLLM-Agent-UMF: LLM-based Agent Unified Modeling Framewo…
-
[論文紹介#67]大規模言語モデルのための好み学習の統一的な視点に向けて:調査
in テックブログTowards a Unified View of Preference Learning for Large…
-
[論文紹介#66]GUI-W ORLD : GUI指向のマルチモーダルLLMベースのエージェントのためのデータセット
in テックブログGUI-WORLD: A Dataset for GUI-oriented Multimodal LLM-ba…