-
[論文紹介#127]デコプロンプト : 大規模言語モデルが誤った前提に直面したときの幻覚を減少させるプロンプトのデコーディング
in テックブログDecoPrompt : Decoding Prompts Reduces Hallucinations wh…
-
[論文紹介#126]OASIS: 一百万エージェントによるオープンエージェントの社会的相互作用シミュレーション
in テックブログOASIS: Open Agents Social Interaction Simulations on On…
-
[論文紹介#125]フロンティア数学:AIにおける高度な数学的推論を評価するためのベンチマーク
in テックブログFrontier Math: A Benchmark for Evaluating Advanced Math…
-
[論文紹介#124]WorkflowLLM: 大規模言語モデルのワークフローオーケストレーション能力の向上
in テックブログWorkflowLLM: Enhancing Workflow Orchestration Capabilit…
-
[論文紹介#121]OML: オープンでマネタイズ可能かつ忠実なAI
in テックブログOML: Open, Monetizable, and Loyal AI この論文は、AIの開発と所有権を民主…
-
[論文紹介#120]基盤モデルを用いたGUIエージェントの包括的調査
in テックブログGUI Agents with Foundation Models: A Comprehensive Surv…
-
[論文紹介#119]HtmlRAG: RAGシステムにおける取得知識のモデリングにはプレーンテキストよりもHTMLが優れている
in テックブログHtmlRAG: HTML is Better Than Plain Text for Modeling Re…