-
[論文紹介#132]ノーと言う技術:言語モデルにおける文脈的非遵守のアート
in テックブログThe Art of Saying No: Contextual Noncompliance in Langu…
-
[論文紹介#131]デザイン2コード:自動化されたフロントエンドエンジニアリングのためのマルチモーダルコード生成のベンチマーキング
in テックブログDesign2Code: Benchmarking Multimodal Code Generation fo…
-
[論文紹介#130]オープン・スカラー:検索強化型言語モデルによる科学文献の合成
in テックブログOPEN SCHOLAR: Synthesizing Scientific Literature with R…
-
[論文紹介#129]AssistRAG: インテリジェント情報アシスタントによる大規模言語モデルの可能性の向上
in テックブログAssistRAG: Boosting the Potential of Large Language Mod…
-
[論文紹介#128]マルチモーダル生成モデルに対する脱獄攻撃と防御に関する調査
in テックブログJailbreak Attacks and Defenses against Multimodal Gener…
-
[論文紹介#127]デコプロンプト : 大規模言語モデルが誤った前提に直面したときの幻覚を減少させるプロンプトのデコーディング
in テックブログDecoPrompt : Decoding Prompts Reduces Hallucinations wh…
-
[論文紹介#126]OASIS: 一百万エージェントによるオープンエージェントの社会的相互作用シミュレーション
in テックブログOASIS: Open Agents Social Interaction Simulations on On…
-
[論文紹介#125]フロンティア数学:AIにおける高度な数学的推論を評価するためのベンチマーク
in テックブログFrontier Math: A Benchmark for Evaluating Advanced Math…
-
[論文紹介#124]WorkflowLLM: 大規模言語モデルのワークフローオーケストレーション能力の向上
in テックブログWorkflowLLM: Enhancing Workflow Orchestration Capabilit…