-
[論文紹介#159]オフライン強化学習による大規模言語モデルの多段階推論
in テックブログOffline Reinforcement Learning for LLM Multi-Step Reaso…
-
[論文紹介#158]効率的な長文コンテキスト言語モデルの検索と圧縮
in テックブログEfficient Long Context Language Model Retrieval with Co…
-
[論文紹介#157]ChatGarment: 大規模言語モデルを用いた衣服の推定、生成および編集
in テックブログChatGarment: Garment Estimation, Generation and Editing…
-
[論文紹介#156]Think&Cite: 自己指導型ツリー探索と進捗報酬モデルを用いた属性付きテキスト生成の改善
in テックブログMarkdownの記事 Think&Cite: Improving Attributed Text G…
-
[論文紹介#155]RetroLLM: 大規模言語モデルが生成の中で詳細な証拠を取得できるようにする
in テックブログRetroLLM: Empowering Large Language Models to Retrieve …
-
[論文紹介#153]VISA: 視覚的ソース帰属を伴う情報検索強化生成
in テックブログVISA: Retrieval Augmented Generation with Visual Source…
-
[論文紹介#152]RAG-Star: 検索強化による熟慮的推論の向上
in テックブログRAG-Star: Enhancing Deliberative Reasoning with Retriev…
-
[論文紹介#151]TACO: 合成思考と行動の連鎖を用いたマルチモーダル行動モデルの学習
in テックブログTACO: Learning Multi-modal Action Models with Synthetic…