-
[論文紹介#31]自律アニメーションキャラクターの信じられる演技に向けて
in テックブログ本日の論文 この論文は、強化学習と手続き型アニメーションを用いて、自律的で信じられるような演技を行うアニメーシ…
-
[論文紹介#30]ALoRA: 大規模言語モデルのファインチューニングのための低ランク適応の割り当て
in テックブログ本日の論文 この論文は、低ランク適応(LoRA)を拡張し、適応プロセス中に動的にランクを調整できる新たな手法「…
-
[論文紹介#28]QLoRA: 量子化された大規模言語モデルの効率的なファインチューニング
in テックブログ本日の論文 この論文は、QLoRAという効率的なファインチューニング手法を提案し、65Bパラメータのモデルを単…
-
[論文紹介#27]指示の事前学習:言語モデルは監視されたマルチタスク学習者である
in テックブログ本日の論文 この論文は、「Instruction Pre-Training」というフレームワークを提案し、言語…
-
[論文紹介#26]AI Agents That Matter(重要なAIエージェント)
in テックブログ本日の論文 この論文は、AIエージェントの評価基準とベンチマークの現状を分析し、コストと精度を共同最適化する新…
-
[論文紹介#25]一般ツールエージェントのためのベンチマーク:GTA
in テックブログ本日の論文 この論文は、実世界のタスクにおける大規模言語モデル(LLM)のツール使用能力を評価するための新しい…
-
[論文紹介#23]日本語のためのオープンな大規模言語モデルの探求:実践的ガイド
in テックブログ本日の論文 Exploring Open Large Language Models for the Japa…
-
[論文紹介#22]医療における取得強化生成の改善:反復的なフォローアップ質問を用いて
in テックブログ本日の論文 Improving Retrieval-Augmented Generation in Medic…