Microsoftから、RAGに関する新しいサービスの記事がでたので、ご紹介します。
Exploring the Advanced RAG (Retrieval Augmented Generation) Service
Advanced RAG Serviceは、複数のRAG技術が検証可能なDockerコンテナ環境です。ローカルPCまたは、Azureのコンテナサービスで動作させることができます。
- 利用可能なRAG技術
- LlamaIndexを使用したナレッジグラフ
- LlamaIndexを使用した再帰的検索クエリ
- LlamaIndexを使用したツリー階層的要約
- Azure AI Searchのセマンティックハイブリッド検索+サブクエリエンジン
- Microsoft GraphRAG(ローカル検索/グローバル検索)
- 主な機能
- 文書入力、インデックス管理用のWebUI
- チャットモード
- REST API
- ナレッジグラフのビューワー
- Word用のアドイン
以下は、LLMを活用して記事の内容を翻訳したものになります。
目次
高度なRAG(検索拡張生成)サービスの探求
AIの進化する世界で、LLMとRAGの組み合わせは典型的な使用シナリオとなっている。複雑な文書から正確な関連データを取得し、LLMの応答品質を向上させることが課題だ。この記事では、様々なRAG技術を検証できるDockerコンテナ化されたサービスを紹介している。
はじめに
RAGの課題に対処するため、Azure Intelligent Document、Azure OpenAI、LlamaIndex、LangChain、Gradioなどを使用して高度なRAGサービスが開発された。このサービスはDockerコンテナにパッケージ化され、異なる索引技術の実験、精度評価、パフォーマンス最適化を可能にする。
主な機能
このサービスは、LlamaIndexを使用したナレッジグラフ、段階的検索クエリ、階層的要約、Azure AI Searchを使用した意味論的ハイブリッド検索とサブクエリエンジン、Microsoft GraphRAGなどの機能を提供する。これらの技術により、多様なRAGアプローチの検証が可能となる。
クイックスタートガイド
サービスの使用を開始するには、GitHubリポジトリのクローン、環境変数の設定、Dockerイメージのビルドと実行が必要。Azure Container Appsでの実行も可能。Azure OpenAIとAzure Document Intelligenceリソースが必要となる。
インデックスの構築
インデックス構築には、”Index Build”タブでのファイルアップロード(PDFを推奨)、”Submit”クリック、構築完了待機、そしてローカル使用のためのインデックスダウンロードが含まれる。このプロセスにより、RAG技術の基盤となるインデックスが作成される。
サービスの使用
サービスはREST APIを通じて呼び出すことができ、チャットモードと文書校正モードを提供する。また、ナレッジグラフインデックスの可視化機能も含まれている。これらの機能により、様々な角度からRAG技術の効果を検証できる。
結論
高度なRAGサービスは、検索拡張生成技術の探索と最適化を目指す開発者向けの有用なソリューションである。柔軟なDocker対応環境により、迅速な実験とデプロイメントが可能となり、特定のユースケースに最適な索引戦略の発見を支援する。