[論文紹介#255]MCPブリッジ:軽量でLLM非依存のRESTfulプロキシによるモデルコンテキストプロトコルサーバー

MCP Bridge: A Lightweight, LLM-Agnostic RESTful Proxy for Model Context Protocol Servers

この論文は、リソース制約のある環境でも利用可能な軽量なRESTfulプロキシ「MCP Bridge」を提案し、様々なモデルコンテキストプロトコル(MCP)サーバーに接続することで、セキュリティと互換性を向上させる方法を示しています。

MCP Bridgeは、リソース制約のある環境でも使用可能な軽量なRESTfulプロキシであり、異なるベンダーの大規模言語モデルを統一されたAPIで接続できる点が革新的です。

論文:https://arxiv.org/abs/2504.08999
リポジトリ:https://github.com/INQUIRELAB/mcp-bridge-api


以下は、弊社AI開発ツール「IXV」を用いてこの論文を要約したものです。見出しや章立てが元論文とは異なる場合があります。

概要

本論文では、MCP(Model Context Protocol)サーバー用の軽量なRESTfulプロキシであるMCP Bridgeを提案します。大規模言語モデル(LLM)は、MCPのような標準化されたインターフェースを通じて外部ツールで強化されていますが、現在のMCP実装には重要な制限があります。具体的には、通常はSTDIOトランスポートを介したローカルプロセスの実行を必要とし、モバイルデバイス、ウェブブラウザ、エッジコンピューティングなどのリソース制約のある環境では実用的ではありません。

MCP Bridgeは、複数のMCPサーバーに接続し、それらの機能を統一されたAPIを通じて公開する軽量なRESTfulプロキシです。既存のソリューションとは異なり、MCP Bridgeは完全にLLM非依存であり、ベンダーに関係なく任意のバックエンドをサポートします。このシステムは、標準実行、確認ワークフロー、Docker隔離の3つのセキュリティレベルを持つリスクベースの実行モデルを実装し、標準MCPクライアントとの後方互換性を維持しています。サーバーサイドのインフラストラクチャを補完するのは、MCPツールとの自然言語インタラクションを促進するPythonベースのMCP Geminiエージェントです。

評価の結果、MCP Bridgeは直接のMCP接続の制約に対処しつつ、強化されたセキュリティ制御とクロスプラットフォームの互換性を提供し、これまでアクセスできなかった環境での高度なLLM駆動アプリケーションを可能にすることが示されました。

MCP Bridge: モデルコンテキストプロトコルサーバーのための軽量LLM非依存RESTfulプロキシ

1. はじめに

本論文では、モデルコンテキストプロトコル(MCP)に基づく大規模言語モデル(LLM)の外部ツールとの統合における課題を指摘し、これに対する解決策として「MCP Bridge」を提案しています。従来のMCP実装は、STDIOトランスポートを介したローカルプロセスの実行が必要であり、リソース制約のある環境(モバイルデバイス、ウェブブラウザ、エッジコンピューティング)では実用的ではありません。

2. 関連研究

2.1 ツール利用と検索拡張型言語モデル

大規模言語モデル(LLM)は固有の知識と能力の限界を克服するために、外部データソースやツールで増強されてきました。検索拡張生成(RAG)は代表的なアプローチで、Lewisらが提案した枠組みでは、パラメトリックなニューラル生成器と非パラメトリックな検索文書メモリを組み合わせています。これにより、知識集約型タスクのパフォーマンスが向上し、最新知識へのアクセスが可能になりました。

また、ReActやToolformerなどのフレームワークは、LLMが外部ツールやAPIを呼び出す能力を強化しています。HuggingGPTやVisual ChatGPTなどは、LLMを専門AIモデルのオーケストレーターとして活用する手法を示しています。

2.2 標準化とLLM非依存型統合

ツール統合の拡張性が課題となる中、Anthropicのモデルコンテキストプロトコル(MCP)は重要な標準化の取り組みです。MCPは統一されたクライアント-サーバーアーキテクチャを提供し、ツールやデータソースを一貫したインターフェースで公開します。

RESTful APIプロキシもLLMと既存ウェブサービスを接続する手段として研究されています。SongらのRestGPTは、OpenAPI仕様を利用してLLMがRESTAPIを学習し使用できるようにしています。

当研究で提案するMCP Bridgeは、この標準化の哲学に沿って、MCPサーバーとクライアントアプリケーション間のRESTfulアダプターとして機能します。基盤となるモデルや環境に依存せず、実用的でモジュール型の統合ソリューションを提供します。

3. システム設計と実装

3.1 システムアーキテクチャと技術スタック

MCP Bridgeはクライアントアプリケーションと基盤となるMCPサーバープロセスを分離する階層型アーキテクチャを採用しています。Node.js(18+)上に構築され、Express.js、Child Process API、Server-Sent Events、Docker SDKなどのコアコンポーネントを使用しています。この技術スタックは、最小限のフットプリント、クロスプラットフォーム互換性、ノンブロッキングI/O機能を備え、低レイテンシで複数の同時接続を処理する必要があるプロキシにとって重要な要件を満たしています。

3.2 RESTful APIとエンドポイント

MCP BridgeはMCPサーバー機能へのアクセスを標準化する包括的なREST APIを公開しています。このAPIはサーバー管理用の一般的なエンドポイントとツール実行・リソースアクセス用のサーバー固有エンドポイントに整理されています。各エンドポイントは適切なHTTPステータスコードと標準化されたエラーレスポンスを返します。

3.3 サーバー管理と接続処理

MCP Bridgeは標準のSTDIOベースサーバーと新しいServer-Sent Events(SSE)実装の両方をサポートし、MCPサーバーへの接続を動的に管理します。システムは接続時に各サーバーの機能(利用可能なツール、リソース、プロンプト)を自動的に発見し、REST API経由で即時に利用可能にします。

3.4 セキュリティモデルとリスクベース実行

MCP Bridgeはリスクベースの実行レベルを中心とした包括的なセキュリティモデルを実装しています。リスクレベルは3段階あり、低リスク(読み取り専用操作向け)、中リスク(実行前に明示的な確認が必要)、高リスク(最大限のセキュリティのためDockerコンテナ内で実行)です。このマルチレベルアプローチにより、システム管理者はセキュリティ要件に基づいて適切なリスクレベルを設定できます。

3.5 クライアント統合(MCP-Geminiエージェント)

サーバーサイドプロキシを補完するのがMCP-Geminiエージェントで、Google GeminiとMCP Bridgeを統合するPythonクライアントです。このエージェントは、複数ステップの推論、セキュリティ確認処理、柔軟なJSON表示、自動ツール発見などの機能を実装しています。これにより、ユーザーは会話プロンプトを通じてツールと対話できます。

4. 実験と評価

4.1 実験設定

MCP Bridgeの評価は、リソース制約のある環境における直接的なMCP接続の制約を克服することに焦点を当てています。具体的には、複数のMCPサーバーへの接続の性能、セキュリティレベルの効果、クロスプラットフォーム互換性を測定しました。

4.2 結果と考察

評価の結果、MCP Bridgeは従来のMCP接続方式に比べて、セキュリティ制御を強化し、より洗練されたLLM駆動アプリケーションを以前はアクセスできなかった環境でも実現可能にすることが確認されました。この成功により、MCP Bridgeはリソース制約のある環境でのLLMの活用を促進します。

5. 結論

本論文は、MCP Bridgeが持つ技術的な利点と新たなアプローチを強調し、特にセキュリティと互換性の面で顕著な利点を持つことを明らかにしています。将来的な応用の可能性についても言及し、MCP BridgeがLLMとMCPサーバー間の接続を改善し、利用可能な環境を広げることを目指した画期的なソリューションであることを示しています。