[論文紹介#288]ACPs: 自律エージェント間の信頼できる相互運用プロトコル

ACPs – Agent Collaboration Protocols for the Internet of Agents-v3

この論文は、異なるエージェント間の相互運用性と協調を促進するための「エージェントコラボレーションプロトコル(ACPs)」の提案を通じて、エージェントのインターネット(IoA)の構築に向けた包括的なプロトコルスイートを紹介しています。

ACPsは、異なるエージェント間の協力を促進するために、登録、発見、相互作用、ツールアクセスを標準化したプロトコルスイートを提供し、多様なエージェントの能力を効果的に統合する点が特筆されます。

論文:https://arxiv.org/abs/2505.13523


以下は、弊社AI開発ツール「IXV」を用いてこの論文を要約したものです。見出しや章立てが元論文とは異なる場合があります。

概要

この論文では、人工知能の急速な進展に伴い、自律エージェントの普及が相互運用性、スケーラビリティ、協調における新たな課題をもたらしていることを述べています。エージェントのインターネット(IoA)は、標準化された通信プロトコルを通じて異種エージェントを相互接続し、シームレスなコラボレーションと知能的なタスク実行を可能にすることを目指しています。しかし、既存のエージェント通信プロトコル(MCP、A2A、ANPなど)は断片化され、特定のシナリオに限定されています。

このギャップに対処するために、エージェントコラボレーションプロトコル(ACPs)という包括的なプロトコルスイートを提案します。ACPsは、信頼できるアクセス、能力のオーケストレーション、ワークフロー構築をサポートするための登録、発見、相互作用、ツールプロトコルを含みます。本論文では、ACPsのアーキテクチャ、主要技術、および応用ワークフローを示し、レストラン予約シナリオにおけるその効果を実証します。ACPsは、安全でオープン、スケーラブルなエージェント接続インフラの構築の基盤を提供します。

1. 序論

デジタル時代において、人工知能の急速な発展は「エージェント」という新しい技術的実体を生み出しました。知覚、意思決定、実行のための自律的能力を持つソフトウェアまたはハードウェア実体として、エージェントは技術的進歩の焦点となっています。基本的なタスク自動化から複雑な意思決定支援まで、エージェントは広く応用されています。パーソナルアシスタントとしてスケジュール管理や情報提供を行ったり、産業用ロボットとして生産プロセスを最適化し効率を向上させたりしています。

しかし、エージェントの数とその応用シナリオが増加するにつれて、孤立した単一エージェントシステムの限界が明らかになってきました。単一のエージェントは複雑なタスクを処理する能力に制限があり、変化する環境と複数の目標のバランスを取るための十分な柔軟性と適応性に欠けています。この課題に対応して、インターネット・オブ・エージェンツ(IoA)の概念が登場しました。

2. インターネット・オブ・エージェンツのアーキテクチャ

インターネット・オブ・エージェンツ(IoA)とは、標準化された通信プロトコルを介してインターネット上で自律的な知覚、計画、意思決定、実行が可能なエージェントを接続することで形成されるネットワークを指します。その実装をサポートするため、典型的なアーキテクチャは図1に示すような5層構造を採用しています。

2.A リソース層

リソース層は、エージェントの効率的な運用と連携をサポートするために不可欠なコンピューティング、ストレージ、通信、データリソースを提供します。コンピューティングリソースは、CPU、GPU、NPUなどのハードウェアやクラウドプラットフォームが提供する弾力的なコンピューティングサービスを含み、エージェントの複雑なアルゴリズムとモデル実行をサポートする強力な機能を提供します。ストレージリソースは、エージェントの運用データ、モデルパラメータ、ユーザー情報を保存するために使用されます。

2.B 管理層

管理層は、IoAにおけるエージェントの信頼できる連携と効率的な運用を確保するための鍵となります。一連のメカニズムとアーキテクチャ設計を通じて、管理層はエージェントの登録、発見、タスク割り当て、連携プロセス制御を可能にし、開放的で柔軟かつ効率的な協力ネットワークを構築します。その主な機能には、信頼できるアクセス、リソーススケジューリング、能力キャッシング、課金が含まれます。

2.C 連携層

連携層は、エージェント間の効率的な連携を可能にするための中核的なコンポーネントです。その目的は、様々なメカニズムとアーキテクチャ設計を通じて、エージェント間の動的な能力登録、発見、オーケストレーションをサポートし、それによって複雑なタスクの効果的な解決を実現することです。新しいエージェントがIoAに参加する際、サーバーに登録し、その能力の詳細な説明を提供する必要があります。これらの説明はサーバーのデータ層に保存され、他のエージェントはこの情報を照会して適切な協力者を見つけることができます。

2.D サービス層

サービス層は、企業、組織、または個人を含むIoAに参加する参加者によって構築されたエージェントエンティティから構成されています。これらのエージェントは様々な能力を持ち、独立して、または協力してサービスを提供することができます。サービス層はIoAの最も革新的な層であり、IoAの能力が発展し続けるにつれて、ますます活力を得るでしょう。

2.E ユーザー層

ユーザー層は、個人、企業、または組織ユーザーを含むIoAのエンドユーザーを表します。

3. インターネット・オブ・エージェンツの中核的能力

3.A エージェントの信頼認証

信頼認証は、エージェントがインターネットにアクセスする際、その身元と行動が安全なメカニズムを通じて検証されることを保証します。このプロセスはマルチエージェント連携システムの重要な部分であり、エージェントが安全で信頼できる環境で運用されることを確保します。主な側面には、エージェントの身元識別、エージェントの身元認証、エージェント間のセッションセキュリティが含まれます。

3.B エージェント能力の登録と発見

能力登録と発見は、プラットフォーム上でエージェント能力を登録・管理し、特定のタスク完了に必要な時に呼び出せるようにするプロセスを指します。このプロセスはエージェントの管理と効率的な利用に不可欠です。主要コンポーネントには、能力説明、能力登録、能力発見が含まれます。

3.C エージェント能力のオーケストレーション

IoAには、多様または重複する能力を持つ多くのエージェントが存在します。能力オーケストレーションとは、複数のエージェントの能力を調整・管理して複雑なタスクを達成することを指します。これにはタスクの分配、通信の最適化、意思決定が含まれます。完全なプロセスには、タスク分解、能力マッチング、タスクルーティング、タスク管理とモニタリングが含まれます。

3.D エージェントリソースのスケジューリング

タスク分解と能力マッチングの後、次の課題はタスク実行にあります。従来のインターネットと同様に、利用可能なコンピューティング/ネットワークリソースとエージェントが必要とするリソースの間にはしばしばミスマッチがあります。この問題は、多くのエージェントが大規模なAIモデルに依存し、相当な計算リソースを必要とするIoAでは特に深刻です。そのため、リソーススケジューリングは基本的な能力となります。

3.E エージェント能力のキャッシング

将来、ほぼすべてのインターネットユーザーが複数のパーソナライズされたエージェントを持つ世界では、エージェントはユーザーの場所とデバイスを超えて追従する必要があります。最適なパフォーマンスのために、エージェントサービスはユーザーにできるだけ近い場所で実行されるべきです。したがって、能力キャッシングは応答性と効率的な運用に不可欠です。

3.F エージェント使用の課金

広範な商業アプリケーションをサポートするように設計されたプラットフォームとして、IoAは正確で包括的なエージェント課金機能を備えている必要があります。課金とは、ユーザーがエージェントサービスにアクセスするための料金請求方法を指します。異なるシナリオとユーザーグループには、異なる課金モデルが必要な場合があります。

4. ACPs: プロトコルスイートの設計

前述の機能を実現するためには、標準化された構造化された連携プロトコルスイートが不可欠です。エージェント連携プロトコル(ACPs)は、この必要性を満たすように設計されたシステム指向の開放的なプロトコルファミリーを表しています。ACPsはエージェント登録、発見、通信、ツール/リソースアクセスを含む複数の中核機能をカバーしています。目標は、しばしば狭いシナリオに焦点を当てている既存のプロトコルのギャップを埋め、インターネット・オブ・エージェンツ(IoA)のための統一されたフレームワークを提供することです。

4.A エージェント登録プロトコル(ARP)

エージェント登録プロトコル(ARP)は、エージェント能力の宣言、信頼できる登録、動的管理を標準化することを目的としています。その定義と実装ステップには以下が含まれます:

まず、能力記述言語を定義します。セマンティックモデリングに基づいて、この言語は多様なエージェント能力の統一された表現をサポートする必要があります。それは外部能力(知覚、意思決定、行動、相互作用)と内部能力(タスク計画、長期/短期記憶、自己進化)の両方を記述し、連携だけでなく管理可能性も可能にします。

次に、登録サーバーの階層的アーキテクチャを設計します。ルートサーバーは下位レベルの登録サーバーを管理し、ツリーのような構造を形成します。各登録サーバーはエージェントのグループの能力データ管理を担当します。

4.B エージェント発見プロトコル(ADP)

エージェント発見プロトコル(ADP)は、タスク要件に基づいて効率的かつ正確な能力識別を可能にするように設計されています。これにより、ユーザーやエージェントはネットワーク内のエージェントの範囲と適用可能性を理解することができます。主要なコンポーネントには以下が含まれます:

まず、能力クエリのための自然言語と構造化入力の両方をサポートするハイブリッドクエリ言語とインターフェースを定義します。

次に、分散型発見クラウドサービスを構築します。これには、発見サーバー、登録サーバー、エージェント間の効果的な通信のためのインターフェースが含まれます。能力の更新は、鮮度と一貫性を確保するために効率的に伝播される必要があります。

4.C エージェント相互作用プロトコル(AIP)

エージェント相互作用プロトコル(AIP)は、タスク指向の連携フレームワークの構築をサポートします。動的なタスク分配とグループ内交渉を可能にすることで、AIPは複雑なタスクの信頼性の高い実行を確保します。主な側面には以下が含まれます:

まず、タスク割り当てメカニズムとワークフローを定義します。そのフローは図5に示されています。

  • ユーザーはパーソナルアシスタントエージェント(P-Agent)を通じてタスク要求を開始します。
  • P-AgentはADPを使用してタスクで連携できるエージェント(Agent_1からAgent_n)を見つけ、グループ形成要求を送信します。
  • 各エージェントは確認で応答し、タスクグループに参加します。
  • P-Agentはタスクを分解し能力をオーケストレーションしてから、グループ内の各エージェントにサブタスクを配布します。

4.D エージェントツーリングプロトコル(ATP)

エージェントツーリングプロトコル(ATP)は、エージェントが動的にツール、リソース、外部サービスにアクセスすることを可能にします。これによりタスク実行のためのワークフロー構築が容易になります。主要なコンポーネントには以下が含まれます:

まず、ツールとリソースへのアクセスのための標準化された方法を定義します。このアーキテクチャには以下が含まれます:

  • ツール登録マネージャー:ツールはプロバイダーによってセマンティック記述と公開インターフェースを使用して登録されます。
  • リソースマネージャー:データベース、API、その他の資産に動的に接続します。
  • システムはスケーラビリティのための階層管理をサポートします。

5. 応用シナリオ

ACPsの応用を説明するために、レストランと旅行計画領域からの詳細な例を紹介します。このシナリオでは、ユーザーAがビジネス出張中で午後7時までに地元のレストランで食事をしたいと考えています。パーソナルアシスタントエージェント(P-Agent)は、以下のステップを通じて複数の他のエージェントと調整します:

  1. 目的地に到着後、ユーザーAはパーソナルアシスタントエージェントと会話し、食事の時間、料理の種類、予算、特定の食事制限(ベジタリアン、グルテンフリーなど)を含む好みを説明します。
  2. パーソナルアシスタントは認証し、インターネット・オブ・エージェンツへの信頼できるアクセスを取得します。
  3. P-Agentは能力発見サーバー(ADPを通じて)にレストラン情報検索、推薦、予約、旅行計画の能力を持つ関連エージェントを照会し、近くの適切なエージェントへのリンクを取得します。

6. 結論

本論文では、インターネット・オブ・エージェンツ(IoA)向けに特別に設計されたプロトコルスイートであるエージェント連携プロトコル(ACPs)を紹介しました。このフレームワークはエージェントの定義と特性、全体的なアーキテクチャ、必須システム機能、モジュラープロトコル設計とワークフローを統合しています。エージェント登録プロトコル(ARP)、エージェント発見プロトコル(ADP)、エージェント相互作用プロトコル(AIP)、エージェントツーリングプロトコル(ATP)という中核モジュールを通じて、IoAは信頼できるエージェントアクセス、能力登録と発見、タスク連携、動的ツール/リソース呼び出しを実現できます。