What is an AI Agent?

AIエージェントは、特定の目標を達成するために、環境に関する情報を認識または取得し、意思決定を行い、(多くの場合、ツールやシステム連携を通じて) 行動を実行できる、非人間アイデンティティ (NHI) です。大規模言語モデル (LLM)、機械学習モデル、ルールベースのロジックなどの人工知能 (AI) 技術を活用し、データを分析して次のステップを判断し、人の関与の度合いに応じながらタスクを実行します。主にプロンプトへの応答を生成する単発型のAIモデルとは異なり、AIエージェントは目標に基づいて行動する仕組みであり、状態を維持しながらツールを活用し、新しい状況に適応しつつ、複数のステップにわたって動作できます。

AIエージェント、チャットボット、生成AIの違い

AIエージェント、チャットボット、生成AIは混同されることが多いですが、機能や自律性のレベルはそれぞれ異なります。AIエージェントは、特定の目標を達成するために意思決定を行い、行動を実行するよう設計されており、多くの場合、外部システムと連携してワークフローを実行します。チャットボットは主にプロンプトに応じた会話を行いますが、近年では、あらかじめ定義された限定的な操作を実行できるものもあります。生成AIは、学習したパターンに基づいて新しいコンテンツ (テキスト、コード、画像、構造化データなど) を生成することに特化しています。自動化システムの一部として利用されることもありますが、それ単体では必ずしも実世界の行動を計画・実行するわけではありません。主な違いは以下のとおりです。

特徴	AIエージェント	チャットボット	生成AI
機能	意思決定と自律的な行動を通じて目標を達成	主に会話を行い、問い合わせに対応	プロンプトに基づいてコンテンツを生成
自律性のレベル	人の介入を最小限に抑えながら、タスクの計画と実行が可能	ユーザーの入力に応じて反応する仕組み	プロンプトに応じて出力を生成 (自律性は統合方法による)
行動を実行する能力	ワークフローを実行し、APIを呼び出し可能	一部のチャットボットは、事前定義された操作を実行可能	通常は出力生成のみ。ツールやシステムに連携した場合にのみ動作可能

AIエージェント

機能意思決定と自律的な行動を通じて目標を達成

自律性のレベル人の介入を最小限に抑えながら、タスクの計画と実行が可能

行動を実行する能力ワークフローを実行し、APIを呼び出し可能

チャットボット

機能主に会話を行い、問い合わせに対応

自律性のレベルユーザーの入力に応じて反応する仕組み

行動を実行する能力一部のチャットボットは、事前定義された操作を実行可能

生成AI

機能プロンプトに基づいてコンテンツを生成

自律性のレベルプロンプトに応じて出力を生成 (自律性は統合方法による)

行動を実行する能力通常は出力生成のみ。ツールやシステムに連携した場合にのみ動作可能

AIエージェントの仕組み

AIエージェントは、知覚、意思決定、行動というサイクルを繰り返しながら動作します。AIエージェントに使われる技術はさまざまですが、ほとんどのエージェントが共通したワークフローに基づいて動作しています。

指示、プロンプト、目標を受け取る: AIエージェントは、ユーザーからのリクエスト、事前定義された目標、またはシステムからのイベント (トリガー) によって動作を開始します。
コンテキストを収集: AIエージェントは、タスクを実行する前に、ユーザー入力、データベースの記録、APIレスポンスなどの関連データを収集します。エージェントによっては、過去の経験や以前のやり取りを参照するために、短期または長期のメモリを保持するものもあります。
意思決定を行う: AIエージェントは、機械学習モデル、LLM、ルールベースのロジックを活用して、実行可能なアクションを評価し、想定される結果を比較したうえで、最適な次のステップを判断します。
アクションの計画と実行: 複雑な目的を達成するために、AIエージェントはファイルやシステムの更新などの一連のアクションを計画し、実行します。
結果の評価: 高度なAIエージェントの中には、自身のアクションが意図した結果を達成できたかどうかを評価し、その結果に応じて今後の動作を調整できるものもあります。

AIエージェントの主な5つの種類

AIエージェントは、意思決定の方法や環境との関わり方に基づいて、主に5つのタイプに分類されます。

1. 単純反射型エージェント

単純反射型エージェントは、最も基本的なタイプのAIエージェントで、あらかじめ定義されたルールに基づいて特定の入力に反応します。これらのエージェントはメモリを保持せず、より広い文脈を考慮しないため、予測可能な環境には適していますが、複雑な状況への対応には限界があります。

2. モデルベース型反射エージェント

モデルベース型反射エージェントは、環境の内部モデルを保持しており、変化を追跡しながら、過去のやり取りが現在の状態にどのように影響するかを考慮できます。単純反射型エージェントに比べて適応性が高く、過去の状態の一部を記憶できますが、依然として主にあらかじめ定義されたロジックに基づいて動作します。

3. 目標ベース型エージェント

目標ベース型エージェントは、明確な目的を持って動作し、その目標を達成するためにどのような行動が有効かを判断します。将来の結果を考慮しながら、それに基づいて行動の手順を計画しますが、意思決定の仕組み自体はあらかじめプログラムされた範囲に制限されています。

4. 効用ベース型エージェント

効用ベース型エージェントは、さまざまな結果の望ましさを評価・比較し、利益を最大化しつつリスクを最小限に抑える行動を選択します。変化の多い環境でも有効で、複数の選択肢のメリットとデメリットを比較しながら、目標ベース型エージェントよりも柔軟で高度な意思決定を行います。

5. 学習型エージェント

学習型エージェントは、AIエージェントの中でも最も高度なタイプであり、新しいデータや過去の経験に基づいて継続的に性能を向上させます。環境に適応できる能力を持つため、複雑な環境に特に適しています。

AIエージェントの活用例

AIエージェントはさまざまな業界で活用されており、意思決定の自動化、ワークフローの実行、人の介入の削減に貢献しています。以下に、AIエージェントの代表的な活用例を紹介します。

カスタマーサポートエージェント: AIを活用したカスタマーサポートエージェントは、顧客からの問い合わせを分析し、アカウント情報を取得し、返金処理を行い、必要に応じて適切な担当者へ対応を引き継ぎます。
コーディングエージェント: コーディングエージェントは、コードの生成・テスト・改善を行い、脆弱性を特定し、コードリポジトリ全体にわたって改善提案を行うことで、開発者を支援します。
車両の自動運転: 自動運転車は、センサーやAIモデルを活用して道路状況や交通の流れを把握し、より効率的な移動を実現するためにリアルタイムで運転の判断を行います。
在庫管理エージェント: 小売業の現場では、AIエージェントが在庫レベルを監視し、発注業務を自動化し、機器の故障を検知し、遅延に対応するために配送ルートを調整することで、サプライチェーンの混乱を軽減します。
IT運用エージェント: 企業のIT環境において、AIエージェントは異常を検知し、パッチを適用し、あらかじめ定義された復旧ワークフローを実行できます。
金融取引エージェント: 金融サービス分野では、AIエージェントが市場データをリアルタイムで分析し、あらかじめ定義された戦略に基づいて取引を実行することで、スピードと拡張性を重視した運用を実現します。

AIエージェントがもたらす新たなセキュリティリスク

AIエージェントが企業システムにますます統合されるにつれて、新たなセキュリティ上の懸念が生じています。AIエージェントは、データへのアクセス、アプリケーションとの連携、自律的なアクションの実行が可能であるため、サービスプリンシパル、ワークロードID、APIトークン、OAuthアプリケーションなどの独自のIDを使用する場合、NHIとして機能します。AIエージェントは、サービスアカウントやボットと同様に、独自の認証情報や権限を用いて動作します。そのため、人間のユーザーと同じように、最小権限の原則、強力な認証、監査ログなどを通じて、慎重に管理・監視する必要があります。ゼロトラストセキュリティモデルでは、人間もマシンも、いかなるアイデンティティも自動的には信頼されません。セキュリティリスクを軽減するため、アクセスは継続的に検証・認可される必要があります。AIエージェントに関連する主なリスクは次のとおりです。

不正アクセス: 多くの場合、AIエージェントが機能するには認証情報、トークン、APIキーなどが必要です。これらのシークレットが漏洩したり、設定ミスがあったりすると、サイバー犯罪者がAIエージェントのIDを悪用して、重要なシステムや社内データベースへアクセスする可能性があります。
特権昇格: AIエージェントに過剰な権限が付与されると、本来想定されていない範囲まで操作を行う可能性があります。エージェントが侵害された場合、重要なシステムの変更、制限されたデータへのアクセス、設定の改ざんなどが行われる恐れがあります。
プロンプトインジェクション攻撃: LLMを活用したAIエージェントは、悪意のある入力によってシステムの指示が操作されるプロンプトインジェクションの影響を受ける可能性があります。こうした攻撃により、AIエージェントが機密情報や認証情報を漏洩したり、不正なアクションを実行したりする可能性があります。
データ漏洩: AIエージェントは通常、SaaSプラットフォームや内部データベースに接続するため、設定を誤ると、個人識別情報 (PII) や機密性の高い財務記録が流出する可能性があります。
権限な過剰を持つ連携: ワークフローを自動化するために、AIエージェントは複数のサービスやアプリケーションと連携することがよくあります。こうした連携に広範なアクセス権限が付与されると、侵害された、または設定ミスのあるAIエージェントによって、組織の攻撃対象領域が大幅に拡大する可能性があります。
ツールやAPIの悪用とアクションの整合性: AIエージェントは、侵害されていなくても、状況を誤って理解したり、曖昧な指示を受けたりすると、データの削除、誤った宛先へのメール送信、設定変更など、一見正しく見えても誤った操作を実行する可能性があります。
サプライチェーンおよび依存関係のリスク: AIエージェントは、多くの場合、サードパーティ製のモデル、プラグイン、コネクタ、ツールサーバーに依存しています。これらの依存先に脆弱性や悪意のある更新が含まれていると、新たな攻撃経路が生まれる可能性があります。