2025年、Googleはついに自社の「エージェント型AI」機能をGeminiに導入します。
これまでGoogleはエージェント型AIのプロトタイプについて語ってきましたが、今回はそれを本格的に一般公開する準備が整ったようです。
Google I/O 2025の基調講演で、Googleはこの新機能について紹介しました。GeminiがWebに自分でアクセスし、あなたの代わりにタスクを実行できるようになります。
OpenAIの「Operator」と同様に、Geminiは指示(プロンプト)を受け取り、やるべきことのチェックリストを作成、それを順番に実行してくれるんです。
Googleによると、エージェントモードは、ライブのWebブラウジングやDeep Research機能、さらにGoogleの各種アプリとのデータ統合を組み合わせて、オンライン上のさまざまなタスクをこなしてくれます。
このモデルは、ユーザーからの最小限の監視だけで、複数のステップにわたる行動を最初から最後まで完遂できるようです。
Geminiによるアクションプランニング

機能の詳細はまだ完全には明らかにされていませんが、Googleはステージ上で一例を紹介しています。
サンダー・ピチャイCEOが、Geminiに対して「予算内で室内洗濯機付きの賃貸アパートを探して」と頼むと、Geminiはタスクリストを作成しました。
その内容には、ブラウザを開く、不動産サイトにアクセスする、条件に合った物件を検索する、内覧を予約する、などの手順が含まれていました。
これが可能なのは、Googleが「MCP(モデル・コンテキスト・プロトコル)」をバックグラウンドで使っているから。
MCPとは、Anthropicが提唱した業界共通の新しいプロトコルで、Web開発者やアプリがAIツールと直接連携できるようになる仕組みのことです。
このプロトコルを使えば、不動産サイト内での検索やツアー予約などが、単にAIにブラウザ操作を任せるよりもずっと確実に行えるんです。
エージェント型の機能は、Geminiアプリのエージェントモードだけにとどまりません。
GoogleはChromeやGoogle検索にも、より簡易的なバージョンのエージェント機能を導入する予定とのこと。
AIモードを使えば、あなたがゲームのチケットを探している間、裏で検索作業を進めるといった作業が可能になります。
Geminiのエージェントモードによるリサーチ結果

Googleによれば、この「エージェントモード」は、月額250ドルの新しい「Google AI Ultraプラン」の一部として、まずアメリカで先行プレビューとして提供される予定です。
日本での提供時期については、まだ発表されていません。
Source: Google Keyword(1, 2), anthropic, PCMAG

























