こんにちは。AIテックメディア編集部です。
先日、Anthropic社のClaude 3.5 SonnetがPC操作を代行する「Computer Use」を発表し、界隈を騒然とさせましたが、Googleも黙ってはいません。現在、GoogleがChromeブラウザ内でのタスク実行を自動化するAIエージェント、コードネーム「Jarvis(ジャービス)」を開発中であると報じられました。
これは単なる「便利な拡張機能」ではありません。Webブラウザという、私たちが業務時間の最も多くを費やすプラットフォームそのものが、AIの手足となることを意味します。
本記事では、この「Jarvis」がエンジニアやビジネスパーソンの業務をどう変えるのか、実利的な視点から分析し、来るべき「爆速自動化時代」への備えを解説します。
Google「Jarvis」の正体:ChromeがAIの実行環境になる
報道によれば、JarvisはGoogleの次世代LLM「Gemini」の将来バージョンを搭載し、Chromeブラウザ上で以下のようなタスクを自律的に実行するとされています。
- リサーチ業務:複数のWebページを巡回し、特定の情報を収集・要約する。
- ショッピング:特定の商品を検索し、価格比較を行い、購入プロセスを進める。
- 予約・手配:航空券の検索やホテルの予約などを完了させる。
これまでのAIチャットボットが「テキストを生成して人間に行動を促す」ものだったのに対し、Jarvisは「Web上の行動そのものを代行する」点に革新性があります。スクリーンショットを頻繁に取得・解析し、ボタンの位置や入力フォームを認識して操作を行う仕組みです。
【徹底比較】Claude 3.5 “Computer Use” vs Google “Jarvis”
現在、ブラウザ操作やPC操作を行うAIエージェントとして、AnthropicのClaude 3.5 Sonnet(Computer Use)が先行していますが、GoogleのJarvisはどう異なるのでしょうか。現時点での情報をもとに比較分析しました。
| 特徴 | Anthropic (Computer Use) | Google (Jarvis) ※想定 |
|---|---|---|
| 操作範囲 | PC画面全体(OSレベル) | Chromeブラウザ内に特化 |
| 処理速度 | スクリーンショット転送のためやや遅延あり | ブラウザネイティブ統合による爆速化が期待される |
| 強み | アプリ間連携(Excelとブラウザを行き来など) | Webタスクの精度、Googleアカウント連携 |
| 主な用途 | 汎用的なデスクトップ作業自動化 | SaaS操作、Webリサーチ、ECなどWeb完結型業務 |
独自の分析:Googleの勝算は「DOMへの直接アクセス」か?
ClaudeのComputer Useは視覚情報(スクリーンショット)に頼っていますが、JarvisがChromeに組み込まれるのであれば、HTMLの構造(DOM)やネットワークリクエストに直接アクセスできる可能性があります。これにより、視覚的な誤認識を防ぎ、より堅牢で高速な自動化が可能になるでしょう。
実務直結!Jarvisで実現する「爆速」業務自動化シナリオ
では、具体的に私たちの業務はどう変わるのでしょうか。エンジニアリング工数を削減し、実益を生むシナリオを想定します。
1. 競合製品リサーチの完全自動化
これまではPythonのSeleniumやPuppeteerでスクレイピングコードを書く必要がありましたが、Jarvisには自然言語で指示を出すだけになるでしょう。
【想定プロンプト例】
以下の競合3社のサイトを巡回し、最新の「AIエージェント関連サービス」の価格表を探して。 結果をスプレッドシートにまとめて、CSVでダウンロードしておいて。 1. Company A 2. Company B 3. Company C
2. SaaS管理画面の定型作業オートメーション
APIが提供されていないレガシーな管理画面や、複雑なSaaSの操作も自動化対象です。毎朝のレポート抽出や、特定条件のアラート確認などをブラウザ上で完結させます。
3. エンジニアリング工数の削減:E2Eテストの変革
Webアプリの開発現場において、Playwrightなどを用いたE2E(End-to-End)テストの実装コストは馬鹿になりません。「ログインして、カートに入れて、決済する」というテストシナリオを、Jarvisが代行する未来が近いです。
日本市場へのインパクト:脱・単純作業の切り札
日本企業は、Webベースの受発注システムや勤怠管理システムなど、「ブラウザで行う事務作業」が非常に多い市場です。RPA(Robotic Process Automation)が日本で普及したように、Jarvisのようなブラウザ特化型エージェントは、導入ハードルの低い「AI版RPA」として爆発的に普及するポテンシャルがあります。
- 中小企業: 高価なRPAツールなしで、Chromeだけで経理・総務の自動化が可能に。
- EC事業者: 競合価格調査や在庫管理の自動化が個人レベルで実現。
まとめ:今から準備すべきこと
GoogleのJarvisは、早ければ2024年12月にもプレビュー公開されると噂されています。私たちが今準備すべきは、「業務プロセスの言語化」です。
AIエージェントに指示を出すためには、業務の手順が明確でなければなりません。「なんとなくやっているブラウザ作業」をリストアップし、いつでもAIに委譲できる体制を整えておくことが、リリース直後から「爆速」で成果を出す鍵となります。
続報が入り次第、具体的な使用感やプロンプトテクニックについても本メディアで深掘りしていきます。
よくある質問 (FAQ)
- Q1. Jarvisはいつから使えますか?
- 現時点では公式発表前ですが、報道によると2024年12月頃に一部のテスター向けに公開される可能性があります。
- Q2. セキュリティの懸念はありませんか?
- ブラウザ操作をAIに委ねるため、決済情報やログイン情報の取り扱いには注意が必要です。Googleがどのようなセキュリティサンドボックスを提供するかが注目点です。
- Q3. 既存のRPAツールは不要になりますか?
- 完全に不要にはなりませんが、Webブラウザで完結する単純作業については、JarvisのようなAIエージェントに置き換わる可能性が高いです。一方で、複雑なオンプレミスアプリとの連携などには引き続きRPAが有効でしょう。


コメント