アンソロピック(Anthropic)は23日、最新のAIモデル「Claude 3.5 Sonnet」で革新的な機能「Computer Use(コンピューター使用)」を発表した。この機能により、AIが人間のようにマウスやキーボードを操作し、複数のアプリケーションを横断して作業を実行することが可能になる。
画期的な新機能の詳細
新機能「Computer Use」は、以下の特徴を持つ。
- 画面の内容を理解し、状況に応じて適切な操作を選択
- マウス操作、キーボード入力、複数アプリケーションの切り替えが可能
- 特定のソフトウェアに限定されない汎用的な操作能力
アンソロピックの最高科学責任者であるジャレド・カプラン氏は、「複雑なタスクをこなすためにマウスをどこに移動させ、どこをクリックし、何をタイプするかを指示できる」と説明する。
実証された活用例
アンソロピックは、新機能の実用性を示す3つのデモンストレーションを公開している。
- 観光プランニング
- サンフランシスコでのサンライズハイキング計画を自動作成
- 最適な場所の検索、距離確認、日の出時刻の調査を実行
- カレンダーへの予定自動入力まで完了
- ウェブ開発
- 1990年代風の個人サイトの作成・編集
- コード生成、VS Codeでの編集、エラー対応を自動実行
- 業務自動化
- 取引先申請フォームの処理を自動化
- スプレッドシートとCRMシステム間でのデータ収集と入力
性能向上と新モデルの導入
今回のアップデートでは、以下の改善も実現。
- Claude 3.5 Sonnetのコーディング性能が大幅向上(SWE-benchで49.0%のスコアを達成)
- 新モデル「Claude 3.5 Haiku」の導入(前世代のOpusと同等の性能を維持しながら、処理速度を改善)
安全性への配慮
アンソロピックは、新機能の提供にあたり、以下の安全対策を実施。
- APIを通じた限定的なパブリックベータとしての提供
- スパムや詐欺、選挙関連の悪用を防ぐセーフガード機能の実装
- 機密性の高いウェブサイトとの対話を防ぐ分類器の開発
今後の展望
インスタグラムの共同設立者で、アンソロピックの最高製品責任者として今春入社したマイク・クリーガー氏は、「ビジネス顧客からのフィードバックを求めながら、航空券の自動予約など、一般ユーザー向けの提供方法も検討している」と述べている。
新機能は現在ベータ版として開発者向けに提供されており、今後数カ月でさらなる改善が期待される。