Anthropic、画期的なAI操作機能を発表:コンピューター操作の自動化が現実に | romptn Magazine

Anthropic、画期的なAI操作機能を発表:コンピューター操作の自動化が現実に

AIニュース

アンソロピック(Anthropic)は23日、最新のAIモデル「Claude 3.5 Sonnet」で革新的な機能「Computer Use(コンピューター使用)」を発表した。この機能により、AIが人間のようにマウスやキーボードを操作し、複数のアプリケーションを横断して作業を実行することが可能になる。

スポンサーリンク

画期的な新機能の詳細

新機能「Computer Use」は、以下の特徴を持つ。

  • 画面の内容を理解し、状況に応じて適切な操作を選択
  • マウス操作、キーボード入力、複数アプリケーションの切り替えが可能
  • 特定のソフトウェアに限定されない汎用的な操作能力

アンソロピックの最高科学責任者であるジャレド・カプラン氏は、「複雑なタスクをこなすためにマウスをどこに移動させ、どこをクリックし、何をタイプするかを指示できる」と説明する。

実証された活用例

アンソロピックは、新機能の実用性を示す3つのデモンストレーションを公開している。

  1. 観光プランニング
    • サンフランシスコでのサンライズハイキング計画を自動作成
    • 最適な場所の検索、距離確認、日の出時刻の調査を実行
    • カレンダーへの予定自動入力まで完了
  1. ウェブ開発
    • 1990年代風の個人サイトの作成・編集
    • コード生成、VS Codeでの編集、エラー対応を自動実行
  1. 業務自動化
    • 取引先申請フォームの処理を自動化
    • スプレッドシートとCRMシステム間でのデータ収集と入力

性能向上と新モデルの導入

今回のアップデートでは、以下の改善も実現。

  • Claude 3.5 Sonnetのコーディング性能が大幅向上(SWE-benchで49.0%のスコアを達成)
  • 新モデル「Claude 3.5 Haiku」の導入(前世代のOpusと同等の性能を維持しながら、処理速度を改善)

安全性への配慮

アンソロピックは、新機能の提供にあたり、以下の安全対策を実施。

  • APIを通じた限定的なパブリックベータとしての提供
  • スパムや詐欺、選挙関連の悪用を防ぐセーフガード機能の実装
  • 機密性の高いウェブサイトとの対話を防ぐ分類器の開発

今後の展望

インスタグラムの共同設立者で、アンソロピックの最高製品責任者として今春入社したマイク・クリーガー氏は、「ビジネス顧客からのフィードバックを求めながら、航空券の自動予約など、一般ユーザー向けの提供方法も検討している」と述べている。

新機能は現在ベータ版として開発者向けに提供されており、今後数カ月でさらなる改善が期待される。