Appleがオープンソースの画像生成/編集AIツールを発表 | romptn Magazine

Appleがオープンソースの画像生成/編集AIツールを発表

AIニュース

Appleが文章入力による画像編集が可能な新AIモデル「MGIE」を開発し、オープンソースで公開しました。

このAIニュースのポイント:

  1. アップルは文章で画像を編集できるAIモデル「MGIE」を開発し、オープンソースとして公開しました。
  2. 「MGIE」はマルチモーダル大規模言語モデル(MLLM)を使用し、あいまいな文章から具体的な画像編集指示を生成します。
  3. 「MGIE」は、GitHubで公開されているほか、Hugging Faceでデモを試すことも可能です。

アップルの研究チームがカリフォルニア大学サンタバーバラ校と共同で開発したMGIEは、文章を解析し、それに基づいて画像を編集する技術です。ユーザーが提供する簡潔であいまいなテキストから、具体的な画像編集命令を生成する能力を持ちます。

具体的な能力は?

例えば「もっとヘルシーに見えるように」というユーザーの要望を具体的な編集作業、「野菜のトッピングを追加する」に変換することができます。

さらに、この技術はPhotoshopで行われるようなトリミングやサイズ変更、色調整などの基本的な編集作業もこなします。また人物の髪型や服装、背景の変更など、細かい部分の編集にも対応しています。

しかし現時点では、この技術がアップルの製品に組み込まれるかは不明です。

どこで使える?

「MGIE」はオープンソースとして公開されており、誰もがアクセスし、使用することができます。

GitHubで公開されているほか、Hugging Faceでデモを試すことも可能です。

出典: カリフォルニア大学サンタバーバラ校論文