Appleが文章入力による画像編集が可能な新AIモデル「MGIE」を開発し、オープンソースで公開しました。
このAIニュースのポイント:
- アップルは文章で画像を編集できるAIモデル「MGIE」を開発し、オープンソースとして公開しました。
- 「MGIE」はマルチモーダル大規模言語モデル(MLLM)を使用し、あいまいな文章から具体的な画像編集指示を生成します。
- 「MGIE」は、GitHubで公開されているほか、Hugging Faceでデモを試すことも可能です。
アップルの研究チームがカリフォルニア大学サンタバーバラ校と共同で開発したMGIEは、文章を解析し、それに基づいて画像を編集する技術です。ユーザーが提供する簡潔であいまいなテキストから、具体的な画像編集命令を生成する能力を持ちます。
具体的な能力は?
例えば「もっとヘルシーに見えるように」というユーザーの要望を具体的な編集作業、「野菜のトッピングを追加する」に変換することができます。
さらに、この技術はPhotoshopで行われるようなトリミングやサイズ変更、色調整などの基本的な編集作業もこなします。また人物の髪型や服装、背景の変更など、細かい部分の編集にも対応しています。
しかし現時点では、この技術がアップルの製品に組み込まれるかは不明です。
どこで使える?
「MGIE」はオープンソースとして公開されており、誰もがアクセスし、使用することができます。
GitHubで公開されているほか、Hugging Faceでデモを試すことも可能です。