パナソニックが画像生成AIの新たな進化を実現しました。同社のR&Dカンパニーオブアメリカ(PRDCA)とパナソニックHDは、カリフォルニア大学の研究者と共同で、革新的な画像生成AI「Diffusion-KTO(Knowledge Transfer Optimization)」を開発したことを発表しました。
「いいね」だけで個人の好みを学習
従来の画像生成AIでは、望む画像を得るために複雑なプロンプトエンジニアリングが必要でした。また、ユーザーの好みに合わせた調整には、大量のデータ収集や複雑な強化学習モデルが必要とされていました。
Diffusion-KTOは、この課題を画期的な方法で解決します。ユーザーが画像に対して行う「いいね」や「嫌い」という単純な評価を基に、個人の好みを数値化したユーティリティ関数を構築します。この機能は、人間の意思決定プロセスを説明する「プロスペクト理論」に基づいており、より直感的で効率的な学習を実現しています。
優れた性能を実証
評価実験では、Diffusion-KTOは従来のベースモデル(SD v1-5)と比較して、最大87.2%という高い勝率を達成しました。特筆すべきは、人間の評価者による主観評価においても、Diffusion-KTOが生成した画像が一貫して高い評価を得たことです。
今後の展望
この技術革新は、画像生成AIの分野に留まらない可能性を秘めています。テキストや音声生成など、他の生成モデルへの応用も期待されており、様々なデジタルコンテンツのパーソナライズ化に革新をもたらす可能性があります。
特に以下の分野での活用が期待されています。
- コンテンツ制作の効率化
- パーソナライズされた製品デザイン
- デジタルアートの創作支援
- ユーザーインターフェースのカスタマイズ
パナソニックのこの取り組みは、AIとユーザー体験の未来に新たな可能性を示すものと言えるでしょう。シンプルな「いいね」という操作だけで、個人の好みを学習し最適化できる本技術は、AIの民主化と個人化の両立という課題に対する、革新的な解決策となることが期待されます。