2024年2月23日、画像生成AI・Stable Diffusionから、『Stable Diffusion 3』の先行プレビューが発表されました。
現在(2024年3月時点)は一般公開されていませんが、今回は『Stable Diffusion 3』の気になる概要などについてご紹介していきます!
Stable Diffusion 3とは?
先ほども少しご紹介しましたが、2024年2月23日、大人気画像生成AIツール・Stable Diffusionから、『Stable Diffusion 3』の先行プレビューが発表されました。
『Stable Diffusion 3』は、従来のモデルに比べて画像生成の能力が飛躍的に進化し、複数のテーマに対応できるようになり、画質の向上やスペルチェック能力が大きく改善された、高い性能を誇るモデルとなっています。
2024年3月現在では一般公開されていませんが、プレビュー段階としてさまざまな事前情報を公開してくれています!
Stable Diffusion 3で利用されている技術
Stable Diffusion 3では、以下の2つの技術が利用されているようです。
- 拡散トランスフォーマー・アーキテクチャ
- フロー・マッチング
①拡散トランスフォーマー・アーキテクチャ
Stable Diffusion 3は、先進的な拡散トランスフォーマーアーキテクチャを採用し、Open AIのSoraに類似したフローマッチング技術と組み合わせて、高品質な画像を生成しています。
この新しいモデルは、従来のU-Net畳み込みニューラルネットワークをトランスフォーマーで置き換えることで、画像のノイズ除去プロセスを効果的に改善し、画像の潜在表現にノイズを加えて徐々に取り除くことで、新しい画像を生成します。この技術により、画像生成の効率と品質が大幅に向上しています。
下記画像は、拡散トランスフォーマーによる高画質化の効果を示したものです。
この技術の詳細に関しては、こちらをご覧ください。
②フロー・マッチング
Stable Diffusion 3は、フロー・マッチングという技術を活用しています。これは、AIがランダムノイズから整理された画像へとスムーズに変換する方法を学習する手法で、連続正規化フロー(CNF)を使って効率的に学習することが可能です。フロー・マッチングにより、生成する画像の精度と品質を向上させることができます。
この技術に関心のある方は、関連するこちらの論文を参照すると良いでしょう。
Stable Diffusion 3の特筆すべき点3選!
Stable Diffusion 3の大きな特徴として、以下の3つが挙げられるでしょう。
- Multimodal Diffusion Transformer(MMDiT)アーキテクチャの導入:言語と画像の両方の理解が大幅に改善。
- 最大8Bパラメータを搭載したモデル:1024×1024での高解像度画像を約30秒で生成できる。
- Rectified Flow技術の採用:より少ないステップでのサンプリングが可能に。
これらの技術革新から、Stable Diffusion 3への期待が高まっています。
Stable Diffusion 3のウェイティングリストの登録方法
Stable Diffusion 3を利用するためには、事前にウェイティングリストに登録しておくとよいでしょう。
ここからは、その登録方法についてご紹介します。
①こちらのページにアクセスします。
②下記画像を参考に、必要事項を記入してください。
③完了したら、「Submit」をクリックします。
以上で完了です!
- Stable Diffusionのプロンプトの見本が知りたい
- 画像生成が思ったようにできない
- 色々なプロンプトを探したい
まとめ
いかがでしたでしょうか?
Stable Diffusionの最新モデル『Stable Diffusion 3』についてご紹介してきました。
今回のポイントをまとめると、以下のようになります。
- 2024年2月23日、画像生成AI・Stable Diffusionから、『Stable Diffusion 3』の先行プレビューが発表
- 現在(2024年3月時点)は一般公開されていない
- Stable Diffusion 3で利用されている技術
- 拡散トランスフォーマー・アーキテクチャ
- フロー・マッチング
- Stable Diffusion 3の特筆すべき点3選
- Multimodal Diffusion Transformer(MMDiT)アーキテクチャの導入
- 最大8Bパラメータを搭載したモデル
- Rectified Flow技術の採用
- Stable Diffusion 3を利用するためには、事前にウェイティングリストに登録しておくのがオススメ!
これから一般公開されるのがとても楽しみですね!オープンソースで公開されましたら、引き続き情報を更新していきます。
- Stable Diffusionのプロンプトの見本が知りたい
- 画像生成が思ったようにできない
- 色々なプロンプトを探したい