Stable Diffusionの最新モデル『Stable Diffusion 3』が登場!気になる概要・特徴について解説!

Stable Diffusion

2024年2月23日、画像生成AI・Stable Diffusionから、『Stable Diffusion 3』の先行プレビューが発表されました。

現在(2024年3月時点)は一般公開されていませんが、今回は『Stable Diffusion 3』の気になる概要などについてご紹介していきます!

スポンサーリンク

Stable Diffusion 3とは?

先ほども少しご紹介しましたが、2024年2月23日、大人気画像生成AIツール・Stable Diffusionから、Stable Diffusion 3の先行プレビューが発表されました。

『Stable Diffusion 3』は、従来のモデルに比べて画像生成の能力が飛躍的に進化し、複数のテーマに対応できるようになり、画質の向上やスペルチェック能力が大きく改善された、高い性能を誇るモデルとなっています。

2024年3月現在では一般公開されていませんが、プレビュー段階としてさまざまな事前情報を公開してくれています!

Stable Diffusion 3で利用されている技術

Stable Diffusion 3では、以下の2つの技術が利用されているようです。

  • 拡散トランスフォーマー・アーキテクチャ
  • フロー・マッチング

①拡散トランスフォーマー・アーキテクチャ

Stable Diffusion 3は、先進的な拡散トランスフォーマーアーキテクチャを採用し、Open AIのSoraに類似したフローマッチング技術と組み合わせて、高品質な画像を生成しています。

この新しいモデルは、従来のU-Net畳み込みニューラルネットワークをトランスフォーマーで置き換えることで、画像のノイズ除去プロセスを効果的に改善し、画像の潜在表現にノイズを加えて徐々に取り除くことで、新しい画像を生成します。この技術により、画像生成の効率と品質が大幅に向上しています。

下記画像は、拡散トランスフォーマーによる高画質化の効果を示したものです。

引用:https://www.wpeebles.com/DiT

この技術の詳細に関しては、こちらをご覧ください。

②フロー・マッチング

Stable Diffusion 3は、フロー・マッチングという技術を活用しています。これは、AIがランダムノイズから整理された画像へとスムーズに変換する方法を学習する手法で、連続正規化フロー(CNF)を使って効率的に学習することが可能です。フロー・マッチングにより、生成する画像の精度と品質を向上させることができます。

この技術に関心のある方は、関連するこちらの論文を参照すると良いでしょう。

Stable Diffusion 3の特筆すべき点3選!

Stable Diffusion 3の大きな特徴として、以下の3つが挙げられるでしょう。

  • Multimodal Diffusion Transformer(MMDiT)アーキテクチャの導入:言語と画像の両方の理解が大幅に改善。
  • 最大8Bパラメータを搭載したモデル:1024×1024での高解像度画像を約30秒で生成できる。
  • Rectified Flow技術の採用:より少ないステップでのサンプリングが可能に。

これらの技術革新から、Stable Diffusion 3への期待が高まっています。

上記に示した技術「拡散トランスフォーマー・アーキテクチャ」と「フロー・マッチング」や、3つの特筆している点を組み合わせると、DALL-E 3とほぼ同じクオリティで再現できるようです。

Stable Diffusionの画像生成を最速で学びたいあなたへ!
  • Stable Diffusionの基礎を2時間でマスター!
  • 高スペックPCがない方向けに徹底解説。
  • ControlNetなど、必須級の拡張機能も網羅。
  • 今話題のSDXL、AI動画生成も。
  • 特典として、大人気「おすすめ拡張機能・モデル解説」「プロンプト大全」つき!
\このボタン限定!70%オフキャンペーン実施中!/
70%オフキャンペーン実施中!/

Stable Diffusion 3のウェイティングリストの登録方法

Stable Diffusion 3を利用するためには、事前にウェイティングリストに登録しておくとよいでしょう。

ここからは、その登録方法についてご紹介します。

こちらのページにアクセスします。

②下記画像を参考に、必要事項を記入してください。

③完了したら、「Submit」をクリックします。

以上で完了です!

romptn Q&Aで画像生成の悩みを解決しよう!
  • Stable Diffusionのエラーが解決しない
  • 画像生成がうまくできない
  • おすすめのモデルが知りたい
など、AIに関するお悩みがあれば投稿してみてください。
詳しい人が解決してくれるかもしれません。

まとめ

いかがでしたでしょうか?

Stable Diffusionの最新モデル『Stable Diffusion 3』についてご紹介してきました。

今回のポイントをまとめると、以下のようになります。

  • 2024年2月23日、画像生成AI・Stable Diffusionから、『Stable Diffusion 3』の先行プレビューが発表
  • 現在(2024年3月時点)は一般公開されていない
  • Stable Diffusion 3で利用されている技術
    • 拡散トランスフォーマー・アーキテクチャ
    • フロー・マッチング
  • Stable Diffusion 3の特筆すべき点3選
    • Multimodal Diffusion Transformer(MMDiT)アーキテクチャの導入
    • 最大8Bパラメータを搭載したモデル
    • Rectified Flow技術の採用
  • Stable Diffusion 3を利用するためには、事前にウェイティングリストに登録しておくのがオススメ!

これから一般公開されるのがとても楽しみですね!オープンソースで公開されましたら、引き続き情報を更新していきます。

romptn Q&Aで画像生成の悩みを解決しよう!
  • Stable Diffusionのエラーが解決しない
  • 画像生成がうまくできない
  • おすすめのモデルが知りたい
など、AIに関するお悩みがあれば投稿してみてください。
詳しい人が解決してくれるかもしれません。