Stable Diffusionの最新モデル『Stable Diffusion 3』が登場！気になる概要・特徴について解説！

2024年2月23日、画像生成AI・Stable Diffusionから、『Stable Diffusion 3』の先行プレビューが発表されました。

現在(2024年3月時点)は一般公開されていませんが、今回は『Stable Diffusion 3』の気になる概要などについてご紹介していきます！

Stable Diffusion 3とは？
- Stable Diffusion 3で利用されている技術
  - ①拡散トランスフォーマー・アーキテクチャ
  - ②フロー・マッチング
- Stable Diffusion 3の特筆すべき点3選！
Stable Diffusion 3のウェイティングリストの登録方法
まとめ

Stable Diffusion 3とは？

先ほども少しご紹介しましたが、2024年2月23日、大人気画像生成AIツール・Stable Diffusionから、『Stable Diffusion 3』の先行プレビューが発表されました。

『Stable Diffusion 3』は、従来のモデルに比べて画像生成の能力が飛躍的に進化し、複数のテーマに対応できるようになり、画質の向上やスペルチェック能力が大きく改善された、高い性能を誇るモデルとなっています。

2024年3月現在では一般公開されていませんが、プレビュー段階としてさまざまな事前情報を公開してくれています！

Stable Diffusion 3で利用されている技術

Stable Diffusion 3では、以下の2つの技術が利用されているようです。

拡散トランスフォーマー・アーキテクチャ
フロー・マッチング

①拡散トランスフォーマー・アーキテクチャ

Stable Diffusion 3は、先進的な拡散トランスフォーマーアーキテクチャを採用し、Open AIのSoraに類似したフローマッチング技術と組み合わせて、高品質な画像を生成しています。

この新しいモデルは、従来のU-Net畳み込みニューラルネットワークをトランスフォーマーで置き換えることで、画像のノイズ除去プロセスを効果的に改善し、画像の潜在表現にノイズを加えて徐々に取り除くことで、新しい画像を生成します。この技術により、画像生成の効率と品質が大幅に向上しています。

下記画像は、拡散トランスフォーマーによる高画質化の効果を示したものです。

この技術の詳細に関しては、こちらをご覧ください。

②フロー・マッチング

Stable Diffusion 3は、フロー・マッチングという技術を活用しています。これは、AIがランダムノイズから整理された画像へとスムーズに変換する方法を学習する手法で、連続正規化フロー（CNF）を使って効率的に学習することが可能です。フロー・マッチングにより、生成する画像の精度と品質を向上させることができます。

この技術に関心のある方は、関連するこちらの論文を参照すると良いでしょう。

Stable Diffusion 3の特筆すべき点3選！

Stable Diffusion 3の大きな特徴として、以下の3つが挙げられるでしょう。

Multimodal Diffusion Transformer(MMDiT)アーキテクチャの導入：言語と画像の両方の理解が大幅に改善。
最大8Bパラメータを搭載したモデル：1024×1024での高解像度画像を約30秒で生成できる。
Rectified Flow技術の採用：より少ないステップでのサンプリングが可能に。

これらの技術革新から、Stable Diffusion 3への期待が高まっています。

上記に示した技術「拡散トランスフォーマー・アーキテクチャ」と「フロー・マッチング」や、3つの特筆している点を組み合わせると、DALL-E 3とほぼ同じクオリティで再現できるようです。

Stable Diffusion 3のウェイティングリストの登録方法

Stable Diffusion 3を利用するためには、事前にウェイティングリストに登録しておくとよいでしょう。

ここからは、その登録方法についてご紹介します。

①こちらのページにアクセスします。

②下記画像を参考に、必要事項を記入してください。

③完了したら、「Submit」をクリックします。

以上で完了です！

まとめ

いかがでしたでしょうか？

Stable Diffusionの最新モデル『Stable Diffusion 3』についてご紹介してきました。

今回のポイントをまとめると、以下のようになります。

2024年2月23日、画像生成AI・Stable Diffusionから、『Stable Diffusion 3』の先行プレビューが発表
現在(2024年3月時点)は一般公開されていない
Stable Diffusion 3で利用されている技術
- 拡散トランスフォーマー・アーキテクチャ
- フロー・マッチング
Stable Diffusion 3の特筆すべき点3選
- Multimodal Diffusion Transformer(MMDiT)アーキテクチャの導入
- 最大8Bパラメータを搭載したモデル
- Rectified Flow技術の採用
Stable Diffusion 3を利用するためには、事前にウェイティングリストに登録しておくのがオススメ！