Stable Diffusionの最新モデル『Stable Diffusion 3』が登場!気になる概要・特徴について解説!

Stable Diffusion

2024年2月23日、画像生成AI・Stable Diffusionから、『Stable Diffusion 3』の先行プレビューが発表されました。

今回は『Stable Diffusion 3』の気になる概要などについてご紹介していきます!

内容をまとめると…

  • Stable Diffusion 3は拡散トランスフォーマーとフローマッチング技術を採用し、画質とテキスト理解が飛躍的に向上

  • 従来のU-Netを置き換えるMMDiTアーキテクチャにより、複数テーマ対応やスペルチェック能力が大幅改善

  • 最大8Bパラメータ搭載で1024×1024の高解像度画像を約30秒で生成可能

  • これらの技術を組み合わせることでDALL-E 3とほぼ同等のクオリティを実現するとされている

きれいな画像を作れるようになっただけで、収益化できずに止まってませんか?

romptn ai では、実際に画像生成AIで稼いでいるプロを講師に招いた完全無料のAIクリエイターセミナーを開催しています。

2時間のオンラインセミナーで、実際に稼いでいる人が使う最新画像生成AIツールや上級者にステップアップするための必須スキルなどの知識面はもちろんのこと、ゼロから収益化を実現するための具体的なロードマップ体験談ベースで詳しく学ぶことができます。

また、豪華な無料参加特典も用意していますので、ぜひご興味を持った方はお気軽に下記のボタンから詳細をチェックしてみてください!

\ 現役の画像生成AIのプロから学べる! /

無料セミナーの詳細をみる
監修者_SD
監修者プロフィール
沖@AI画像生成
Xで5万人のフォロワーをかかえる、画像生成クリエイター。Stable Diffusionを中心に、様々な画像生成AIや動画生成AIを駆使し、コンテンツを制作。画像生成に関連する講演会なども多数こなす。AI画像制作の仕事も募集中。

Stable Diffusion 3とは?

先ほども少しご紹介しましたが、2024年2月23日、大人気画像生成AIツール・Stable Diffusionから、Stable Diffusion 3の先行プレビューが発表されました。

『Stable Diffusion 3』は、従来のモデルに比べて画像生成の能力が飛躍的に進化し、複数のテーマに対応できるようになり、画質の向上やスペルチェック能力が大きく改善された、高い性能を誇るモデルとなっています。

Stable Diffusion 3で利用されている技術

Stable Diffusion 3では、以下の2つの技術が利用されているようです。

  • 拡散トランスフォーマー・アーキテクチャ
  • フロー・マッチング

拡散トランスフォーマー・アーキテクチャ

Stable Diffusion 3は、先進的な拡散トランスフォーマーアーキテクチャを採用し、Open AIのSoraに類似したフローマッチング技術と組み合わせて、高品質な画像を生成しています。

この新しいモデルは、従来のU-Net畳み込みニューラルネットワークをトランスフォーマーで置き換えることで、画像のノイズ除去プロセスを効果的に改善し、画像の潜在表現にノイズを加えて徐々に取り除くことで、新しい画像を生成します。この技術により、画像生成の効率と品質が大幅に向上しています。

下記画像は、拡散トランスフォーマーによる高画質化の効果を示したものです。

引用:https://www.wpeebles.com/DiT

この技術の詳細に関しては、こちらをご覧ください。

フロー・マッチング

Stable Diffusion 3は、フロー・マッチングという技術を活用しています。これは、AIがランダムノイズから整理された画像へとスムーズに変換する方法を学習する手法で、連続正規化フロー(CNF)を使って効率的に学習することが可能です。フロー・マッチングにより、生成する画像の精度と品質を向上させることができます。

この技術に関心のある方は、関連するこちらの論文を参照すると良いでしょう。

Stable Diffusion 3の特筆すべき点3選!

Stable Diffusion 3の大きな特徴として、以下の3つが挙げられるでしょう。

  • Multimodal Diffusion Transformer(MMDiT)アーキテクチャの導入:言語と画像の両方の理解が大幅に改善。
  • 最大8Bパラメータを搭載したモデル:1024×1024での高解像度画像を約30秒で生成できる。
  • Rectified Flow技術の採用:より少ないステップでのサンプリングが可能に。

これらの技術革新から、Stable Diffusion 3への期待が高まっています。

上記に示した技術「拡散トランスフォーマー・アーキテクチャ」と「フロー・マッチング」や、3つの特筆している点を組み合わせると、DALL-E 3とほぼ同じクオリティで再現できるようです。

Stable Diffusion 3のウェイティングリストの登録方法

Stable Diffusion 3を利用するためには、事前にウェイティングリストに登録しておくとよいでしょう。

ここからは、その登録方法についてご紹介します。

こちらのページにアクセスします。

②下記画像を参考に、必要事項を記入してください。

③完了したら、「Submit」をクリックします。

以上で完了です!

まとめ

いかがでしたでしょうか?

Stable Diffusionの最新モデル『Stable Diffusion 3』についてご紹介してきました。

今回のポイントをまとめると、以下のようになります。

  • 2024年2月23日、画像生成AI・Stable Diffusionから、『Stable Diffusion 3』の先行プレビューが発表
  • Stable Diffusion 3で利用されている技術
    • 拡散トランスフォーマー・アーキテクチャ
    • フロー・マッチング
  • Stable Diffusion 3の特筆すべき点3選
    • Multimodal Diffusion Transformer(MMDiT)アーキテクチャの導入
    • 最大8Bパラメータを搭載したモデル
    • Rectified Flow技術の採用
  • Stable Diffusion 3を利用するためには、事前にウェイティングリストに登録しておくのがオススメ!

これから一般公開されるのがとても楽しみですね!オープンソースで公開されましたら、引き続き情報を更新していきます。

実際に稼いでいる人の画像生成AIのスキルと収益化方法を知っていますか?

romptn ai が開催する完全無料のAIクリエイターセミナーでは、現場で活躍するプロから下記のような内容を学べます。

  • ゼロから画像生成AIで収益化を達成するための具体的なロードマップ
  • 実績のある講師が実践する初心者を脱出するための必須スキルと最新ツール
  • Nano Banana や Grokなどスマホからでもできる本格的な画像生成AI活用方法
  • 広告画像や映像など実際の制作過程をイメージするための講師によるライブデモ

2時間のオンラインセミナーで、ただ画像生成AIや動画生成AIの上級スキルや最新ツールを知るだけでなく、実際に収益化を達成する一歩を踏み出すための必須知識を学ぶことができます。

沖
講師 沖@画像生成
画像生成クリエイター Xフォロワー 5.5万人 romptn ai 監修者
  • 大手企業6社と契約実績(TOYOTA, mercari, 伊藤園 等)
  • AI映画制作3本、WORLD AI FILM FESTIVAL 2026 in KYOTO にて2冠達成
  • Best AI Anime 受賞
  • Japan Best AI Film(グランプリ)受賞(応募431作品中)
  • 経歴:元WEBデザイナー・マーケター → 2023年に生成AIと出会い転身 → プロのAIクリエイターへ
受付中 完全無料 先着限定 オンライン

本物のプロとハンズオン形式で学ぶ2026年版画像生成AI最前線セミナー

セミナー内容詳細をみる 今すぐ予約する方もこちら
画像生成AIのプロから無料で学べる! クリエイターセミナーの詳細をみる