Stability AIは10月22日、画像生成AI「Stable Diffusion」の最新版となる「Stable Diffusion 3.5」シリーズを発表しました。今回のアップデートでは、3種類の異なるモデルを展開し、商用利用も含めた幅広いニーズに対応します。
革新的な3モデルの特徴
新バージョンの目玉となるのは、異なる用途に最適化された3つのモデルです。
- Stable Diffusion 3.5 Large
- 80億パラメーターを搭載した最上位モデル
- 1メガピクセルの高解像度画像生成に対応
- プロンプトの忠実度で業界トップクラスの性能を実現
- Large Turbo
- Largeモデルの高速処理版
- わずか4ステップでの画像生成を実現
- 処理速度を大幅に向上しながら品質を維持
- Medium(10月29日リリース予定)
- 26億パラメーターの軽量モデル
- 一般消費者向けハードウェアでの実行に最適化
- 0.25から2メガピクセルまでの解像度に対応
画期的な機能と特徴
今回のアップデートでは、以下のような革新的な機能が追加されました。
- 多様な画風への対応:3D、写真、絵画、線画など、様々なスタイルの画像生成が可能
- インクルーシブな画像生成:詳細な指示なしでも、多様な肌の色や特徴を持つ人物画像を生成
- 高度な制御機能:ControlNetの対応も予定(Mediumモデル公開後に順次リリース)
プロンプトジェネレーターで画像生成プロンプトの参考に!
- Stable Diffusionのプロンプトの見本が知りたい
- 画像生成が思ったようにできない
- 色々なプロンプトを探したい
利用条件とライセンス
Stability AIは、クリエイターフレンドリーな利用条件を設定しています。
- 非営利目的での利用:完全無料
- 商用利用:年間収益100万ドル(約1億5000万円)未満まで無料
- 大規模商用利用:個別相談が必要
生成された画像の著作権は利用者に帰属し、複数のプラットフォーム(Hugging Face、Stability AI API、Replicate、ComfyUI、DeepInfraなど)で利用可能です。
市場への影響と今後の展望
本リリースは、画像生成AI市場に大きな影響を与えると予想されます。特に、元Stable Diffusion開発者らが手がける「FLUX.1」(120億パラメーター)との競争が注目されます。FLUX.1はテキスト生成能力や解剖学的描写の正確さで優位性を示していますが、Stable Diffusion 3.5の登場により、市場競争が一層激化すると見られています。
今後は、ControlNetなどの追加機能のリリースや、各プラットフォームでの対応拡大が予定されており、クリエイティブツールとしての活用がさらに広がることが期待されます。
プロンプトジェネレーターで画像生成プロンプトの参考に!
- Stable Diffusionのプロンプトの見本が知りたい
- 画像生成が思ったようにできない
- 色々なプロンプトを探したい