画像からプロンプトを生成する方法を徹底解説!誰でも簡単に使える3ツールを紹介

FV AIツール・活用

画像生成AIを使っていると「この素敵な画像はどんなプロンプト(呪文)で作られたんだろう?」と思うことはありませんか?実は、既存の画像からプロンプトを解析する方法はいくつか存在します。

この記事では、初心者の方でも無料で簡単に画像からプロンプトを生成・抽出できる方法を詳しく解説します。

参考にしたい画像があるけどプロンプトが分からない、自分では考えつかないような表現を知りたい、以前作った画像のプロンプトを忘れてしまった…そんなときに役立つ「画像からプロンプト生成」のテクニックを身につけましょう!

今回の記事で分かること
  • 画像からプロンプトを生成する3つの方法
  • それぞれのツールの特徴や用途の比較
  • 実際に生成されるプロンプトイメージ

📖この記事のポイント

  • Stable Diffusion Web UIなら、ボタン一つでプロンプトを分析・生成できる機能がある
  • ChatGPTに画像をアップして「プロンプトを教えて」と頼むだけでも、高精度な文章を作ってくれる
  • アニメ系イラストなら「DeepBooru」、リアルな写真なら「CLIP」や「ChatGPT」などサイトの活用もあり
  • 今回紹介したコツはほんの一部。周りと差がつく「AI活用術」を身につけよう!
  • SHIFT AIの無料セミナーならAIのプロから無料で収入に直結するAIスキル習得から仕事獲得法まで学べる!
  • 今すぐ申し込めば、超有料級の12大特典も無料でもらえる!

\ 累計受講者10万人突破 /

無料AIセミナーを見てみる
監修者プロフィール
森下浩志
日本最大級のAI情報プラットフォーム「romptn ai」編集長。著書に「0からはじめるStable Diffusion」「0からはじめるStable Diffusion モデル・拡張機能集編」など、AmazonベストセラーのAI関連書籍を多数執筆。AIにおける情報の非対称性を解消するための社内研修や出張講義も行う。

画像からプロンプトを生成する3つの方法

画像からプロンプトを生成する方法は主に以下の3つがあります。

  1. Stable Diffusion Web UIの機能を使う方法
  2. ChatGPTなどのAIを使う方法
  3. 専用のWebサイトを利用する方法

ツールにはそれぞれの特徴があり、生成されるプロンプトの形式や精度が異なります。目的に合わせてご自身に合うものを見つけてくださいね。

1.Stable Diffusionで画像からプロンプトを生成する方法

Stable Diffusion Web UI (AUTOMATIC1111)には、画像からプロンプトを抽出できる機能が標準で搭載されています。主に以下の3つの機能があり、使い分けることで効果的にプロンプトを抽出できます。

  • Interrogate CLIP
  • Interrogate DeepBooru
  • Tagger(拡張機能)

Interrogate CLIPの特徴と使い方

Interrogate CLIPは、単語ではなく文章形式でプロンプトを抽出する機能。特徴は、以下の通りです。

  • 抽出されるプロンプトは文章形式
  • 幅広い画像タイプに対応
  • 拡張機能のインストールが不要(標準機能)

◼️Interrogate CLIPの使い方

1.Stable Diffusion Web UIを起動して、「img2img」タブをクリックします
2.解析したい画像をアップロードします

3.呪文(プロンプト)入力欄の右にある「Interrogate CLIP」をクリックします
4.解析が終了するまで少し待つと呪文(プロンプト)入力欄に、推測した呪文(プロンプト)が表示されます

Interrogate DeepBooruの特徴と使い方

Interrogate DeepBooruは、アニメやイラスト系の画像に特化したプロンプト抽出機能。特徴は、以下の通りです。

  • 抽出されるプロンプトはカンマ区切りのタグ形式
  • アニメ・イラスト系の画像に特化
  • 拡張機能のインストールが不要(標準機能)

◼️Interrogate DeepBooruの使い方

1と2は、先ほどご紹介した「Interrogate CLIP」とまったく同じです。3の工程で「Interrogate CLIP」の下にあるInterrogate DeepBooruをクリックしましょう。

Tagger拡張機能の導入と使い方

Taggerは、インストールをすることでより詳細なタグを抽出できる拡張機能。特徴は、以下の通りです。

  • 抽出されるプロンプトはカンマ区切りのタグ形式
  • より詳細なタグを抽出可能
  • 拡張機能のインストールが必要

※インストール方法はこちらの記事で詳しく解説しています。

◼️Tagger拡張機能の使い方

1.インストール後に追加された「Tagger」タブを開きます

2.解析したい画像をアップロードし、「Interrogate image」ボタンをクリックします

3.「Ratings and included tags」に抽出されたプロンプトが表示されます

Fooocusの「Describe」機能を使う方法

Stable Diffusionのフロントエンドとして人気のFooocusにも、画像からプロンプトを生成する「Describe」機能があります。

  • 使い方がシンプル
  • 写真とアニメ/アート用の2種類のモードあり
  • Stable Diffusion Web UIのインストールが不要

◼️Fooocusの使い方

1.Fooocusを起動して「Input Image」にチェックを入れる

2.「Describe」タブを選択

3.左側のスペースに画像をドラッグ&ドロップ

4.画像の種類に応じて「Photograph」か「Art / Anime」を選択

5.「Describe this image into Prompt」ボタンをクリック

6.生成されたプロンプトが表示される

2.ChatGPTなどのLLMを使って画像からプロンプトを生成する方法

最新のAIチャットツールでも画像からプロンプトを抽出できます。特徴は、以下の通りです。

  • 画像の内容を詳細に理解
  • 詳細で自然な文章形式のプロンプトを生成
  • 特別なソフトウェアのインストールが不要

特にChatGPTやGeminiなどの視覚言語モデル(VLM)がおすすめ。ここでは、ChatGPTを使った方法をご紹介します。

◼️ChatGPTで画像からプロンプトを生成する方法

1.ChatGPTにアクセス(GPT-4モデルが必要)します

※ChatGPTの登録方法については、下記記事で詳しく解説しています。

2.画像をアップロード(入力欄の「+」ボタンかドラッグ&ドロップ)し、以下のようなプロンプトを入力します

画像生成AIで利用するプロンプトを200語程度で書いてください。英語訳もつけてください。

3.ChatGPTが画像を分析し、かなり詳細なプロンプトを生成してくれます

3.専用のサイトを利用して画像からプロンプトを生成する方法

画像からプロンプトを生成する専用のサイトも多数存在します。インストール不要で手軽に利用できるのが魅力です。また、これらのサービスは無料版と有料版があり、無料版は1日の使用回数に制限がある場合が多くなっています。

画像からプロンプトを生成する代表的なサービス4選

ここでは無料版が使える4つのサービスをご紹介します。

Image Prompt Generator

サイトにアクセス後、「Choose Image」で解析したい画像をアップロードし、「Generate Prompt」をクリックするだけ。シンプルな英語プロンプトが自動生成され、画像の主要な要素や構図を文章形式で出力します。

SeaArt

アカウント登録後、「創作」メニューから「画像キーワード摘出」を選択。画像をアップロードして「生成開始」を押すと、詳細版と簡易版の2パターンでタグ形式のプロンプトが抽出されます。日本語対応で初心者にも使いやすいのが特徴です。

PixAI

アカウント作成後、「Tools」の「Image to Prompt」機能を使用。画像をドラッグ&ドロップするだけで、ニメやイラストに特化した詳細なDanbooruタグ形式のプロンプトが生成されます。二次元キャラクターの特徴を細かく抽出できます。

Leonardo AI

アカウント登録後、「AI Canvas」または画像生成画面で「Prompt Magic」機能を利用。アップロードした画像から高精度なプロンプトを解析し、商用利用も可能な品質の高い結果を提供します。複数のAIモデルから選択可能です。

◼️Image Prompt Generatorの使い方

1.トップ画面の「Upload Image」に画像をアップロードします

2.「Generate Prompt」をクリックするだけですぐにプロンプトを生成してくれます!

※その他のサービスの使い方については下記記事で詳しく解説していますので、気になる方は下記をご確認ください。

画像からプロンプトを生成する方法の比較

ここまで解説してきた方法を一覧にまとめます。

方法特徴おすすめの用途
Interrogate CLIP文章形式のプロンプト生成、幅広い画像に対応一般的な写真や画像から概要を把握したい場合
Interrogate
DeepBooru
カンマ区切りのタグ形式、アニメ・イラスト特化アニメやイラスト系の画像から細かい要素を抽出したい場合
Tagger詳細なタグ形式、細かい要素も抽出より多くのタグで詳細に再現したい場合
Fooocus Describeシンプルな操作、写真/アートで使い分け手軽に試したい初心者向け
ChatGPT詳細な文章形式、自然な表現画像の雰囲気や背景なども含めたい場合
専用Webサービスインストール不要、手軽に利用可能PC環境に制約がある場合や試用したい場合

アニメ調の画像の場合は「Interrogate DeepBooru」や「Tagger」写真やリアル調の画像には「Interrogate CLIP」や「ChatGPT」が適しています。複数の方法で抽出したプロンプトを組み合わせるのも効果的です!

今すぐ無料参加!AI活用の最前線を学べる限定セミナー

AIの波に乗り遅れていませんか?多くの企業がAI導入で業績を伸ばす中、何も行動しなければ確実に取り残されます。

  • 実践的なAI活用法が学べる
  • 業界のプロから直接指導
  • 参加者限定の特別12大特典プレゼント
  • 完全無料・オンライン開催

▼今すぐ無料参加する▼

※席数限定のため、お早めにお申し込みください

実際に画像からプロンプトを生成してみた

最後に、実際の画像を使って各ツールでどのようなプロンプトが生成されるか見てみましょう。

風景写真の場合

風景写真をInterrogate CLIPで解析した場合

a landscape photograph of a mountain range with a lake in the foreground and clouds in the sky, landscape photography, national geographic, a landscape vista, Tomasz Alen Kopera, photorealism

同じ画像をChatGPTで解析した場合

A serene mountain landscape with a crystal-clear alpine lake in the foreground, surrounded by towering snow-capped peaks reflected in the water. The scene is bathed in golden afternoon light with dramatic clouds floating above the mountains. The composition features lush green pine trees bordering the lake shore, creating a perfect frame for this tranquil wilderness scene.

アニメイラストの場合

アニメイラストをInterrogate DeepBooruで解析した場合

1girl, solo, long hair, breasts, looking at viewer, blush, smile, bangs, black hair, red eyes, long sleeves, animal ears, medium breasts, upper body, flower, sidelocks, outdoors, parted lips, japanese clothes, day, wide sleeves, kimono, tree, animal ear fluff, sash, fox ears, obi, floral print, extra ears, white kimono, stairs

同じ画像をTaggerで解析した場合

1girl, solo, fox ears, animal ears, fox girl, smile, red eyes, long hair, black hair, white kimono, japanese clothes, traditional clothes, outdoors, cherry blossoms, spring, blush, fox tail, animal tail

まとめ

いかがでしたでしょうか?

画像からプロンプトを生成・抽出する方法について、Stable Diffusion Web UIの機能や、ChatGPT、専用Webサービスまで幅広くご紹介しました。

この記事で紹介したことをまとめると次のようになります。

  • Stable Diffusion Web UIでは「Interrogate CLIP」「Interrogate DeepBooru」「Tagger拡張機能」の3つの方法がある
  • Fooocusの「Describe」機能を使えば簡単に画像からプロンプトを生成できる
  • ChatGPTなどの視覚言語モデル(VLM)も画像からプロンプト生成に活用できる
  • アニメ系の画像はDeepBooruやTagger、風景写真はCLIPやChatGPTなど、目的に応じて使い分けるのがコツ
  • 抽出したプロンプトはそのまま使うだけでなく、編集・改良して自分好みの画像生成に活用できる

気に入った画像のプロンプトを知りたい方や、プロンプトの書き方を学びたい初心者の方にとって、かなり助けになる情報だったのではないでしょうか?

ぜひ、これらのツールを使いこなして、画像生成AIの可能性をさらに広げてみてください!

romptn aiが提携する「SHIFT AI」では、AIの勉強法に不安を感じている方に向けて無料オンラインセミナーを開催しています。

AIを使った副業の始め方や、収入を得るまでのロードマップについて解説しているほか、受講者の方には、ここでしか手に入らないおすすめのプロンプト集などの特典もプレゼント中です。

AIについて効率的に学ぶ方法や、業務での活用に関心がある方は、ぜひご参加ください。

\累計受講者10万人突破/