Geminiで画像生成をやってみた!使い方や著作権について解説! | romptn Magazine

Geminiで画像生成をやってみた!使い方や著作権について解説!

Gemini

AI技術の進化は目覚ましいものがあり、特に画像生成の分野での発展もかなり進んでいます。

Googleが発表した最新型マルチモーダルAI「Gemini」は、その先鋒として注目されています。

しかし、この技術を使う際にはどのような点に注意すれば良いのでしょうか?

この記事では、Geminiの料金体系から機能、さらには著作権や商用利用の問題など気になるところまで、実際に画像生成をしてみた経験をもとにGeminiの魅力と注意点をわかりやすく解説します。

読み進めることで、Geminiでの画像生成方法や注意点がはっきり理解できるでしょう

スポンサーリンク

Googleの最新AI:Geminiとは

Googleの最新AI技術、「Gemini」はテキストだけでなく画像や音声のデータを理解・生成し、新しい創造の可能性を広げます。

早速その概要を解説していきます!

Geminiの概要

2023年12月7日、Googleは最新型マルチモーダルAI「Gemini」を発表しました。

このAIは、テキスト、画像、音声など複数のデータタイプを理解し、生成する能力を持ちます。

開発の背景には、従来のAIの機能に加え、より人間のように複雑なデータを処理できるAIが必要とされていたことがありました。

Geminiは異なるモードの情報を統合して解釈することで、よりリアルな対話や高度な情報提供を可能にします。

このマルチモーダルAIの登場により、AI技術の活用範囲が大きく拡がることが期待されています。

Geminiの料金と機能を解説!無料でどこまで使える?

Geminiは、基本的な機能を無料で提供する一方で、より高度な機能へのアクセスには有料プランの加入が必要になります。

無料プランでも、テキスト生成や簡単な画像生成などの基本的なAI機能を利用できます。

一方、Gemini Advancedという有料プランでは、拡張された画像生成能力、高度なテキスト解析、専門的なデータ処理機能など、より専門的なツールへのアクセスが可能になります。

無料プランと有料プランを比較した表がこちらになります。

GeminiGemini Advanced
生成モデルGemini ProGemini Ultra
ストレージ15GB2TB(Google Oneで使用可能)
日本語対応英語のみ
Googleアプリとの連携可能可能
価格 (月額/1ユーザー)無料2,900円

Geminiでは何ができる?

Google Geminiでは、以下の機能を実行できます。

  1. 検索・情報収集
  2. 文章の要約・翻訳
  3. プログラミングコードの生成
  4. 画像認識機能
  5. Imagen2を利用した画像生成
  6. 拡張機能でGoogleアプリと連携

1つずつ見ていきましょう。

1.検索・情報収集

Geminiを利用すると、様々な情報を迅速に検索し、必要なデータを収集することができます。

世界最大の検索エンジンであるGoogleの検索機能を有しているので、ユーザーは効率的に情報を得られます。

2.文章の要約・翻訳

Geminiでは、長い文章を簡潔に要約したり、異なる言語へ翻訳することが可能です。

135か国以上の言語で翻訳可能です。

これにより、多言語からの情報収集やアウトプットが簡単になります。

3.プログラミングコードの生成

Geminiには、他の生成AI同様にコード生成機能があり、簡単にプログラミングコードを生成できます。

この機能により、コーディングの手間が大幅に軽減され、プログラミング上の問題解決や新しいアプリケーションの開発を効率化できます。

4.画像認識機能

Geminiの画像認識機能では、写真やイラストなどの画像から情報を読み取り、それを解析することが可能です。

画像の内容を理解し、情報の抽出や要約を行えます。

これはChatGPTではまだできない機能です。また、音声ファイルに関しても情報の読み取りができるようになっています。

5.Imagen2を利用した画像生成

Geminiを使用すると、Imagen2という技術を利用して画像生成ができます。

ユーザーの指示に基づいてリアルなビジュアルを作り出し、創造性を広げることが可能になります。

画像生成に関しては、記事の後半でより詳細に説明しています。

6.拡張機能でGoogleアプリと連携

Googleが開発したGeminiならではの機能として、Googleアプリとの連携が可能になります。

もちろん他のAIでも、拡張機能などを使うことで連携が可能ですが、やはり開発元が同じである方がよりスムーズに使えます。

日常的に使用することが多いGoogleドキュメントGoogleスプレッドシートなどのアプリの効率化がはかどるでしょう。

Google Geminiの登録方法を解説!

ここからは、Google Geminiの登録方法について解説していきます。

まずは、GoogleのGemini公式ページにアクセスします。


登録」または「始める」のボタンがあるので、クリックしてください。

その後、Googleアカウントでのログイン画面が出てくるので、手順に沿ってログインしてください。

すると、以下の画面が出てきます。


これでGeminiへの登録は完了です。

Geminiで画像生成をやってみた!使い方も解説!

今回は、Geminiでの画像生成を実際に行ったので、その使い方を解説していきます。

まず、GoogleGeminiにアクセスしてください。

‎Gemini - chat to supercharge your ideas
Bard is now Gemini. Get help with writing, planning, learning, and more from Google AI.

この画面が、すでに入力画面になっています。

ですので、下記の欄にプロンプトを入力していきます。

今回は、「猫が家の中で遊んでいる画像を出力してください」と入力して、Enterを押します。

すると、日本語には対応していない旨のコメントが来ました。

ですので、Geminiに以下のプロンプトを入力します。

以下のプロンプトを英語にしてください。
#プロンプト
猫が家の中で遊んでいる画像を出力してください。

すると、下記のように出力されました。

青色の部分のプロンプトをコピー&ペーストします。

生成された以下のプロンプトを入力します。

Generate an image of a cat playing inside a house

そうすると、数十秒ほど時間がかかりますが、以下のようなかわいい画像が出力されました。

このように、かなりシンプルなプロンプトにもかかわらず、クオリティの高い画像を生成させることができました。

今回はリアルな画像を作成させましたが、アニメ風の画像も生成させてみましょう。

今回は最初から英訳させるため、以下のプロンプトを入力します。

以下のプロンプトを英訳してください
#プロンプト
ペンギンが海の中を泳いでいる様子をアニメ風にして生成してください

Tlanslationのしてにあるプロンプトをコピー&ペーストして、再度入力します。

Please Generate an animation of a penguin swimming gracefully in the ocean in an anime style

そうすると、下記のような画像が出力されました。


このように、指示次第で、好きな画像を作成することが出来ます。

使ってみた結果、それなりのスピードで画像を出力させてくれるので、非常に便利ですね。

個人的な主観になりますが、他の生成AIに比べて、出力が速く感じました。画像もそうですが、文章に関しても生成が速く印象です。

プロンプト次第で趣味の域を超えて仕事の域で使える画像生成ができるかな、と感じました。

ChatGPTやCopilotと比べても、遜色ない能力を発揮していたな、と思います。

Geminiで生成した画像の著作権について

Geminiで生成した画像の商用利用に関しては、Googleの利用規約各国の著作権法の制限を受けるため、注意が必要です。

現在の規約には書いていませんが、AIによって生成された画像の著作権に関しては今も議論されています。

特定の画像が第三者の著作権、商標権、肖像権を侵害していないか慎重に検討する必要があります。

Geminiで生成した画像の商用利用について

Geminiで生成した画像の商用利用についても、規約では明記されていません。

ただし、「規約に書いていないから商用利用OK」とはならないと思います。

こちらのサイトによると、画像によって商用利用ができる場合と、できない場合があるようで、画像ごとに判断する必要があるようです。

Gemini Pro(ジェミニプロ)で生成したAI画像を商用利用すると危険?ビジネス利用できない?
公式LINEのプロ 2024年2月からGemini ProでAI画像を生成できるようになったね! 公式LINE初心者 これすごいよね!でもまだ日本語だと、ジェミニで生成画像は作成できないよね? 公式LINEのプロ うん!いまは英語で対応しな

リスクを避けるためには、Adobe Fireflyのように、商用利用OKと明記されているものを使用した方がよいでしょう。

※Adobe Fireflyについては、以下の記事で詳しく解説しています!

Geminiで使えるプロンプトを紹介

Geminiで使えるプロンプトを効果的に設計するには、具体的かつ詳細な指示を含めることが重要です。例えば、「夕日が美しい海辺の風景」や「未来都市のスカイライン」のように、望むシーンの特徴を明確にする必要があります。

また、色彩やスタイル(例:水彩画風、リアルな写真風)を指定すると、より理想に近い画像を生成できます。

生成のコツとしては、プロンプトに創造性を加えつつも、AIが理解しやすい言葉を選ぶことが肝心です。

これらのポイントを押さえることで、Geminiを用いた画像生成の精度を高めることができます。

プロンプト例

風景描写

#日本語
夕焼け未来都市の夜景、高層ビル群とネオン街 (光と影、近未来的な雰囲気)

#英語
Output an image of a girl playing with her pet dog in a grassy field at sunset, with a diagonal composition and the light of the setting sun.

物体

#日本語
このような画像を出力して
#画像
美味しそうな料理 (リアルな描写、食欲をそそる)


#英語
Generate an image like this:

Image: A delicious-looking meal. It should be realistically rendered and mouth-watering.

抽象画

#日本語
このような画像を出力して
#画像
喜びを表現する絵 (暖色系、曲線、光)

#英語
Generate an image like this:
Image:
A painting that expresses joy. It should use warm colors, curves, and light.

今回は画像生成を中心に解説しましたが、他の作業でのプロンプトのコツは、以下の記事を参考にしてください。

Geminiで画像生成ができない時の対処法

2024年7月現在、物の画像生成で問題が発生し、一時的に人物を含む画像生成が停止されています。

プロンプトの中に人物が入る場合は、現在画像の生成ができない状態となっているのでご注意ください。

Geminiの白人画像生成できない問題、再ローンチに向けて修正開始
Google(グーグル)が先月発表したGeminiの画像AI生成機能が、白人の画像を生成しないという問題が勃発。人種差別だと非難を浴び、現在は一時的に画像生成機能を停止しています。Googleは数週間で修正して再ローンチを計画しているそうです。

また、英語以外の言語でプロンプトを入力していると、画像生成ができません

簡単ですが、このような注意点があるので、ご注意ください。

その他の問題については、Geminiのヘルプページをご参照ください。

Gemini アプリ ヘルプ

Geminiで画像生成をやってみた!のまとめ

ここまで、Geminiでの画像生成を中心に解説をしてきました。

まとめると

  • Googleの最新AI:Geminiは、最新型マルチモーダルAI「Gemini」
  • Geminiは無料でも基本的な機能はすべてできるが、より高性能なモデルを使用したい場合は、2900円/月で有料プランにアップグレードが必要。
  • Geminiでは、検索・情報収集や文章の要約・翻訳、プログラミングコードの生成、画像認識機能、Imagen2を利用した画像生成Googleアプリと連携などが可能。
  • Google Geminiの登録や使い方を実際にやって見ながら解説
  • Geminiで生成した画像の著作権や商用利用については、注意が必要。
  • Geminiで使えるプロンプトを紹介
  • Geminiで画像生成ができない時の対処法

について書いてきました。

ChatGPTやMicrosotf Copilotに並ぶ有用な生成AIで、Geminiにしかない機能もありました。

今なら無料で使えますし、有料プランも今なら2か月間無料なので、ぜひ試してみてください

romptn Q&Aで質問してみませんか?
romptn Q&Aは、AIに関する質問プラットフォームです。
  • ChatGPTで〇〇を効率化したい
  • スライドを作るならどのAIツールがおすすめ?
  • おすすめのGPTsが知りたい
といったことはありませんか?
同じ悩みを解決した人がいるかもしれません。ぜひ質問してみてください!
Gemini
スポンサーリンク
romptn Magazine