Geminiの音楽生成『Lyria 3』とは?できること・使い方・注意点を徹底解説

Gemini

AI作曲といえばSunoやUdioが知られていますが、最近あらためて注目を集めているのが、GoogleのGeminiに統合された音楽生成モデル『Lyria 3』です。

単なる作曲専用サービスではなく、Geminiの会話体験の中で楽曲を生成・調整できるのが大きな特徴です。

ジャンルや雰囲気を入力するだけで約30秒のトラックを自動生成し、「もう少し明るく」「ドラムを強めに」といった自然な指示で微調整も可能です。

ショート動画やSNS向けBGM需要が高まる中、Geminiユーザーがそのまま音楽制作まで完結できる環境が整いつつあります。

本記事では、Lyria 3でできること、具体的な使い方、利用条件や注意点までをわかりやすく整理します。

最新のAI音楽生成の動向を押さえたい方は、ぜひ参考にしてください!

内容をまとめると…

  • 『Lyria 3』はテキスト・画像から音楽を生成できるGeminiの新機能

  • 生成は約30秒が中心で、ボーカル付き楽曲にも対応

  • 無料プランはあるが、生成回数は非公開で制限あり

  • ダイヤマークは可視表示、SynthIDは見えない透かしで別物

豪華大量特典無料配布中!

romptn aiが提携する完全無料のAI副業セミナーでは収入UPを目指すための生成AI活用スキルを学ぶことができます。

ただ知識を深めるだけでなく、実際にAIを活用して稼いでいる人から、しっかりと収入に直結させるためのAIスキルを学ぶことができます。

現在、20万人以上の人が収入UPを目指すための実践的な生成AI活用スキルを身に付けて、100万円以上の収益を達成している人も続出しています。

\ 期間限定の無料豪華申込特典付き! /

AI副業セミナーをみてみる
監修者_SD以外
監修者プロフィール
森下浩志
日本最大級のAI情報プラットフォーム「romptn ai」編集長。著書に「0からはじめるStable Diffusion」「0からはじめるStable Diffusion モデル・拡張機能集編」など、AmazonベストセラーのAI関連書籍を多数執筆。AIにおける情報の非対称性を解消するための社内研修や出張講義も行う。

Geminiの音楽生成『Lyria 3(リリア スリー)』とは?

『Lyria 3』は、GoogleのGeminiに統合された最新の音楽生成AIモデルです。

楽曲の作り方は大きく分けて次の2つがあります。

  1. テキストでジャンルや雰囲気を指定して作る方法
  2. 画像をもとに作る方法

たとえば、風景画像を見せながら「この雰囲気に合うBGMを作って」と指示することも可能です。

Geminiならではの統合環境を活かし、映像やビジュアルと連動した音楽制作ができます。

生成される楽曲は約30秒で、ポップスやEDM、シネマティック系まで幅広く対応し、インストだけでなくボーカル付き楽曲も制作可能です。

さらに会話形式で「もっと明るく」「テンポを上げて」といった微調整もできるため、専門知識がなくても実用レベルの音源を短時間で作成できます。

【Part 1】実際に”テキスト”から曲を作ってみよう!

ここからは、Lyria 3を使って実際にテキストから楽曲を生成する流れを見ていきます。

はじめて使う場合でも、難しい設定や専門知識は必要ないので、手順通りに進めれば数分で音源を作成できます。

まずはシンプルなプロンプトから試し、生成→微調整の流れを体験してみましょう。

テキストで曲を作る手順
  • ステップ1
    Geminiにログインする

    まずはGeminiにアクセスし、Googleアカウントでログインします。

  • ステップ2
    ツールマークから音楽生成を選ぶ

    チャット画面のツールマークをクリックし、「音楽を作成(Create music)」を選択します。
    通常のテキスト会話とは別に、音楽生成モードに切り替えるイメージです。

  • ステップ3
    作りたい曲のイメージを入力し、生成する

    作りたい楽曲のジャンルや雰囲気をテキストで入力します。

    リミックスは、生成済みの楽曲をベースにバリエーションを作る機能です。

    完全にゼロから作り直すのではなく、雰囲気や構成をある程度保ったまま別パターンを生成できます。

    各ジャンルの特徴

    90年代のラップ:重めのビート中心。ストリート系やクールな動画向け。

    ラテンポップ:明るく陽気。夏・旅行・ダンス系コンテンツと相性◎。

    フォークバラード:アコースティック中心。感動系やナレーション動画向け。

    8ビット:レトロゲーム風。ショート動画やネタ系に使いやすい。

    ワークアウト:テンポ速めでエネルギッシュ。トレーニング動画向け。

    レゲトン:低音強めでダンサブル。海外風・ダンス動画向け。

    R&Bロマンス:しっとり系。恋愛・雰囲気重視コンテンツ向け。

    カワイイメタル:可愛いメロディと重めのギターが融合したジャンル。ギャップを出したい動画や、インパクト重視のコンテンツ向け。

    シネマティック:映画予告風。企業PRやイベント映像に最適。

    エモ:切なさ重視。ストーリー系動画と相性が良い。

    アフロポップ:リズム感強めで軽快。エンタメ・ダンス系向け。

    森林浴:落ち着いたアンビエント。癒し・作業用BGM向け。

    Kポップ:キャッチーで展開多め。SNSショートと好相性。

    バースデーロースト:コミカル系。ネタ動画やお祝い系に使いやすい。

    フォーク・アカペラ:楽器控えめで声中心。シンプルな演出向け。

  • ステップ4
    確認・微調整する

    生成された約30秒の音源を確認します。
    イメージと違う場合は、要望を伝えて再生成します。

  • ステップ5
    保存する

    楽曲が完成したら、再生プレイヤー右上にある「ダウンロードマーク」をクリックします。
    ここから音源を保存できます。

    保存形式は2種類
    • 動画(カバーアート付きの音声)
    • 音声のみ(MP3トラック)

    BGMとして使う場合は「MP3トラック」で十分です。

『Lyria 3』で作れる主な音楽ジャンルとプロンプト例

ここでは、代表的な音楽ジャンルごとに、実際に使えるプロンプト例を紹介します。

そのまま使っても、少しアレンジしても構いません。

まずは例を参考にしながら、自分の動画や用途に合った指示に調整してみてください!

定番ジャンル(ポップ/ロック/EDM/ヒップホップ)

J-POP

明るく爽やかなJ-POP。テンポはやや速め。ピアノとギター主体で、Aメロは落ち着き、サビで一気に開放感を出す構成。青春や挑戦をテーマにした前向きな雰囲気。メロディ重視で感情が伝わる展開。派手すぎる重低音は不要。

K-POP

洗練されたK-POPスタイル。中速〜やや速め。重めのビートとタイトなドラム、シンセ主体。サビでフックが強く、ダンス向きのグルーヴ。クールで都会的な雰囲気。ブリッジで一度落としてから再度盛り上げる構成。

ロック

エネルギッシュなロック。テンポは速め。歪んだエレキギターと力強いドラム、存在感のあるベース。ライブハウスのような熱量。サビで一気に盛り上がる王道構成。勢い重視でストレートに。シンセは最小限。

EDM

エネルギッシュなEDM。テンポは速め。ビルドアップからドロップで一気に盛り上がる構成。重低音のキックとシンセリードを強調。フェス会場のような高揚感。勢い重視で大胆に。

ヒップホップ

重低音が効いたヒップホップ。テンポは中速。太いキックとスネアを中心に、シンプルで繰り返しの強いビート。ダークでクールなストリート感。メロディは最小限。低音を強調し、グルーヴ重視。派手なオーケストラ要素は不要。

チル・作業用(Lo-fi/アンビエント/ジャズ)

Lo-fi

落ち着いたLo-fi。テンポはゆったりめ。ビニールノイズ入り。柔らかいエレピと丸いベース、軽いスネア。夜の部屋で静かに作業しているような空気感。大きな展開は不要。感情は控えめで、リラックス重視。音数は少なめで余白を活かす。

アンビエント

静かで空間的なアンビエント。ゆったりしたテンポ。長く伸びるシンセパッド中心。ドラムは最小限。瞑想や作業に向く落ち着いた雰囲気。

ジャズ

落ち着いたジャズ。テンポはややゆったり。ピアノ、ウッドベース、ブラシドラム中心。スウィング感を出し、生演奏のような自然な揺れ。大人っぽく上品な雰囲気。即興的なピアノフレーズを入れる。派手なシンセは不要。

映像向け(シネマ/ゲーム/トレーラー風)

シネマティック

壮大なシネマティック音楽。ストリングスとパーカッション中心。徐々に緊張感が高まり、クライマックスで一気に解放。映画予告編のようなドラマチックな構成。重厚で迫力あるサウンド。

ゲーム

ゲームのボス戦をイメージした緊迫感ある音楽。速いテンポ。力強いドラムと重厚なオーケストラ。緊張感が途切れない構成。ダークでシリアスな雰囲気。

トレーラー風

映画予告編のような壮大なトレーラー音楽。テンポは中速から徐々に加速。低く重いストリングスとパーカッションで緊張感を作り、後半で一気に爆発的に盛り上げる構成。ブラスと強いドラムを加えて迫力を出す。ダークでドラマチックな雰囲気。静かな導入→ビルドアップ→クライマックスの三段構成。ポップ要素は不要。

【Part 2】実際に”画像”から曲を作ってみよう!

画像で曲を作る手順
  • ステップ1
    画像を用意し、アップロードする

    「テキストで曲を作る手順」で解説したステップ1〜2と基本的な流れは同じです。
    ここでは重複を避けるため、詳細な操作説明は割愛します。
    今回はこちらの画像を使用しました。

    画像のアップロードはツールマークの左にある「+」マーク内からするか、ドラッグ&ドロップでできます。

  • ステップ2
    必要であれば、プロンプトを入力する

    画像だけでも音楽を生成してくれるので、明確に作りたい音楽イメージがあれば、プロンプトを入力しましょう。

  • ステップ3
    生成・確認する

日本で使える?利用条件と対応範囲

Gemini 公式 Lyria3ページ内

公式FAQによると、日本を含むGeminiアプリが提供されている国・地域で利用できます。

ただし、利用は18歳以上に限られています。

対応言語

Lyria 3は、日本語を含む複数言語に対応しています。
日本語の歌詞入力や指示も可能です。
ただし、ジャンルや構成指定は英語のほうが安定する場合があります。

生成回数に制限はある?無料と有料の違い

プラン名月額料金(税込)
無料0円
Google AI Plus1,200円/月
Google AI Pro2,900円/月
Google AI Ultra36,400円/月

※料金は地域・為替・プラン改定により変更される場合があります。
最新情報は公式サイトをご確認ください。

Lyria 3は無料プランでも利用可能ですが、生成回数や利用できる機能には制限があります。

ただし、公式ページでは「1日〇回」などの具体的な回数は明示されていません。

利用状況や混雑状況によって制限が変動する可能性があります。

有料プランでは、利用上限が拡張され、混雑時でも安定して使いやすくなります。

本格的に制作したい場合や商用利用を前提とする場合は、有料プランのほうが安心です。

※Gemini全体の無料範囲や有料プランの違いについて詳しく知りたい方は、関連記事もあわせてチェックしてみてください。

透かし(SynthID)について

Lyria 3で生成された音楽には、Googleが提供する透かし技術「SynthID(シンスアイディー)」が組み込まれています。

これは、AIによって生成されたコンテンツであることを識別するための目に見えないデジタル透かしです。

通常の視聴では判別できませんが、専用の検出ツールを用いることで識別が可能です。

透明性や安全性を担保するための仕組みであり、意図的に削除することは推奨されていません。

AI生成コンテンツを活用する際は、この仕組みを理解したうえで利用することが重要です。

また、ダウンロードした動画やカバーアートの右下には、Gemini生成であることを示すダイヤマークが表示されます。こちらは可視ウォーターマークであり、SynthIDとは別の仕組みです。
※もし、こちらを消したい場合は、以下の記事を参考にしてください。

【注意点】使う前に知っておきたい制限とリスク

Lyria 3は手軽に楽曲を生成できる便利なツールですが、利用前に知っておきたい制限もあります。

特に著作権や再現性、商用利用に関するポイントは重要です。

トラブルを防ぐためにも、以下の点を押さえておきましょう。

「◯◯風」などは避ける

実在のアーティスト名を指定する「〇〇風」「in the style of ○○」といった表現は避けるのが安全です。

特定の人物や既存楽曲に強く寄せる指示は、利用規約や権利面で問題になる可能性があります。

ジャンルや雰囲気で指定するほうが安定しやすく、トラブルも回避できます。

  • 実在アーティスト名は使わない
  • 「in the style of ○○」は避ける
  • ジャンルや雰囲気で指定する

同じ品質を再現しにくい

AI生成の特性上、同じプロンプトを使っても完全に同一の楽曲を再現することはできません。

毎回わずかに異なる構成やアレンジになります。

お気に入りの音源ができた場合は、必ずダウンロードして保存しておきましょう。

再生成で同じものを出そうとするのは難しいです。

  • 同じプロンプトでも差が出る
  • お気に入りは必ず保存する
  • リミックスで近づけるのが現実的

商用利用は条件確認が必要

基本的に、Googleの利用規約に基づいて商用利用が可能です。

「Google ポリシーと規約」内

Googleの公式規約では、ユーザーが生成したコンテンツの利用権は原則としてユーザーに帰属すると明記されています。

ただし、第三者の権利侵害やポリシー違反に該当する場合はこの限りではありません。

必ず最新の公式情報を確認したうえで活用してください。

  • 利用規約を事前に読む
  • 企業利用は特に慎重に確認

活用シーン別おすすめパターン

Lyria 3で生成した楽曲は、さまざまな場面で活用できます。

短尺で使いやすい約30秒の音源が中心のため、デジタルコンテンツとの相性が特に高いのが特徴です。

ここでは代表的な活用シーンを紹介します。

YouTube・SNSのBGM

トーク動画やVlog、解説動画の背景音楽として活用できます。

著作権を気にせずオリジナルBGMを用意できるため、チャンネルの世界観を統一しやすいのがメリットです。

継続的に投稿するクリエイターに向いています。

  • 主張しすぎないインストが使いやすい
  • 声を邪魔しないテンポを意識
  • シリーズ動画は同系統で統一すると効果的

ショート動画のジングル

ショート動画やリール、TikTok向けのオープニング・エンディング音源として活用できます。

短い尺の中で印象を残す必要があるため、テンポが速く、フックのある楽曲が相性の良い傾向があります。

また、オリジナルのジングルを用意することで、チャンネルやブランドの世界観を統一しやすくなります。

  • 最初の3秒で空気を作る
  • ビートがはっきりした曲が編集しやすい
  • 毎回同じジングルでブランド化できる

企業・資料・イベント

企業PR動画、サービス紹介、イベントオープニング映像などにも活用できます。

シネマティック系や落ち着いた楽曲を使うことで、信頼感や高級感を演出できます。

プレゼン資料の背景動画にも応用可能です。

  • 派手すぎない安定感ある楽曲を選ぶ
  • シネマティック系は相性が良い
  • ブランドイメージに合った雰囲気を意識

ゲームBGM

インディーゲームやアプリ開発のBGM制作にも活用できます。

世界観に合わせたジャンル指定ができるため、ファンタジーやレトロゲーム風など柔軟に対応できます。

開発初期のラフ音源としても便利です。

  • 「loopable(ループ可能)」と指定すると使いやすい
  • 世界観に合わせてジャンルを明確化
  • 開発初期のラフ音源にも便利

【FAQ】よくある疑問

Q
歌声が入ってしまう…インストだけにするには?
A

プロンプトに「instrumental only(インストのみ)」や「no vocals(ボーカルなし)」と明確に指定してください。
最初の段階でボーカルなしを指定するのが最も効果的です。

すでに歌入りで生成された場合は、
  • remove vocals(ボーカルを削除)
  • make it instrumental only(インストのみにして)

と追加入力して再生成すると改善しやすくなります。

Q
日本語の歌詞で歌わせるには?
A

日本語にも対応しているので、日本語の歌詞をそのまま入力すれば生成できます。
ただし、より自然に仕上げるためには以下のポイントを意識すると安定しやすくなります。

  • 歌詞は短いフレーズごとに改行する
  • テンポやジャンルも一緒に指定する
  • 「Japanese lyrics(日本語の歌詞)」と補足すると安定する場合がある
Q
同じ曲をもう一度作ることはできる?
A

完全に同じ楽曲を再生成することはできません。
AI生成の特性上、毎回微妙に異なる結果になります。
近い雰囲気を出したい場合は、同じプロンプト+リミックスを使用しましょう。

Q
途中で止まる・生成できないときの対処は?
A

まずは再試行してみてください。
改善しない場合は、プロンプトを短くシンプルにする、ブラウザを更新する、通信環境を確認するなどが有効です。利用回数上限に達していないかも確認しておきましょう。

※以下の記事ではGeminiが使えない場合について解説しているので、あわせて参考にしてみてください。

まとめ

Lyria 3は、テキストや画像をきっかけに、誰でもサクッと音楽を作れるGeminiの音楽生成機能です。

30秒トラックを自動で作れたり、ボーカル付きにも対応していたりと、動画づくりやSNS投稿にそのまま使いやすいのが魅力です。

最初から完璧を狙う必要はありません。

まずは気になるジャンルを選ぶか、短いプロンプトを入れて1曲作ってみてください。

そこから「もう少し明るく」「インストにして」など少しずつ調整していくと、グッと自分好みに寄せられます。

ぜひ、気軽に試して、あなたのコンテンツにぴったりの“自分だけのBGM”を作ってみてください!

豪華大量特典無料配布中!

romptn aiが提携する完全無料のAI副業セミナーでは収入UPを目指すための最新トレンド生成AI活用スキルを学ぶことができます。

ただ知識を深めるだけでなく、実際にAIを活用して稼いでいる人から、しっかりと収入に直結させるためのAIスキルを学ぶことができます。

現在、20万人以上の人が収入UPを目指すための実践的な生成AI活用スキルを身に付けて、100万円以上の収益を達成している人も続出しています。

\ AI画像生成スキルで収入UP! /

AI副業セミナーを見てみる