【Gemini】使い方について徹底解説!活用事例についても紹介! | romptn Magazine

【Gemini】使い方について徹底解説!活用事例も紹介!

Gemini

「Geminiってどう使うの?」「GeminiとChatGPTはどう違うの?」「GeminiってGoogleアプリもある?」など疑問を持つ方も多いでしょう。

今回はそんなお悩みを持つ方に向けて、Bardの後継であるGeminiの基本情報から実際の使い方までわかりやすく解説します。

こちらの記事を読めば、自分に合ったGeminiの利用方法がわかるので、ぜひ最後までチェックしてみてください。

スポンサーリンク

Google Geminiとは

まずはGoogle Geminiの基本情報から見ていきましょう。

【Googleの最新AI】Geminの概要といつから使えるかを解説!

Googleが2023年12月7日に発表した新しいAIモデル「Gemini」。

Geminiは、Googleが開発した最新型マルチモーダルAIモデルで、テキストだけでなく音声、画像、動画などを理解し、それらを組み合わせて操作ができます。

マルチモーダルAIとは、テキスト、音声、画像、動画、コードなど、2つ以上の異なるデータの種類を理解して、組み合わせて操作できる生成AIモデルのこと。

現在はGoogleアプリでも利用可能です。

Geminiの前身「Google Bard」とは

GoogleはこのGeminiをローンチする前に「Google Bard」を世に出していました。

Bardは2023年3月にアメリカとイギリスでテスト提供を開始していたAIチャットサービス。

Googleの検索サービスを連携しており、会話形式で質問をするだけで、AIがビッグデータから自然かつ正確な回答を出力してくれる機能を持っていました。

このBardがさらに進化して新しくなったものがGeminiになります。

Geminiの特徴

Geminiの特徴は次の通り。

  • 自然言語での対話:Geminiでは人間らしい自然な会話ができ、皮肉やユーモアな表現まで理解できる設計になっています。
  • 検索・翻訳・要約:画像やテキストからの検索や海外情報の翻訳、論文の要約など使用用途は様々あります。
  • 画像入力&生成:Geminiは無料版のChatGPTではできない、画像のアップロード&読み込み(認識)だけでなく、テキストから画像生成もできます。
  • マルチモーダル性:テキスト、画像、音声などを同時に理解できます。
  • ハイレベルの推論能力:膨大なデータの中から識別が難しい知識を発見する能力に長けているので、複雑な文字情報や視覚情報を理解できます

Geminiを活用することで、言語の壁を超えることも容易となり、作業効率が格段に上がるでしょう。

Geminiの料金は?無料で使える

結論、Geminiは無料で利用が可能です。もちろんGoogleアプリも同様。

しかしGeminiには「Gemini Advanced」という有料版があり、Gemini Advancedと比較するとできることが制限されます。

そこで、なにが無料版でもできるのか「Gemini Advanced」「ChatGPT」と比較しながら見ていきいましょう。

GeminiGemini AdvancedChatGPT
モデルGemini ProGemini UltraGPT-3.5
料金無料2,900円/月無料
制限なしなしなし
入力できるデータテキスト・画像テキスト・画像テキスト
出力できるデータテキスト・画像・ソースコードテキスト・画像・ソースコードテキスト・ソースコード
画像生成×
外部サービス連携×
ファイルの読み込み×
機能の拡張×
AIツール生成×××

ChatGPTの無料版と比較すると、Geminiの方ができることが多くあります。

また、表だけ確認するとGeminiの無料版と有料版は同じ性能に見えますが、Gemini AdvancedはGemini Ultraというモデルを採用している点が大きく異なるポイント。

Googleによると、Gemini Advancedは主要な他生成AIサービスと比較して、最もパフォーマンスの高い会話型 AI のひとつと評価されているそうです。(参考:Google Japan Blog)

Google Geminiは日本語対応している?

Google Geminiの無料版で使用されているAIモデルGemini Proでは、日本語でも利用できるようになりました

ただしGemini全ての機能が日本語対応しているわけではありません。

  • Geminiの有料版Gemini Advancedは日本語対応していない
  • 画像生成は英語対応のみ

上記2点は注意しましょう。

Geminiを実際に使ってみた:登録から利用までの使い方を解説!

次に、Geminiを実際に利用するために、登録から利用までの手順を解説していきます。

Googleアカウントを作成する

Geminiを利用するには、Googleアカウントの登録が必須です。

まだアカウントを持っていない方は、Googleログインページにアクセスして新規アカウントを作成しましょう。

Geminiにログインして、会話をする

Googleアカウントがあれば、Geminiにログインすることですぐに利用できます。

自分が知りたい内容や指示文を赤枠部分に打ち込んで送信してみましょう。

画像や音声も赤枠にあるマークをクリックすればアップロードできます。

新規チャットの作成や履歴確認

現在のチャットを離れて、新しいチャットを作成したり、過去のチャット履歴を見たりすることも簡単。

左上にある横三本線をクリックすると「チャットを新規作成」と出てくるので、そこをクリックすれば新規チャットが開始されます。

過去のチャット履歴も出てくるので、チェックしたいチャットをクリックすれば、これまでの会話履歴を確認できます。

履歴が残っていると、新しく指示文を作成する時に過去の指示文をコピペできるので非常に便利です。

また、各履歴ごとにタイトルの変更や固定ができるので、残しておきたい履歴は自分がわかりやすいように整理しておきましょう。

Geminiでできること7選!

次にGeminiでできることを7つ、実際の画面をお見せしながら解説します。

1.検索・情報収集

まずは最も使われる利用方法の検索・情報収集です。

参考にしたURLもあわせて回答してくれるため、信憑性の高い情報か確認できます。

ただし間違った情報が出るケースもあるので注意しましょう。

プロンプト

日本で面積の大きい都道府県をランキング形式で1~5位まで教えて。

出力内容

  1. 北海道: 83,423.87 km²
  2. 岩手県: 15,275.01 km²
  3. 福島県: 13,784.14 km²
  4. 長野県: 13,561.56 km²
  5. 新潟県: 12,583.96 km²

参考:

2.文章の要約

長い文章の要約も可能です。

URLから記事を読ませて要約することもできるため、わざわざ長い文章をコピペする必要がありません。

論文など、長く難しい情報をわかりやすくまとめたい時に便利です。

プロンプト

こちらの記事をわかりやすく要約してください。
https://japan.googleblog.com/

出力内容

このブログ記事は、Google AI が開発した新しい AI モデル「Gemini 1.5」についての記事です。Gemini 1.5 は、従来の AI モデルよりもはるかに多くの情報を処理でき、テキスト、コード、画像、動画など、さまざまな種類の情報を処理できます。これにより、長いドキュメントを理解したり、質問に答えたりといった、さまざまなタスクを実行できるようになります。

具体的には、Gemini 1.5 は、従来の AI モデルよりも 10 倍以上の情報を処理でき、テキスト、コード、画像、動画など、さまざまな種類の情報を処理できます。これにより、長いドキュメントを理解したり、質問に答えたりといった、さまざまなタスクを実行できるようになります。

Gemini 1.5 は、まだ開発中ですが、さまざまな分野で活用されることが期待されています。例えば、医療分野では、Gemini 1.5 を使って、医療画像の解析や、患者の病状の診断を行うことができます。また、教育分野では、Gemini 1.5 を使って、生徒の学習を支援したり、新しい学習コンテンツを作成したりすることができます。

Gemini 1.5 は、AI の可能性を大きく広げるモデルとして、今後も注目を集めていくことでしょう。

確認したウェブサイト

  1. japan.googleblog.com/

3.外国語の翻訳

外国語の翻訳も可能なので、Geminiを使えば言語の壁で困ることはありません。

使用シーンなども明記してくれるので、語学学習にもなります。

プロンプト

以下の英文を翻訳して。
It’s great to see you again.

出力内容

お会いできてとても嬉しいです。
またお目にかかれて嬉しいです。
再びお会いできて光栄です。
お久しぶりです。
状況や相手との関係性によって、最適な訳語を選ぶと良いでしょう。

目上の人やフォーマルな場面: お会いできてとても嬉しいです。/ またお目にかかれて嬉しいです。
親しい友人やカジュアルな場面: 再びお会いできて光栄です。/ お久しぶりです。
その他、以下のような訳語も考えられます。

再会できて嬉しい。
また会えて嬉しい。
あなたに会えてよかった。
補足:

It’s great to see you again. は、久しぶりに会った人への挨拶としてよく使われます。
great は、「素晴らしい」「素晴らしい」という意味です。
to see は、「会う」「見る」という意味です。
again は、「再び」「また」という意味です。
例文:

It’s great to see you again after all these years.(久しぶりに会った友人への挨拶)
It’s great to see you again, Mr. Smith.(目上の人への挨拶)
It’s great to see you again, everyone! (複数人への挨拶)

4.プログラミングコードの生成

Geminiは、Python・Java・C++などの世界で人気のあるプログラミング言語を理解するだけでなく、高品質のコードを生成もできます。

著作権上の問題から、既存ゲームのPythonコードは出力できないこともあります。

プロンプト

テトリスのプログラムをPythonで書いてください。

出力内容

import random

定数

SCREEN_WIDTH = 800
SCREEN_HEIGHT = 600
BLOCK_SIZE = 30

テトリミノの形状

TETROMINOES = [
[
[1, 1, 1, 1],
],
[
[0, 1, 1],
[1, 1, 0],
],
[
[1, 0, 0],
[1, 1, 1],
],
[
[0, 0, 1],
[1, 1, 1],
],
[
[1, 1, 0],
[0, 1, 1],
],
[
[0, 1, 0],
[1, 1, 1],
],
[
[1, 0, 1],
[1, 1, 1],
],
]

ゲームクラス

class Tetris:
def init(self):
# ゲームの状態
self.game_over = False

    # テトリミノ
    self.current_tetromino = random.choice(TETROMINOES)
    self.next_tetromino = random.choice(TETROMINOES)

    # テトリミノの位置
    self.x = 0
    self.y = 0

    # ゲームループ
    while not self.game_over:
        # テトリミノを落下させる
        self.y += 1

        # テトリミノが画面外に出たらゲームオーバー
        if self.y >= SCREEN_HEIGHT:
            self.game_over = True

        # テトリミノを回転させる
        # ...

        # テトリミノを左右に移動させる
        # ...

        # テトリミノが固定されたら
        # ...

        # 画面を描画する
        # ...

ゲームの開始

Tetris()

5.画像認識機能

Geminiに画像をアップロードするだけで、画像に関する情報が得られます

画像と一緒に知りたい内容を質問すれば、情報をまとめて回答してくれます。

「写真に写っている建物がどこにあるか知りたい」「この画像に書かれている文章を知りたい」など、これまで調べづらかったことも、この機能を活用することですぐに解決できるでしょう。

プロンプト

この画像には何が写っていますか?

出力内容

送信された画像には、遠くに見えるエッフェル塔と、手前に広がる公園の様子が写っています。公園には木々やベンチ、芝生があり、人々が散歩や休憩を楽しんでいるようです。

詳細な説明は以下の通りです。

前景:

  • 広々とした公園
  • 緑豊かな木々
  • 芝生
  • ベンチ
  • 歩いている人々

中景:

  • 大きな噴水
  • 人々が集まっている円形の広場

背景:

  • 高層ビル
  • セーヌ川
  • 遠くに霞むエッフェル塔

画像の全体的な雰囲気:

  • 穏やかで平和な雰囲気
  • 晴天で気持ち良い日
  • 人々がリラックスして過ごしている

補足:

  • 画像は、おそらくパリのシャン・ド・マルス公園から撮影されたものと思われます。
  • エッフェル塔は、画像の中央やや右側に写っています。
  • 画像の解像度が低いため、細部までは確認できません。

質問への回答:

この画像には、パリのシャン・ド・マルス公園と、遠くに見えるエッフェル塔が写っています。

6.Imagen2を利用した画像生成

「Imagen2」はGoogle社から提供されている画像生成AI

日本語はまだ未対応のため、画像生成をしたい時は英語で指示文を作成しましょう

プロンプト

creat an image of a cute cat.

出力内容

Sure, here is an image of a cute cat:

7.拡張機能でGoogleアプリと連携

Geminiには、次のGoogleアプリと連携できる拡張機能が備わっています。

  • Google Workspace(Gmail、Googleドキュメントなど)
  • Googleフライト
  • Googleホテル
  • Googleマップ
  • YouTube

設定方法も簡単。左下の歯車ボタンをクリックして、連携したいアプリを選択するだけ。

あとは自分の調べたい内容をこれまで通り記入しましょう。

プロンプト

東京駅から銀座駅までの行き方を教えて。

出力内容

東京駅から銀座駅までは、車で約3分です。

Googleマップ でルートを確認できます。

ルート概要

  • 距離: 0.9 km
  • 所要時間: 3分
  • 経路: 外堀通り/都道405号

注意事項

  • 渋滞状況によっては、所要時間が長くなる場合があります。
  • 信号や交差点が多いため、安全運転を心がけてください。

おすすめルート

  • 外堀通りをまっすぐ進むと、銀座駅に到着します。
  • 途中、皇居や東京国際フォーラムなどの観光スポットもありますので、時間に余裕があれば立ち寄ってみるのもおすすめです。

Geminiの活用事例7選!

Geminiの使い方は他にも豊富にあります。

次にGeminiの活用事例をご紹介します。

1.比較表の作成

会議資料など人に伝える時に便利な比較表の作成です。

一つひとつ調べて表にまとめる作業は時間がかかります。

この作業をGeminiが担ってくれるだけで、作業時間は格段に減らせるでしょう

2.プログラミング:Pythonコードを生成

GeminiはPythonコードを作成することも可能です。

Pythonとは、AIやアプリ開発など、さまざまな開発に対応できるプログラミング言語のこと

簡単なアプリなら誰でも作れるようになるので、ゲーム開発をしてみたいにもおすすめ

3.英語学習:英文の添削・練習問題の作成

Geminiでは英文の添削から練習問題の作成までしてくれるので、英語学習にもぴったり

下記の投稿はGeminiの旧バージョンであるBardの内容ですが、Geminiでも対応可能な内容です。

4.Gmaiと連携し返信を考えてもらう

拡張機能でGoogle Workspaceと連携することで、GeminiがGmailでの返信内容を考えてくれます

この機能を活用することで、文章を考える時間や誤字・脱字のミスを減らせるので、作業効率が格段に上がるでしょう。

返信内容は必ず最終チェックをしてから送るようにしましょう。

5.ビジネスに応用:求人作成をGeminiで作る

ビジネスでの応用として、Geminiで求人内容の作成もできます。

求人募集時に入れたい内容を指示文にまとめて送信すれば、瞬時に求人が完成します

気になる箇所があれば、何度も修正依頼をかけて理想の形にしていきましょう。

Geminiの使い方まとめ

本記事では、Geminiの基本情報から使い方まで解説してきました。

今回の記事をまとめると

Geminiは、

  • Googleが2023年12月7日に発表した新しいAIモデル
  • 無料でも使える(有料版あり)
  • 基本的に日本語対応している(画像生成など一部未対応)
  • Googleアカウントがあれば、すぐに利用できる
  • 文章の要約や画像生成など、できることが豊富にある
  • 比較表の作成やGmailでの返信内容作成など、実用的な利用も可能

Geminiでできることは豊富にあるので、これまで時間のかかっていたタスクはGeminiに依頼するのがおすすめです。

まずは無料版から利用して、Geminiの素晴らしさを体感してみましょう。

romptn Q&Aで質問してみませんか?
romptn Q&Aは、AIに関する質問プラットフォームです。
  • ChatGPTで〇〇を効率化したい
  • スライドを作るならどのAIツールがおすすめ?
  • おすすめのGPTsが知りたい
といったことはありませんか?
同じ悩みを解決した人がいるかもしれません。ぜひ質問してみてください!
Gemini
スポンサーリンク
romptn Magazine