イルカのクリック音やホイッスル、バーストパルスなどの複雑な鳴き声。この謎めいたコミュニケーションを解読するという長年の科学的課題に、ついにAIが革命をもたらそうとしているんです!
2025年4月14日、Googleは「DolphinGemma」という画期的なAIモデルを発表しました。40年に及ぶイルカ研究と最先端AI技術が合わさって、イルカと人間の間で会話をするという挑戦が始まったのです。
今回は、Googleが発表した超最先端AI「DolphinGemma」の概要について、詳しく分かりやすく解説していきます。
- イルカコミュニケーションAI「DolphinGemma」とは?
- DolphinGemmaが今後にもたらす影響・可能性
イルカコミュニケーションAI「DolphinGemma」とは?
DolphinGemmaは、GoogleがWild Dolphin Project(WDP)とジョージア工科大学の研究者たちと共同で開発した、イルカの発声を学習し解析・生成するためのAIモデルです。このプロジェクトは、イルカの発声の構造とパターンを理解し、将来的にはイルカとの双方向コミュニケーションを実現することを目指しています。
このAIモデルは、約4億のパラメータを持つ比較的小規模なモデルでありながらも、イルカの音声パターンを学習して新たな音声を生成する能力を持っています。特筆すべきは、このモデルがGoogleのPixelスマートフォン上で直接動作するよう最適化されている点です。
DolphinGemmaは、イルカの音声を入力として受け取り、音声を出力する「audio-in, audio-out」モデルとして機能します。人間の言語を処理する大規模言語モデルが文章の続きを予測するように、このモデルはイルカの音声パターンを分析し、次に続く可能性の高い音を予測します。
DolphinGemmaの開発経緯
DolphinGemmaの開発において最も重要な要素の一つは、WDPが40年近くにわたって蓄積してきた貴重なデータです。WDPは1985年から、バハマに生息する野生のタイセイヨウマダライルカ(Stenella frontalis)の特定の群れを世代を超えて研究してきました。
この研究は「彼らの世界で、彼らの条件で(In Their World, On Their Terms)」という方針のもと、イルカを自然な環境で観察し、干渉を最小限に抑える形で続けられてきました。その結果、各イルカの個体情報、生活歴、観察された具体的な行動パターンが詳細に記録された何十年分もの水中ビデオと音声記録が蓄積されています。
このWDPの膨大なデータベースに、Googleの先進的なAI技術が組み合わさることで、DolphinGemmaは生まれました。これまで人間の専門家の耳と目に頼っていた分析が、AIによって高速かつ大規模に行えるようになったのです!
DolphinGemmaの特徴と仕組み
DolphinGemmaは、Googleの軽量でオープンなAIモデルである「Gemma」を基にしています。Gemmaは、GoogleのGeminiモデルと同じ研究から生まれました。技術的な核心部分として、DolphinGemmaはGoogleの特別な音声技術「SoundStreamトークナイザー」を活用してイルカの音を効率的にデジタル化し、複雑なパターン処理に適したAIモデルアーキテクチャで分析します。
SoundStreamトークナイザーは、イルカの複雑な音声を解析可能な単位に分解する役割を担っています。これを身近な例で説明すると、まったく知らない外国語を聞いているとき、私たちは最初、どこで単語が区切られているのかさえわからない状態です。しかし、繰り返し聞いているうちに、特定のパターンや単語らしきものを識別できるようになります。SoundStreamはこの「音の流れから意味のある単位を識別する」という作業をAIが行えるようにするツールなのです。
DolphinGemmaの仕組みは、私たちが日常的に使っているAIチャットボットに似ています。人間向けのAIは「こんにちは、今日の天気は」と入力されると、次に「晴れ」や「雨」などの言葉が来ると予測します。同様に、DolphinGemmaはイルカの特定の音声パターンが入力されると、次にどのような音が続くかを予測します。この予測が正確であれば、理論上はイルカが理解できる「文」を構成できる可能性がありますね。

技術的に注目すべきは、DolphinGemmaのコンパクトさです。約4億のパラメータを持つこのモデルは、ChatGPTなどの一般的な大規模言語モデルと比較するととても小型ですが、それでもイルカの発声の複雑なパターンを捉えるのに十分な能力を持っています。このコンパクトさによって、スマートフォンでも効率的に動作するよう最適化されています。研究者たちが水中でリアルタイムにイルカとの「会話」を試みるためには、この小型化が不可欠だったということです。
DolphinGemmaによるイルカの音声パターン解析方法

DolphinGemmaによる最も大きな変化は、これまで膨大な人手を要していたイルカの音声パターン分析を、AIによって効率化できる点にあります。AIは繰り返し出現する音のパターンやまとまりを特定することで、イルカのコミュニケーションに隠された構造や意味の発見をサポートしてくれます。
人間の言語を理解するAIがテキストデータを学習するのと同様に、DolphinGemmaはWDPが収集した野生のタイセイヨウマダライルカの音声データでトレーニングされています。このモデルは、イルカの自然な音声シーケンスを処理してパターンを識別し、構造を把握し、最終的にそのシーケンスの次の音を予測します。
この分析によって、例えば「特定のイルカがこの音を出すと、別のイルカがこう応答する」といったパターンや、「この音が連続で出ると、群れがこう行動する」といった関係性が見えてくるという可能性が出てくるのです。
DolphinGemmaはただ音声を分析するだけでなく、学習したパターンに基づいて新たなイルカの音声も生成できます。これによって、研究者たちは「イルカに理解される可能性のある」人工的な音声を作り出し、イルカの反応を観察することで、彼らのコミュニケーションについての理解を深めることができるんです!
DolphinGemmaが今後にもたらす影響・可能性
DolphinGemmaプロジェクトは、現時点でも画期的な取り組みですが、その真の可能性はこれからさらに広がっていくとされています。
そう考えるとオープンソース化と研究コミュニティへの貢献、そして種間コミュニケーションの未来に与える影響は計り知れませんね。

Googleは、科学的発見における価値を認識して、DolphinGemmaを2025年夏にオープンモデルとして公開する予定です。これにより、世界中の研究者がこのモデルを活用して独自のデータセットを解析し、イルカのコミュニケーション研究を加速させることができるようになります。
DolphinGemmaは現在、タイセイヨウマダライルカの音声でトレーニングされていますが、バンドウイルカやハシナガイルカなど、他の鯨類を研究している研究者にも役立つ可能性があります。種類によって音声が異なるため、それぞれの種類に合わせたファインチューニングが必要になるかもしれませんが、モデルのオープンな性質がこうした対応を簡単にしてくれます。
DolphinGemmaの社会的意義
DolphinGemmaプロジェクトが目指すイルカと人間とのコミュニケーションは、科学的好奇心の充足を超える意義を持っています。海洋環境は人間活動の影響に直面しており、イルカの生息地も脅かされています。特に海洋騒音汚染は、音を使ってコミュニケーションを行うイルカにとって深刻な脅威となっています。
イルカの「言語」を理解することで、彼らの行動パターンや必要としていることをより深く理解できるようになるかも?これは海洋保全策の立案に貴重な情報をもたらし、イルカと人間の共存をより持続可能なものにする可能性があります。
さらに、非人間的知性とのコミュニケーションという経験は、私たち自身の言語や思考について新たな視点をもたらしてくれるかもしれません。イルカの「言語」が人間の言語とどう異なるのか、あるいは共通点はあるのかを理解することで、言語学や認知科学の分野に新たな洞察がもたらされるかもしれません。
「他者の心を理解する」という挑戦は、人間同士でさえ容易ではありません。まして、進化的に異なる道を歩んできた生物種との相互理解となれば、その困難さは計り知れません。しかし、だからこそDolphinGemmaプロジェクトの挑戦は価値があるのです。異なる生物種との対話の可能性を探ることは、コミュニケーションの本質、そして知性や意識の本質に迫る探究でもありますね!
まとめ
いかがでしたでしょうか?
GoogleのDolphinGemmaは、AIを使ってイルカの音声パターンを解析・生成し、長年の夢だった「イルカとの会話」に一歩近づく革新的な技術でしたね!この記事では、DolphinGemmaの概要から技術的詳細、実際の研究、そして今後の可能性まで詳しく紹介してきました。
この記事で紹介したことをまとめると次のようになります。
- DolphinGemmaは、Googleが開発した約4億パラメータの軽量AIモデルで、イルカの発声を学習・解析・生成できる
- 40年にわたるWild Dolphin Projectの研究データとGoogleのAI技術が融合して誕生した
- イルカの「シグネチャーホイッスル」など特徴的な音声パターンの解析が進んでいる
- 2025年夏にオープンモデルとして公開予定で、世界中の研究者による活用が期待される
- 海洋保全や種間コミュニケーションといった社会的意義も大きい
DolphinGemmaの研究はまだ始まったばかりですが、この技術が進化することで、私たちと海洋生物との関係は大きく変わる可能性があります。イルカの「言葉」を理解し、彼らと意思疎通できる日は、思ったより近いかもしれませんね!