2024年8月、AI開発企業Anthropicに対して、3人のアメリカ人作家が著作権侵害の訴訟を起こしました。この訴訟は、Anthropicが開発したAIチャットボット「Claude」のトレーニングに、著作権で保護された数十万冊もの書籍を不正に使用したとして提起されました。
訴訟の概要
訴えを起こしたのは、以下の3名の作家です。
- アンドレア・バーツ(『We Were Never Here』の著者)
- チャールズ・グレーバー(『The Good Nurse』の著者)
- カーク・ウォレス・ジョンソン(『The Feather Thief』の著者)
彼らは、AnthropicがClaudeのトレーニングに「The Pile」と呼ばれるオープンソースデータセットを使用したと主張しています。このデータセットには、「Books3」と呼ばれる約19万6640冊分のデータが含まれており、その中には村上春樹氏やスティーヴン・キング氏の作品など、多数の著作権で保護された書籍が含まれているとされています。
Anthropicの対応
Anthropicは、2024年8月に海外メディアのVoxに対して、「The Pile」を利用してClaudeのトレーニングを実施したことを認めています。しかし、今回の訴訟に関しては、係争中であることを理由に詳細なコメントを控えています。
原告の主張
訴状では、以下のような主張がなされています。
- Anthropicは、The PileとBooks3のデータが海賊版サイトから入手した著作権保護コンテンツであることを認識しながら使用した。
- この行為により、Anthropicは数十億ドル(数千億円)にも上る莫大な金銭的利益を得た。
- Anthropicのビジネスモデルは、クリエイターと権利者を犠牲にして成り立っている。
原告らは、Anthropicに対して損害賠償の支払いを求めるとともに、今後Anthropicが著作権で保護されたコンテンツを使用しないよう要求しています。
背景:AI開発と著作権問題
この訴訟は、AI技術の急速な発展に伴い浮上してきた著作権問題の一例です。生成AI企業が大規模言語モデル(LLM)をトレーニングする際に使用するデータセットの適法性が問われています。
同様の訴訟は他のAI企業に対しても起こされています。
- OpenAIとMetaは、著者グループから同様の訴訟を起こされています。
- Anthropicは以前にも、Universal Musicから500曲以上の歌詞を不正使用したとして訴えられています。
今後の展望
この訴訟は、AI開発と著作権法の交錯点にある重要な問題を提起しています。今後、以下のような点が注目されるでしょう。
- AIトレーニングにおける「フェアユース」の解釈
- 著作権法のAI時代への適応
- AI企業と著作権者との間の新たな協力モデルの模索
AI技術の発展と著作権保護のバランスをどのようにとるか、今後の法廷での議論や判決が注目されます。この問題は、AI産業の今後の発展方向性に大きな影響を与える可能性があります。