All photos by courtesy of SuperHeadz INa Babylon.

English
English

コラム column

2023年4月27日

著作権肖像権・パブリシティ権IT・インターネットAI・ロボットエンタメ

「~AI社会の到来に備える~
 AI学習が許されるのはなぜ?AI生成物が著作権、隣接権、肖像権を侵害する?」

弁護士  寺内康介 (骨董通り法律事務所 for the Arts)

目次

第1 導入
第2 AIによる学習段階
 1 AIによる著作物(イラスト、写真、文章、楽曲等)の学習
 2 AIによる実演(歌唱・演奏、演技等)の学習
第3 AIによる生成と権利侵害
 1 AIによる作品の生成と著作権侵害の成否
 2 AIによる実演の生成と著作隣接権侵害の成否
 3 AIによる生成と肖像権、パブリシティ権侵害の成否
 4 AIによる生成とディープフェイク

第1 導入

2022年夏、Stable Diffusion、Midjourneyなどの画像生成AIがイラスト業界を中心に衝撃を与え、今度はテキスト生成AIであるChatGPTがホワイトカラーの職域を脅かす勢いです。こうした不安からか、AIによる学習に著作物を利用できるとした著作権法の規定も再注目されています * 。また、万人がAIを使えば、AI生成物による権利侵害はより身近な問題となるでしょう。
本コラムでは、AIによる学習段階と生成段階に分け、AI学習に関する著作権法の規定を振り返るとともに、生成物による権利侵害について検討します ** 。果たして法律は、人類は、AIの進化に追いつけているのでしょうか。

* 2023/4/12朝日新聞「AIの無断学習、日本の著作権法ではOK 侵害にあたるケースは」、2023/4/13日本経済新聞「日本は生成AI天国か 著作物『学び放題』に危機感も
** 本コラムで取り上げていないAI生成物の著作物性などは、福井弁護士のこちらのコラムや、出井弁護士のこちらの論文もご参照ください。

第2 AIによる学習段階

1 AIによる著作物(イラスト、写真、文章、楽曲等)の学習

■ 日本の著作権法では、AIによる著作物の学習利用に権利者の許諾は原則不要

日本の著作権法では、AIによる学習のために著作物を利用することは、営利・非営利を問わず基本的に認められています(30条の4) * 。

* 本来、著作物の「複製」等には権利者の許諾が必要であるため、AIの学習過程で著作物をコンピュータに取り込む(複製する)等には著作権者の許諾が必要となるところ、30条の4で、AI学習のための利用であれば許諾なく複製等ができると規定されています。

実は、機械学習のための複製を無許諾で行えることは、2009(平成21)年の著作権法改正で導入されています(当時の47条の7)。2018(平成30)年改正で導入された30条の4は、深層学習(人間から教わらずとも、AI自身がデータから学習すべき特徴部分を選び出すといったもの)での利用も許諾なくできることなどを明確にしたものです。
このように日本でAI学習のために著作物を利用することは認められていますが、生成AIの広がりを受けこの規定が再注目されているため、少し掘り下げてみたいと思います。

なお、海外では、Stable DiffusionやMidjourneyに対し、AIが無許諾で作品を学習することは認められないなどとして訴訟が起こされています(アーティストによる集団訴訟やストックフォト会社であるGetty Imagesによる訴訟)。例えば米国では日本法のようにAI学習を認める明示的規定はなく、フェアユース(著作物の利用目的や利用部分、原作品の売上げへの影響などを考慮し公正な利用といえれば無許諾での利用を認める包括規定)として許されるかの問題です。訴訟でもこの点が争われるでしょう。

■ AIによる著作物の学習利用に権利者の許諾が不要なのはなぜか?

30条の4を見てみましょう。著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合(非享受利用)は、著作物を許諾なく利用できるとする規定です。AIによる学習は、非享受利用の一例として挙げられている「情報解析」に当たります(2号)。

著作権法30条の4(著作物に表現された思想又は感情の享受を目的としない利用)
著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
1号 略
2号 情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう。(略))の用に供する場合
3号 略

非享受利用に著作権者の許諾が原則不要とされている理由は、文化庁の説明や法改正前の議論*を筆者なりに解釈すると、以下です。

著作物の経済的価値とは、究極的には、視聴者が著作物を視聴して知的・精神的欲求を満たす(表現を享受する)ために支払う対価にあります。著作権法は、著作者がこの対価を回収できる仕組みとして、著作者に対し、視聴者による表現享受の前段階(流通段階)である複製、ネット送信、頒布等の利用行為を禁止できる権利を与えました。これにより著作者は、「私の作品を複製するのであれば利用料を払ってください」などと言え、対価を確保できるわけです。
もっとも、デジタル化が進み、表現の享受に向けられない複製等が発生するようになりました。ウェブサイトを閲覧した際にパソコン内に残る画像データの「キャッシュ」もその一例です。この複製につき著作者に対価回収の機会を与えずとも通常は著作者の利益は害されないでしょう。他方、こうした利用に許諾を必要とすればデジタル技術の発展を阻害しかねません。著作物の「保護と利用のバランス」を考慮し、表現の享受に向けられない利用に著作権者の許諾は原則不要とされたといえます。

そして、AIによる学習のために著作物を読み込む(複製)することは表現の享受に当たらないとされています。文化庁の前述「基本的考え方」(10頁)によれば、著作権法が著作者に対価回収の機会を与えたのは、基本的に人間による著作物の表現の享受に向けられたものであり、AIによる学習のために著作物を取り込むことは表現の享受に当たらない * と説明されています。

* これは、おそらく単に機械に読み込ませるからでなく、AIによる学習は、著作物から特徴、特性を定量的な数値として抽出、蓄積していく作業であり、人間が著作物を視聴して知的・精神的欲求を満たす(表現を享受する)ことには向けられていないということと思われます。2009(平成21)年1月文化審議会著作権分科会「文化審議会著作権分科会報告書」86頁参照

■ 学習利用でも許諾が必要となる場合:特定作家の作品のみ学習する場合は?

30条の4には「著作権者の利益を不当に害することとなる場合は、この限りでない。」との但し書きがあります。この但し書きは、文化庁による前述「基本的な考え方」(9頁)では、「著作権者の著作物の利用市場と衝突するか、あるいは将来における著作物の潜在的市場を阻害するか」の観点から判断されるとあります。

例えば、特定の作家の作品のみ学習し、「〇〇風イラスト生成AI」や、「〇〇風テキスト生成AI」を開発する場合はどうでしょうか。現に、ジブリの長編映画画像を学習させた、ジブリ風の画像を生成するGhibli Diffusionなるものもあるようです。

あくまで学習のための複製であって表現を享受しない利用方法であること、著作権法はアイディアや作風の類似を許容していること、もし出力段階で既存作品に類似するコンテンツが生成されれば別途著作権侵害の問題になること(後述)等から、AIが特定の作家の作品を学習(複製)する行為も「著作権者の利益を不当に害しない」とする考えもあり得ます。
他方、AIによる生成は、人間が作風を真似る場合と比較にならない量のコンテンツを生み出すため、〇〇風イラスト生成AI開発のための作品の学習が、当該作家に不当な不利益を与えないか、検討の必要はありそうです。

この点の結論はすぐには出せませんが、誰もがAIによる生成をできる現在の状況を考慮し、検討がされるべきと考えます。また、「潜在的市場(potential market)への影響」は米国フェアユース規定での考慮要素の1つですので、上述の米国の訴訟の行方も気になるところです。

なお、学習行為の適法性が仮にクリアされるとしても、権利者に許諾を得ておく選択肢はありそうです。すなわち、特定の作家の作品のみ学習したAIは、汎用型のAIに比べ、生成物が既存作品に類似するケースが相対的に高いように思われます。そのため、利用者(特にビジネス利用を検討するユーザー)にとっては、作家の協力を得たサービスの方が使いやすい面はありそうです。
例えば、「いらすとや」風のイラストを生成できる「AIいらすとや」とのサービスは、いらすとやの「みふねたかし」氏協力のもと行われているようです。いらすとやはビジネス利用も多いでしょうし、ユーザーにとっての安心感はあるでしょう。

2 AIによる実演(歌唱・演奏、演技等)の学習

■ AIによる実演の学習利用に権利者の許諾は原則不要

ここまでAIによる著作物の学習を見てみましたが、実演の学習はどうでしょうか。著作権法では、著作物を演じたり、これに類する芸能的な行為が「実演」とされています(2条1項3号)。例えば、楽曲の歌唱・演奏、ダンス、声優・俳優による演技、漫才、モノマネなどです(実演をする人がプロか否かは問いません)。

これらの実演には「著作隣接権」が発生し、原則として許諾なく録音・録画等ができません(録音・録画権等)。そうすると、AIによる学習の過程で実演をコンピュータに取り込む(録音・録画する)には実演家の許諾が必要になりそうですが、上述の著作権法30条の4は、著作隣接権にも準用されています(102条1項)。
そのため、著作物の場合と同様、基本的に、AI開発のために実演を無許諾で学習をさせることができます。アーティストの歌唱・演奏、声優の声による演技など収集して学習することに許諾はいらないということです。

■ 学習利用でも許諾が必要となる場合:特定の実演家の実演のみ学習する場合は?

例えば、特定の声優の演技をAIが学習し、本人そっくりの合成音声で新たな作品を読ませる、演技させることも認められるでしょうか。

著作物の場合と同様、そのような目的で特定の声優の演技を学習すること自体が、「(実演家の)利益を不当に害するか」(102条1項が準用する30条の4但し書き)は検討の必要がありそうです。

この点、本人そっくりの合成音声の開発は、既存の実演とは異なるコンテンツを生成するものであり、そのための学習は既存の実演の利用市場、潜在的市場と衝突しない(したがって、無許諾で特定の実演家の実演のみ学習することも可能)という考えもありそうです。

他方、特定の声優の実演等を学習した合成音声が大量に生成され、その音声ばかりが利用されかねないことによる声優の不利益はどうでしょうか。最近の事例からは、こういった事態も現実味を帯びてきているように感じます。
例えば、プロダクション協力のもと行われたものですが、故・内海賢二を含む声優の声を学習したAI音声が朗読を行うサービスがあります。以下の動画にて生成された音声を聞くことができますが、ぱっと聞いて合成音声とわからないほど自然に感じます *

* なお、特に内海氏のナレーション部分(動画6:44~)には、特別な気持ちを抱く方も少なくないかと思います。このような故人をよみがえらせる取組みに関する権利関係は、福井弁護士のこちらの論文が詳しく取り上げています。

また、こちらの記事には、米国では声優に自分の声の権利を渡すようサインを求める例が増えているとの指摘もあり、現に全米声優協会(NAVA)はそうした契約への注意喚起をしているようです。

このような音声合成技術の進歩も踏まえ、特定の声優の声を再現するために無許諾で実演を学習することが、声優の利益(著作隣接権を有する者の利益 * )を不当に害しないか、慎重な検討が必要に思われます。

* 故人をよみがえさせる場合、著作隣接権の相続・譲渡を受けた人の利益を不当に害しないかとの問題になると思われます。

ただし、以上は「実演」に該当する音声であり、これに該当しない(演じていない)通常の会話の音声など「声そのもの」には、権利は発生していないと解されます。そうすると、実演に当たらない「声」自体を収集してAIが学習することは禁止されないと解されます(盗聴などプライバシー・通信の秘密に関する点や、個人情報保護への配慮は別途必要です)。
こういった学習を経た音声合成AIによる生成の問題は後述します。

第3 AIによる作品の生成と権利侵害

AIを利用するか否かに関わらず、コンテンツを発信する以上、著作権、著作隣接権、肖像権、パブリシティ権等さまざまな権利への配慮が必要です。全てを取り上げることは困難ですが、AI特有の問題を中心に、概観してみたいと思います。

1 AIによる作品の生成と著作権侵害の成否

■ 「類似性」は人間同士の著作物の場合と同様、「依拠」はAI独自の問題

出力したイラスト、文章、音楽等が既存著作物と似ている場合、著作権侵害となるでしょうか。例えば画像生成AIの生成画像が既存著作物に似ている場合や、ChatGPTの回答が既存の著作物性のある文章と類似している場合などです。

著作権侵害(複製権、翻案権侵害)には、依拠と類似性が必要とされます。このうち「類似性」は、人間同士の創作物との場合と同様、既存作品とAI生成物を比べて類似性があるかの問題です。

これに対し、生成AIを利用したユーザーに既存作品への「依拠」(「依拠」をどう捉えるかも議論がありますが、ここでは、他人の著作物に触れ、それを自己の作品に取り入れることとします)が認められるでしょうか。

この点は2017(平成29)年にかけて開催された内閣府知財戦略本部の検討委員会でも議論されたものの、結論は出ず今後の課題とされました。

依拠を否定する考えは、AIは既存著作物から学習したパラメータに基づき新たなコンテンツを生成するのであって既存著作物のアイディアを利用しているにすぎない * 、ユーザーは学習用データに含まれる内容を知らないため依拠が認められればAI活用を萎縮させるといった辺りが根拠といえます(上記検討委員会報告書37、38頁)。

* 「既存著作物を学習しているのにアイディアしか利用していない」というのは一見理解しにくいところです。これは、表現ではなくアイディアのみに依った場合は「依拠」はないとの考えの下で、AIは、既存作品の特性・特徴を学習・数値化して学習モデルを作り、ユーザーの指示を受け生成する際はこの学習モデルを基に生成するのであって既存作品を参照していない(既存作品の表現に依拠していない)、というものと理解されます。なお、この点に関連し、既存作品が潜在意識にあったにすぎなくとも著作権侵害を認めた米国の裁判例の存在も気になるところです。これは、元ビートルズのジョージ・ハリスンが楽曲「マイ・スィート・ロード」を作ったところ、シフォンズというグループの楽曲に似ているとして訴えられたものです。シフォンズの楽曲は大ヒット曲でハリスンも聴いたことがあったはずである一方、裁判所は、ハリスンはシフォンズの曲を使うとの意識まではなかった(潜在意識下にシフォンズの曲があったにすぎない)と考えましたが、それでも著作権侵害としました(福井健策「著作権とは何か~文化と創造のゆくえ」(改訂版)90頁参照)。AIが学習モデルを作る際に利用した既存作品の位置づけと似ているという考えもあるかもしれません。

これに対し、依拠を肯定する考えは、AI生成物につき依拠を一律否定すると、実際にはAIを使わずとも「AIを利用した」と言い逃れに使われる可能性がある、AIが学習の過程で原作品にアクセスしている以上依拠は肯定されるといった辺りが根拠でしょう(検討委員会報告書37頁)。

この点もまだ確立した考えがないところですが、著作権侵害に「依拠」が求められる根拠は、偶然の一致を許し独自の創作を保護すること(これにより創作活動の発展を図ること)にあるとすれば、ユーザーが既存著作物を学習したツール(生成AIモデル)を利用している以上は、独自の創作でなく、依拠を認めることもあり得るようには思います。なお、その場合も当該AIが学習段階で該当の既存作品を学習しているか判明するかの問題もあるでしょう。

ただし、上記依拠の議論にかかわらず、ユーザー自身が既存作品に触れているといえる場合もありそうです。例えば、mimic * のようにユーザーが画像をAIに読み込ませ別画像を生成するサービスで、読み込ませた画像に類似する生成物の侵害が問題となる場面では、自ら画像を入れている以上「依拠」は認められるように思われます。

* なお、mimicは自分が描いたイラストをAIに学習させると、自分の作風でイラストを自動生成してくれるサービスであり、他人のイラストのアップロードは禁止されています。規約を守った利用であればこういった問題は生じないでしょう。

以上のとおり、AIによりコンテンツを生成した際に、既存著作物への依拠が認めるかは議論があるところです。ユーザーとしては、少なくとも現段階では、既存作品に類似する生成物は著作権侵害となる可能性もあることを念頭において活用すべきと考えます。

2 AIによる実演の生成と著作隣接権侵害の成否

■ 実演そのものを使用しているか?

実演家には、著作隣接権の1つとして録音権・録画権があります(著作権法91条)。これは実演そのものの録音・録画を禁止できる権利です。逆に、実演そのものが利用されない限り、過去の実演に似た歌唱・演奏・演技等がされても録音権・録画権侵害とはなりません。

この点、AIによる生成は通常、既存の実演から学習したパラメータを利用して新たな実演が生成されるため、AI生成物に過去の実演がそのまま再現されていなければ、録音権・録画権侵害は成立しないとなりそうです(パブリシティ権については次項参照)。
他方、(学習モデル生成のための元データが少ないなど何らかの事情で)もしAI生成物に過去の実演が再現された場合はどうでしょうか。これは、従来の音源のサンプリングの議論が参考になりそうです。音源のサンプリングでは、大まかには、ごく一部でも音源が使われていれば侵害という考えと、元の音源を識別できる程度に使用されていれば侵害という考えがあります(サンプリングについて詳細は中川弁護士のこちらのコラムもご参照ください。)。

3 AIによる生成と肖像権、パブリシティ権侵害の成否

■ 肖像権

肖像権の意識の高まりとともに、コンテンツにおいて肖像権をどう処理すればよいか、現場の悩みは多くあります。
そのような中、AI技術を活用して実在の人物でない顔を生成し、肖像権の心配のない素材を提供するサービスが増えています。

AIによる生成では既存画像から学習したパラメータを利用して新たな肖像が生成されますが、大量に生成されるAI画像の中には偶然実在人物と似るものがあるかもしれません。結果としての生成画像が実在の人物に相当似ている場合に肖像権侵害になり得るでしょうか。

肖像権は法律に規定はなく、判例で認められた権利ですが(詳細は福井弁護士のこちらのコラムもご参照ください。)、判例の侵害成否の基準は、①被写体の社会的地位、②撮影された活動内容、③撮影場所、④撮影態様、⑤撮影目的、⑥撮影の必要性を総合考慮し、受忍限度を超えるかどうかというもので、写真の公開についても同様です(最高裁2005(平成17)年11月10日判決)。

従来の裁判例でも、肖像写真そのでない、イラスト画や加工された顔写真も肖像権を侵害しうるとされてきましたが、これらはあくまで本人として描かれたり、本人の写真に後から加工されているものといえます。
これに対し、偶然本人に相当似た(本人と誤解される)AI生成画像の公開が「受忍限度」を超えるのか、上記裁判例の考慮要素から判断がつくか、今後の検討課題といえます * 。

* 公開の際に、「AIが生成した顔であって実在の人物ではない」と表示することで、実在の人物が誤解を受ける不利益を減らせるかといった議論もありそうです。

■ パブリシティ権

著名人の氏名や肖像等が持つ顧客吸引力を使用する権利は「パブリシティ権」として保護され、他人が、専ら顧客吸引力を目的に著名人の氏名や肖像等を無断利用することはパブリシティ権侵害となります。

例えば、有名声優、歌手の実演などを学習してそっくりな合成音声を作り、CMに利用する場合などはどうでしょうか。

実際に声のパブリシティ権を認めたアメリカの事例もあります(内藤篤・田代貞之「パブリシティ権概説」(第2版)211頁以下参照)。
これは、1980年代に、フォードモーターズがテレビコマーシャルにベッド・ミドラーを起用しようとしたところ断られ、そっくりさんに歌わせて(なりすまして)コマーシャルを制作した事例です。この件で裁判所(連邦控訴審)は、カリフォルニア州のコモン・ロー上のパブリシティ権を侵害したと判示しました。
他方、声のパブリシティ権を認めなかった他の米国裁判例もあり、また、日本での同様の裁判例は見当たりません。
そのため、侵害の成否判断は難しいものの、上記想定例を無許諾で行えるかというと、疑問はありそうです。

4 AIによる生成とディープフェイク

生成AIの発展により、これまで主に研究者や企業が利用していたAIが、誰もが手元で使えるようになり、ディープフェイクが増える可能性はあります。

現に、トランプ元大統領が逮捕されたとのフェイク画像や、エマワトソンの合成音声で「わが闘争」を読み上げさせたケース、日本で昨年物議をかもした静岡県の水害のフェイク画像は、いずれも生成AIを利用して作られたと報道されています。

日本では、このようなディープフェイク自体を規制する法律は存在せず、刑事上の責任は、生成物の内容に応じて、名誉毀損、偽計業務妨害・信用毀損、著作権法違反、わいせつ物頒布等罪などが考えられます。
ただし、静岡県の水害のフェイク画像は、他人の元画像など利用していなければ、上記には当たらなそうです。

こういった例への対応を全て法規制で行うことのみが正解ではないと思いますが、ガイドライン、利用規約などの工夫も重要性を増すように思われます。


以上、生成AIの法律関係をみてきました。
これ以外にも個人情報保護など含め課題はいくつもありますが、今回はここまでとしておきます。

なお、本コラムの校正にはChatGPTが協力しました。
大胆な要約から「てにをは」の修正、的確な言い換えも多く大変役立った一方、AIに頼る怖さを感じたことを記し、本コラムを締めたいと思います。

以上

弁護士 寺内康介のコラム一覧

■ 関連記事

※本サイト上の文章は、すべて一般的な情報提供のために掲載するものであり、
法的若しくは専門的なアドバイスを目的とするものではありません。
※文章内容には適宜訂正や追加がおこなわれることがあります。
ページ上へ