音楽業界は常にテクノロジーの革新と共に発展してきた。そのような歴史を踏まえても、この業界は近年、生成AIの登場により、さらに劇的な転換期を迎えている。これまでにAIによる音声変換や音源分離といった技術が実用化され、さらに音楽自体を生成する作曲AIの登場により、音楽制作の可能性は大きく広がりつつある。
しかし、生成AIを活用した楽曲生成や音声模倣技術では、権利者に無断で作品や声が使用されるケースも増加している。こうした事態を受けて、ユニバーサル・ミュージックをはじめとする大手レーベルは、AI音楽生成サービスに対し著作権侵害を理由に訴訟を提起。この動きは、音楽業界全体での生成AI活用に対するルール整備が急務となっていることを示している。
このような変革期に注目されているのが、"バーチャルシンガー・初音ミク"の生みの親である伊藤博之氏が代表取締役を務める、クリプトン・フューチャー・メディアだ。同社は2024年にYouTubeと生成AIの音楽での活用に向けて協業を発表。さらにAI技術を用いた新しい歌声合成ソフトウェアとして、ヤマハのVOCALOID6を採用した「初音ミク V6 AI」のリリースを予定するなど、AIとの関係性を模索している。
かねてからAIに関する積極的な発信を行ってきた伊藤氏は、この目まぐるしく変化する音楽とAIとの関係性をどう捉えているのか? その答えを探るべく話を聞いた。
しかし、生成AIを活用した楽曲生成や音声模倣技術では、権利者に無断で作品や声が使用されるケースも増加している。こうした事態を受けて、ユニバーサル・ミュージックをはじめとする大手レーベルは、AI音楽生成サービスに対し著作権侵害を理由に訴訟を提起。この動きは、音楽業界全体での生成AI活用に対するルール整備が急務となっていることを示している。
このような変革期に注目されているのが、"バーチャルシンガー・初音ミク"の生みの親である伊藤博之氏が代表取締役を務める、クリプトン・フューチャー・メディアだ。同社は2024年にYouTubeと生成AIの音楽での活用に向けて協業を発表。さらにAI技術を用いた新しい歌声合成ソフトウェアとして、ヤマハのVOCALOID6を採用した「初音ミク V6 AI」のリリースを予定するなど、AIとの関係性を模索している。
かねてからAIに関する積極的な発信を行ってきた伊藤氏は、この目まぐるしく変化する音楽とAIとの関係性をどう捉えているのか? その答えを探るべく話を聞いた。
単純な解決を目指すのではなく、関係者間での折り合いを見いだしていく
音楽分野における生成AIの台頭は、クリエイティブな表現の可能性を広げる一方で、著作権に関する新たな課題を浮き彫りにしている。伊藤氏は、この問題の本質を理解する上で重要な視点を提示した。
「生成AIの本質は『置換』にあります。言葉から言葉への置換、言葉からメロディー、本、写真、動画への置換など、さまざまな形態の置換があります。しかし、このような置換は人間の脳の中でも同様に行われています」(伊藤氏)
伊藤氏によれば、人間は日々、さまざまな情報を見聞きし、それらを記憶として蓄積しながら「学習」している。この点において、人間の学習プロセスと生成AIの学習プロセスには、ある種の共通性が存在する。しかし、法的な解釈において、両者には決定的な違いがある。
人間の脳内での記憶や学習プロセスは、著作権法における「複製」には該当せず、法の対象外とされてきた。一方、生成AIという機械の中での同様のプロセスは「複製」とみなされる。つまり、生物としての人間と、機械としての「人間もどき」との間での法的解釈の違いが、現在の著作権問題の根幹にあるのだ。
その上で、伊藤氏は今後、何が正しい・間違っているといった単純な課題解決を目指すのではなく、関係者間で折り合いを見いだす必要性を指摘する。
その具体的なアプローチとして伊藤氏は、複製による学習の結果得られたものに対し、著作権者に適切な収益が還元されるエコシステムの構築を提案。「現状ではそのような仕組みは存在していませんが、今後、徐々にそういった折り合いをつけていく方向に進んでいく」と伊藤氏は展望を示す。
同時に、この問題を生成AI開発企業と著作権者という二者間の対立構図としてのみ捉えるのではなく、より広い視野で考察することの重要性も強調する。
「生成AIの本質は『置換』にあります。言葉から言葉への置換、言葉からメロディー、本、写真、動画への置換など、さまざまな形態の置換があります。しかし、このような置換は人間の脳の中でも同様に行われています」(伊藤氏)
伊藤氏によれば、人間は日々、さまざまな情報を見聞きし、それらを記憶として蓄積しながら「学習」している。この点において、人間の学習プロセスと生成AIの学習プロセスには、ある種の共通性が存在する。しかし、法的な解釈において、両者には決定的な違いがある。
人間の脳内での記憶や学習プロセスは、著作権法における「複製」には該当せず、法の対象外とされてきた。一方、生成AIという機械の中での同様のプロセスは「複製」とみなされる。つまり、生物としての人間と、機械としての「人間もどき」との間での法的解釈の違いが、現在の著作権問題の根幹にあるのだ。
その上で、伊藤氏は今後、何が正しい・間違っているといった単純な課題解決を目指すのではなく、関係者間で折り合いを見いだす必要性を指摘する。
その具体的なアプローチとして伊藤氏は、複製による学習の結果得られたものに対し、著作権者に適切な収益が還元されるエコシステムの構築を提案。「現状ではそのような仕組みは存在していませんが、今後、徐々にそういった折り合いをつけていく方向に進んでいく」と伊藤氏は展望を示す。
同時に、この問題を生成AI開発企業と著作権者という二者間の対立構図としてのみ捉えるのではなく、より広い視野で考察することの重要性も強調する。
生成AIにまつわる課題について語る伊藤氏
例えば、現在のDAW(楽曲制作ソフト)を使用した音楽制作環境では、年齢を問わず、誰もが音楽を作って発表できる環境が整っている。しかし、コンピュータ操作自体がハードルとなり、音楽制作者の男女比に偏りが生じている現状がある。
伊藤氏は、生成AIがこうした音楽制作におけるジェンダーの不均衡な状態を解消する可能性を秘めていると指摘する。また子どもの創作活動においても、生成AIにより頭の中のイメージをより解像度高く表現でき、大人には思いもよらないようなものが生成されるなど、新たな可能性が広がっているという。
ただ、生成AIがもたらす潜在的な価値は非常に大きい一方で、「我々はまだこの価値に慣れ親しんでいない」と伊藤氏は言う。そのため、著作権者は従来の価値観に基づく妥当な範囲での保護を求め、利用者側にも著作権侵害を避けるための慎重な配慮が求められているのが現状だ。
伊藤氏は、生成AIがこうした音楽制作におけるジェンダーの不均衡な状態を解消する可能性を秘めていると指摘する。また子どもの創作活動においても、生成AIにより頭の中のイメージをより解像度高く表現でき、大人には思いもよらないようなものが生成されるなど、新たな可能性が広がっているという。
ただ、生成AIがもたらす潜在的な価値は非常に大きい一方で、「我々はまだこの価値に慣れ親しんでいない」と伊藤氏は言う。そのため、著作権者は従来の価値観に基づく妥当な範囲での保護を求め、利用者側にも著作権侵害を避けるための慎重な配慮が求められているのが現状だ。
音楽クリエイターが求めるのは創造のパートナーとしてのAI
では、このような状況下で音楽クリエイターは、生成AIとどのように向き合っていけばよいのだろうか? 伊藤氏によると、生成AIを活用した音楽制作において、現在最も注目を集めているのは、楽曲を丸ごと自動生成する作曲AIだ。これは一見、画期的な技術革新のように思える。しかし伊藤氏は、音楽クリエイターにとっては、そうしたワンストップ型の作曲AIよりも制作支援型のAIツールの方が価値があると語る。
伊藤氏によると、現在の音楽生成AIは、リズムからボーカルまでAIが一括して作り出し、ユーザーは気に入ったものができるまで再生成を続ける「ガチャ」のような仕組みだ。
一方、制作支援型のAIツールの中には、指定したテンポやスタイルに合わせてドラムやピアノのフレーズを自動生成するものがある。そうしたAIツールでは、「このコード進行に合うジャズ風のピアノリフ」といった具体的な要望に応えることが可能だ。こういう制作支援型のAIツールを活用した創作プロセスは、人間同士のバンド活動における創作プロセスに近い形態だといえる。
そう考えると音楽クリエイターにとっては、楽曲全体を自動生成する作曲AIは必ずしも有用ではなく、むしろパートナーとして共に創作活動を行い、インスピレーションを与えてくれるAIツールが求められている。伊藤氏は、今後もクリエイターの創作活動を支援する同様のツールが増加していくと予想する。
また、音楽クリエイターの生成AI活用の可能性については、次のように考察する。
「音楽クリエイターが楽曲のイメージに合わせたミュージックビデオを制作する際に、生成AIが曲調に合った映像を提供するといった使い方が考えられます。今後は、自身の創作領域外でAIと協働しながら制作を行うクリエイターが増加するかもしれません」(伊藤氏)
さらに生成AIの将来的な可能性については、エレキギターやボーカロイドの歴史的な発展過程を例に挙げて、次のように説明する。
エレキギターは当初、アコースティックギターと比べて音質的に劣るとされていたが、その音の「ひずみ」のかっこよさこそがロックの発展を支える重要な要素となった。ボーカロイドも同様に、人間のボーカリストの代替として誕生したものの、機械特有の音声が独自の魅力となり、新たな表現を生み出してきた。
伊藤氏は「生成AIに求められているのは、必ずしも人間らしい表現とは限らないのではないか」という見解を示し、今後の生成AIの発展の可能性について、次のように期待を寄せる。
「エレキギターやボーカロイドと同じく、最初は人間の代替という位置付けからスタートしつつも、今後は生成AIならではのSF小説、動画、音楽など、人間には思いつかない発想による作品が登場し、新しい創作ジャンルとして発展する可能性があります。人間が想像できる範囲のものは、既に歴史の中で実現されています。しかし生成AIは、人間には実現できなかった新しい表現を生み出す可能性を秘めている。まだ具体例は見ていないものの、そのような表現が生まれることは楽しみにしています」(伊藤氏)
伊藤氏によると、現在の音楽生成AIは、リズムからボーカルまでAIが一括して作り出し、ユーザーは気に入ったものができるまで再生成を続ける「ガチャ」のような仕組みだ。
一方、制作支援型のAIツールの中には、指定したテンポやスタイルに合わせてドラムやピアノのフレーズを自動生成するものがある。そうしたAIツールでは、「このコード進行に合うジャズ風のピアノリフ」といった具体的な要望に応えることが可能だ。こういう制作支援型のAIツールを活用した創作プロセスは、人間同士のバンド活動における創作プロセスに近い形態だといえる。
そう考えると音楽クリエイターにとっては、楽曲全体を自動生成する作曲AIは必ずしも有用ではなく、むしろパートナーとして共に創作活動を行い、インスピレーションを与えてくれるAIツールが求められている。伊藤氏は、今後もクリエイターの創作活動を支援する同様のツールが増加していくと予想する。
また、音楽クリエイターの生成AI活用の可能性については、次のように考察する。
「音楽クリエイターが楽曲のイメージに合わせたミュージックビデオを制作する際に、生成AIが曲調に合った映像を提供するといった使い方が考えられます。今後は、自身の創作領域外でAIと協働しながら制作を行うクリエイターが増加するかもしれません」(伊藤氏)
さらに生成AIの将来的な可能性については、エレキギターやボーカロイドの歴史的な発展過程を例に挙げて、次のように説明する。
エレキギターは当初、アコースティックギターと比べて音質的に劣るとされていたが、その音の「ひずみ」のかっこよさこそがロックの発展を支える重要な要素となった。ボーカロイドも同様に、人間のボーカリストの代替として誕生したものの、機械特有の音声が独自の魅力となり、新たな表現を生み出してきた。
伊藤氏は「生成AIに求められているのは、必ずしも人間らしい表現とは限らないのではないか」という見解を示し、今後の生成AIの発展の可能性について、次のように期待を寄せる。
「エレキギターやボーカロイドと同じく、最初は人間の代替という位置付けからスタートしつつも、今後は生成AIならではのSF小説、動画、音楽など、人間には思いつかない発想による作品が登場し、新しい創作ジャンルとして発展する可能性があります。人間が想像できる範囲のものは、既に歴史の中で実現されています。しかし生成AIは、人間には実現できなかった新しい表現を生み出す可能性を秘めている。まだ具体例は見ていないものの、そのような表現が生まれることは楽しみにしています」(伊藤氏)
Jun Fukunaga
ライター・インタビュワー
音楽、映画を中心にフードや生活雑貨まで幅広く執筆する雑食性フリーランスライター・インタビュワー。最近はバーチャルライブ関連ネタ多め。DJと音楽制作も少々。