チャットボット「ChatGPT」を少しでも試してみたことがあるなら、人工知能(AI)がどんなにすばらしいか(あるいは、恐ろしいか)ご存知でしょう。
ChatGPTは、プロンプト(質問文や依頼文)を与えると、ほぼどんなことでも、テキストを生成してくれます。プロンプトは、シンプルなものに限らず、考えつく限りどんな複雑なものでも対応可能です。
実はGoogleも、これと同様の技術を開発しています。ただし、GoogleのAIが生成するのは、詩やコンピュータープログラムなどではなく、音楽。そのAIがつくった音楽サンプルが、今公開されています。
Google発、音楽生成AI「MusicLM」とは?
Googleの音楽生成AIは「MusicLM」と呼ばれており、与えられたテキストプロンプトをもとに、質の高い数分間の音楽を生成するようデザインされています。
音楽を生成するAIは以前にも存在しましたが、Googleによれば、MusicLMのほうが、テキストプロンプトの内容をより正確に表現した音楽を生成できるうえに、音楽の質も、過去に存在したモデルより上だそうです。
自信たっぷりな言い方ですが、こちらの「MusicLM: Generating Music From Text」でそのサンプルを聴いてみれば、Googleがそれほど自信をもつのも当然だと思えるかもしれません。
AIが条件に沿った楽曲を生成
最初のセクションは、MusicLMが複雑なプロンプトから音楽を生成できることを示しています(OpenAIが開発したChatGPTが、ユーザーの依頼や質問に応じて立派な文章を生成するのと同じように)。
たとえば、MusicLMに、以下のようなテキストプロンプトを与えると、AIがこの条件に合った音楽を生成するわけです。
「アーケードゲームにあるようなサウンドトラック。アップテンポで陽気。耳に残るエレキギターのリフ。反復が多く、覚えやすいが、シンバルの大きな音やドラムロールなど、予想外のサウンドもある」
筆者が個人的に気に入ったのは、MusicLMサンプル公開サイト2ページ目の1曲目。
「ダンス向きのビートが力強く、ベースラインが際立つファンキーな曲。印象的なキーボードのメロディで、深みと複雑さが加わる」というテキストをもとに生成されました。
まさに、RPGゲーム「Stardew Valley」で流れてきそうなサウンドです。
ボーカルありの場合は…
けれども、「不気味の谷現象」の様相を呈してくるのは、MusicLMがボーカル入りの音楽を生成したときです。
公開されているサンプル曲の多くにはAIのボーカルが入っており、いい表現が思いつきませんが、「いかにもコンピューター」というサウンドもあれば、もっとリアルに感じられるサウンドもあります。
そして、こうしたボーカルの声は100%人工的に生成されたものだとわかったうえで聴くと、ちょっと不安になります。
Googleは、MusicLMにラップも生成させています。ラップの歌詞はみな実在しない言葉なのに、そのラップは本当に不気味なほどリアルなのです。
アレンジはアイデア次第で多種多様
有名楽曲のアレンジも可能
もっと背筋の寒くなるようなサンプル曲を聴きたいときは、ページを下にスクロールして「Text and Melody Conditioning(テキストとメロディの条件調整)」というセクションに進んでください。
「ジングルベル」「きらきら星」など、誰もが知るメロディを、さまざまな声や楽器で歌い、演奏するサウンドが聴けるのですが、なかなかすごいのです。
冒頭は、イタリアの名曲「さらば恋人よ(Bella Ciao)」をMusicLMがハミングしているサウンドで、あまりにも本物っぽくてAIとは思えません。
「Tribal drums and flute(民族的なドラムとフルート)」バージョンは、米ブラックコメディドラマ『ホワイト・ロータス/諸事情だらけのリゾートホテル』のオープニングソング風です。
「Long Generation(長い生成)」セクションでは、「melodic techno(メロディックなテクノ)」「relaxing jazz(リラックスできるジャズ)」などの短いプロンプトをもとに生成された5分バージョンを聴くことができます。
曲調に変化をつけるストーリーモードも
でも、いよいよ面白くなってくるのは「Story Mode(物語モード)」セクションでしょう。MusicMLが、15秒ごとのプロンプトに応じて、曲調を変えていくのです。
1曲目は、最初の15秒のプロンプトが「time to meditate(瞑想の時間)」で、次の15秒「time to wake up(目覚めの時間)」に入った瞬間、新たな小節がはじまったように曲調が変化し、それを強調するような薄気味悪いボーカルが加わります。
不気味なボーカルは別としても、AIが曲に手を加えながらも、曲が「変わっていない」ことには、とても興味を惹かれました。新しいテキストプロンプトが組み入れられてはいるものの、まったく違う曲に変わったという印象を受けることはほとんどありません。
特に印象に残るのは「Story Mode」の3曲目です。AIが、「pop song(ポップソング)」から「rock song(ロックソング)」、続いて「death metal song(デスメタル・ソング)」へと、15秒ごとに変化させていきます。
「ロックソング」はそれほどロックらしくないのですがが、「デスメタル・ソング」はまさに見事な出来栄え。メタルファンのあいだでAIデスメタルが大ヒットしてもおかしくないでしょう。
絵画をもとにした音楽も生成できる!?
Googleはほかにも、「Painting Caption Conditioning(絵画のキャプションの条件調整)」と称して、MusicLMに有名絵画をプロンプトとして与えて音楽を生成させるという、面白い実験をしています。
ゴッホの名作『星月夜』や、ムンクの『叫び』をもとにした音楽を聴いてみたいと思ったことがあるなら、その機会が到来したわけです。
また、MusicLMが生成した、特定の楽器やジャンルの曲をあれこれ聴いてみるのも楽しいでしょう。エレキギターはなかなかクールですし、「british indie rock(ブリティッシュ・インディーロック)」のエンディングはドラマチックです。
MusicLMのサンプル公開ページではほかにも、「アコーディオン・デスメタル」や「アコーディオン・ラップ」などがある「Accordion Solos」セクションから、同一プロンプトから生成されたさまざまな曲の聴き比べまで、あれこれ楽しむことができます。
Googleはさらに、MusicLMに関する15ページのリサーチ論文を公開しているので、このシステムの技術的な詳細に関心のある人は、ぜひご一読ください。
一般向けベータ版がリリースされるのを期待していますが、公開サンプルをあれこれ聴けるだけでも楽しめますよ。