AIは文章を書くことができ、スタジオジブリ風の画像を生成し、音楽を作曲することも可能ですが、著作権の問題に直面する可能性があり、そのレベルはさまざまです。しかし、音楽は最も複雑な分野です。
「音楽産業は長い歴史がありますが、音楽データの80%以上は音楽会社が握っています」とWavvの創業者である林奕汎氏は述べています。「では、あなたはどのようにAIを訓練しますか?」
AI生成音楽のスタートアップWavvの創業者であり、かつて『アサシン クリード』のグローバルツアー音楽監督を務めた林氏は、音楽理論の論理的な観点から解決策を見出したと考えています。Wavvは設立からわずか1年で、NASAや忠泰グループ傘下の百貨店などの顧客を獲得しました。
音楽がきっかけでAIとNASAに出会う
スタートアップとして、WavvはなぜNASAのような大企業の顧客をすぐに得られたのでしょうか?それは林奕汎氏の前の起業、Folkspaperに遡ります。
Folkspaperはブロックチェーン技術に基づくニュース性のあるソーシャルメディアで、2017年にボストンで設立され、急成長を遂げ、月間閲覧者数は1500万人に達しました。しかし、すべてが順調だったわけではなく、市場は誰のためにも止まることはありません。
2022年末、マスク氏がTwitterを買収しXに改名した後、数ヶ月の間にMastodonやBlueskyなどのソーシャルプラットフォームが次々と登場し、さらにChatGPTの登場による影響もあり、競争のプレッシャーを感じた林氏は、シリコンバレーに新たな成長の道を探しに行くことを決意しました。
「でも、シリコンバレーは全くの土地勘がなかったので、まずはオフラインイベントを開催し、現地の起業家たちと知り合う方法を考えました」と林氏は語ります。音楽のバックグラウンドを持つ彼は、音楽をテーマにしたソフトなパーティーから始めました。「実際、ここにいる起業家たちは多かれ少なかれ音楽を楽しんでいるので、チャンスがあると思いました。」
この方法は成功し、ますます多くの起業家がイベントに参加しました:NASAのディレクターやGoogleの共同創業者Sergey Brinも来ました。
「NASAのディレクターがイベント中に私と雑談をし、彼らが2週間後に日食をライブ配信する予定で、音楽について悩んでいると言ってきたので、私に何か作れるか尋ねてきました」と林氏は振り返ります。「私は可能だが3ヶ月かかると答えたところ、ディレクターは『あなたはAIの研究をしているんでしょう?それを組み合わせてみてはどうか』と言いました。」
AIはどのように著作権の問題のない音楽を生成するのか?音符を分解することから始まる
2週間後、NASAのライブ配信が始まり、その背景音楽はWavvチームが不眠不休で作り上げたものでした。その成果は素晴らしく、NASAはすぐに共同プレスリリースを発表しましたが、Wavvは当時まだ正式に設立されていませんでした。
林氏は、NASAの事例を通じて、Wavvは「商業利用の音楽を必要とする企業」を主要なターゲットに設定したと述べています。「有料音楽にはコストがかかり、著作権フリーの音楽には数量制限があり、ニーズに合わないこともあります。そこで、AI生成の音楽が役立つのですが、商業利用の場合、AI生成の音楽は一つの根本的な問いに直面します:あなたの訓練データはどこから来るのですか?」
言い換えれば、もしAIモデルの会社が著作権のある音楽を密かに使用して訓練すれば、訴訟リスクが生じます。音楽著作権会社から音楽を購入して訓練するために多額の資金を使うと、コストがかかりすぎる可能性があります。公開データを使用して訓練すれば、データ不足の問題が発生します。
この時、林氏の音楽のバックグラウンドが重要な要素となりました。
林氏は説明します。「英語の最小単位は26のアルファベットで、それを組み合わせて単語、文、段落、記事を作ります。音楽の最小単位は音符です。したがって、Wavvは音楽理論の知識と技術的能力を組み合わせ、音符、楽器、テンポの組み合わせルールをAIの訓練の基盤論理として使用し、著作権の問題のない音楽を創造しています。」
この技術的原理を達成することは容易ではなく、音符と音楽理論の理解力が試されます。「私たちは現在も最適化の段階にあり、最初の頃はAIが生成したものも非常に聞き苦しいものでした」と林氏は笑いながら言います。
一般企業だけでなく、ゲームエンターテインメント業界もWavvの未来の目標
現在、Wavvのビジネスモデルはカスタマイズされたサービスが中心で、音楽著作権のライセンス料を徴収し、徐々にサービスを標準化されたSaaS製品に移行しています。
台湾の顧客である忠泰グループ傘下の百貨店の例を挙げると、Wavvが提案したニーズは、B1のフードコートには軽快な音楽が欲しい、2階の美容コーナーには柔らかい音楽が必要だというものでした。この時、Wavvはこれらの形容詞とシーンの関連性や目的を分析します。前者の目標は回転率を上げることであり、後者は安全感を提供することです。その原理に基づいて適切なAI音楽を生成します。
今後、Wavvはこの技術をゲームに統合する可能性もあります。なぜなら、林氏は『アサシン クリード』のグローバルツアー音楽監督を務めていたからです。ゲームのストーリーの進行に応じて、その時の状況に合った音楽を生成するというものです。現在、Wavvはブロックチェーンとメタバースに深く関与しているゲームのRobloxとの協力を検討しています。
元々のFolkspaperとブロックチェーン技術はどうなったのでしょうか?
林氏は、Folkspaperはすでにサービスを終了し、チームはすべて現在の新しいプロジェクトWavvに移行したと認めています。Wavvの顧客はブロックチェーンに対して比較的無知であったため、林氏はブロックチェーン関連の技術部門を解散するという苦渋の決断を下しました。「この決定は本当に難しかったですが、私は起業はこういうものだと思っています:私たちは時代に合わせて新しい価値を創造しなければならないのです。」