ヤマハ株式会社(以下、当社)は本日8月22日(火)より、AIを活用した歌声合成の実証実験をスタートします。この実証実験では、音楽制作ソフト(Digital Audio Workstation: DAW)上で歌声合成を可能にする試作プラグイン『VX-β(ブイエックス ベータ)』をクリエイターに提供することで、従来の歌声合成の常識を覆すような楽曲を生み出してもらい、AI歌唱の新価値を検証します。
AIを活用した歌声合成のプラグイン「VX-β」編集画面
<企画背景>
当社は2003年より、歌声合成技術およびその応用ソフトウェア「VOCALOIDTM」を開発・販売してきました。実際の人間の声をもとに生成された歌声のデータ「ボイスバンク」を切り替えることで、さまざまな声で自由自在に歌わせることが可能になり、現在、「VOCALOID」を用いて制作された楽曲は「ボカロ曲」と呼ばれ、新世代の音楽として全世界のリスナーから支持され、高い人気を誇っています。
音楽制作の現場において、ドラムやストリングスなどの楽器の合成音は当たり前のようにクリエイターは使用しており、リスナーの多くもそれを当たり前のこととして受け入れています。「VOCALOID」もボカロ曲の制作にとどまらず、クリエイターにとってボーカル(歌声)を合成するための「当たり前の道具(楽器)」になる可能性を秘めていると考えています。
当社は歌声合成技術の進化を求めて研究を続けており、さまざまな技術試作を生み出しています。しかし、その試作も社内にとどまっている限り、その真価が見出されることはないと考えました。そこで今回、合成音声の常識を打ち破ることを目的とする研究スタジオ「VOCALOID β-STUDIO」を立ち上げ、初めての試みとして、技術試作であるAI歌声合成のプラグイン『VX-β』の一般公開に踏み切りました。クリエイターの解釈による自由な創作により、従来の歌声合成の常識を覆すような作品を生み出してもらいたいと考えています。そして、クリエイターの創作活動を元に試作プラグインを改良し、音楽制作において「今までなかった未来の当たり前」となる製品の開発につなげてまいります。
<VX-βの概要>
- 専用エディターからの脱却。「Cubase」と完全に一体化したワークフロー
- AI技術が可能にする、シンガーへのディレクションに近い操作感
- パラメーター変化を即座に歌い方に反映するリアルタイム合成エンジン
- さまざまなジャンルに対応する9つのボイスバンク
<主な特長>
1. 専用エディターからの脱却。「Cubase」と完全に一体化したワークフロー
『VX-β』は、当社のグループ会社であるSteinberg Media Technologies GmbHが開発するDAWソフトウェア「Cubase」において、歌詞やメロディの制作から歌声の作り込みまで、すべての制作プロセスがCubaseのエディター上で完結するよう開発されています。これまでのようにCubaseのエディターと、Cubaseで開いているバーチャルボーカルソフト専用エディターを行き来する必要はなくなり、スムーズな楽曲制作を実現します。なお、Cubase以外のDAWソフトでも『VX-β』は使用可能で、歌声の基となるシーケンスデータを『VX-β』に読み込ませることで、DAWソフト上で編集*が可能です。
*DAWでの歌詞・メロディの制作・修正ができるのはCubaseのみになります。
2. AI技術が可能にする、シンガーへのディレクションに近い操作感
『VX-β』には、任意のボイスバンクから選択できるAIシンガーの表現力を最大限に発揮させるパラメーター「Powerノブ」を搭載しました。これは、声の張りや息の混ぜ方、発音のアクセント、ビブラートといった歌唱表現に関わる要素をAIがまとめて変化させ、音楽的な音の強弱をAIシンガーの歌声に反映させるものです。クリエイターはPowerノブの操作により複雑な歌唱表現を生み出せるため、まるで本物のシンガーをディレクションしているような感覚で歌声合成を行えます。もちろん、クリエイター自身で細かなパラメーターを調整することで、より思い通りにニュアンスを作り込むことも可能です。
3. パラメーター操作を即座に歌い方に反映するリアルタイム合成エンジン
歌声のパラメーター変化に歌声合成エンジンがリアルタイムに応えるので、パラメーターを操作すれば歌声が即座に変化します。そのため、AIシンガーが歌っているまさにその最中に、歌唱表現のディレクションを与えるような体験が可能です。『VX-β』はクリエイターとAIシンガーがリアルタイムで対話しているかのような制作環境を提供することで、クリエイターの創作意欲を掻き立てます。
4. さまざまなジャンルに対応する9つのボイスバンク
ポップスやジャズ、ロック、アニメなどさまざまな音楽ジャンルに対応する9種類のボイスバンクが使用可能です。それぞれのボイスバンクでは、歌い手となるAIシンガーの声質や歌いまわしが異なる4つの歌唱スタイルが選択でき、一人のAIシンガーの歌唱スタイルをシームレスに変更しながら楽曲を制作できます。さらに、ボイスバンク「multi-β-N」には17人のAIシンガーを搭載しているため、複数のシンガーをシームレスに切り替えながら制作できます。クリエイターの自由な解釈による創作活動を支えます。
ボイスバンク | 声の特徴(得意言語) |
1. prtv_0 | 湧き立つ勇気と元気をくれるハツラツシンガーボイス。(日本語) |
2. prtv_1 | ときに優しく、ときにキュートに心と身体を包み込む魅惑のストリートシンガーボイス。(日本語) |
3. prtv_2 | ハイトーンにまでミドルエイジの渋みがきらめくスタジオシンガーボイス。(日本語) |
4. prtv_3 | 美しく透き通った歌声からパワフルなロングトーンまで歌い上げる正統派シンガーボイス。(英語) |
5. 我然β | 飽くなき自由を求めるオールドロックシンガーボイス。(日本語) |
6. nagiβ | 落ち着きと透明感のある男性ボイス。(日本語) |
7. multiβ-N | 複数のシンガーをスタイル毎に切り替えることのできる特別ボイス。(日本語) |
8. ゲキヤクβ | 強気で素朴な少女声。(日本語) |
9. カゼヒキβ | 中性的な掠れた声。(日本語) |
VOCALOID β-STUDIOの実証実験への参加お申し込みについて
「VOCALOID β-STUDIO」の公式ウェブサイト内の「JOIN」のページにあるVOCALOID β-STUDIO参加申し込みキャンペーンより、お申し込みください。
https://vocaloid.beta.yamaha.com/join/
お申し込みには、会員ID「Yamaha Music ID」への登録とアンケート回答が必要になります。配布可能なライセンス数に限りがあるため、参加登録は不定期に行う抽選で当選された方に限定いたします。詳しくは、VOCALOID β-STUDIO参加申し込みキャンペーンページをご参照ください。
「VOCALOID β-STUDIO」コンセプトムービー
ヤマハ 企業情報サイト/ニュースリリース
https://www.yamaha.com/ja/news_release/