トップQs
タイムライン
チャット
視点
Synthesizer V
ウィキペディアから
Remove ads
Synthesizer Vとは、Dreamtonicsが開発する歌声合成ソフトウェアシリーズである。 エディターソフトはSynthesizer V Editor、Synthesizer V Studio、Synthesizer V Studio 2の3世代があり、歌声データベースは初代に対応する第1世代(通称:R1)、Synthesizer V Studioに対応する第2世代(通称:R2、スタンダード(std))とSynthesizer V AI、Synthesizer V Studio 2に対応するSynthesizer V 2 AIが存在する[1][2]。
Remove ads
概要
音程と歌詞の入力によって、歌声を合成することができるソフトウェアシリーズである[1][3]。 開発者である華侃如(フア カンル、Kanru Hua)は本ソフトの開発以前から音声分析・合成用音声モデルを提供するCライブラリの「libllsm」(2015年)やUTAU用合成エンジンの一つである「MoreSampler」(2016年)などを発表し、Synthesizer V Editorリリース後の2019年2月にDreamtonics株式会社を設立した。Moresamplerはバージョン5.0以降において評価が高まっていったという。その頃に彼の5世代目のソフトウェアとなるSynthesizer Vの構想が固まりつつあった。本人曰く、良いものをつくるには4回ほどの失敗が必要と語っており、Synthesizer Vの「V」(数字の5を表す)の由来となっているという。[1][4][5] 従来のサンプルベース歌声合成とAIによる歌声合成のハイブリッド手法によるエンジンを搭載している[6][7]。歌声データベースは、当初は録音フレーズを集めたコーパスによって作られたものであったが、Synthesizer V AIの発売以降は歌唱データから機械学習によって作られたものとなっている[8][9]。機能拡張の実装や音声品質の強化を伴うアップデートも頻繁に行われている[5]。多言語での歌唱に対応しており、最新のSynthesizer V Studio 2では英語、中国語、日本語、広東語、スペイン語、韓国語での歌声合成が可能となっている。対応OSはWindows・Mac・Linuxの3種類。エディターソフトの保存形式はsvp形式(Synthesizer V Editorのみs5p形式)[10]。
Remove ads
エディター
要約
視点
Synthesizer V Editor
Synthesizer V Editorのエンジンは従来型の波形接続型音声合成と、ニューラルネットワークによる歌声合成技術を組み合わせたものとなっている[6]。フア曰く、libllsmのコードの一部は、本ソフトウェアのコードの一部になっているという[11][12]。 Synthesizer V Editorは2017年ごろから開発が始まり、英語版歌声データベースのENG-F1によるヤング・アンド・ビューティフル・日本語版歌声データベースのJA-F1による雪の華・中国語版歌声データベースのMAN-M1による茉莉花の3人の音声サンプルデモがSoundCloudで公開された[13]。2017年12月1日に開発が発表された[14][15]。Synthesizer V Editorに対応する歌声データベースはSynthesizer V Studioのリリース後にR1版とも呼ばれるようになる。 2018年8月19日に技術プレビュー版(ベータ版)が公開され、同年12月23日に正式にリリースされた。Synthesizer V Editorは起動の際、一定時間待つことで無料で評価版として全ての機能が使えるが、製品版を購入することでそれを省略できるようになっていた。[1]技術プレビュー版では、英語版データベースのエレノア・フォルテのみが利用可能であったが、正式リリースと同時に中国語版データベースの艾可(AiKO)、日本語版データベースのゲンブと闇音レンリが台湾のアニメ関連会社Animenにより発売または配布された[16]。
Web Syntheiszer V
2020年1月1日にWeb Syntheiszer Vが公開された。Web版では、ソフトウェア版の機能の一部のみが搭載されており、いわゆるソフトウェアの体験版として公開されたものである[17]。
Synthesizer V Studio
Synthesizer V Studioのエンジンは従来型の波形接続型音声合成と、AIによる歌声合成技術を組み合わせたものとなっている[7]。当初から、エディターは無料で機能が制限されたSynthesizer V Studio Basicと有償ですべての機能が使えるSynthesizer V Studio Proがある[3]。 2019年の年半頃にフアは、Synthesizer V Release 2(仮称)の開発を発表した[18][19]。その後、中国のクリエイターサークルの平行四界(Quadimension)は新エンジン対応中国語版データベースの赤羽のデモソングを2020年4月11日に公開する[20]。2020年6月26日に、日本のソフトウェア企業であるAHSによる販売が発表され、7月30日に発売される。日本語版データベースの琴葉茜・葵も同時発表、発売となった[21]。Synthesizer V Studio ProやSynthesizer V 琴葉 茜・葵は、パッケージとしても発売され、以後パッケージ版としての製品発売も行われるようになった。 本バージョンでは、MIDIファイルの読み込みのほか、VOCALOIDのvpr(VOCALOID 5・6)、vsqx(VOCALOID 3、4)、UTAUのust、CeVIOのccsからの読み込みにも対応している[22]。 2020年夏のアップデートでは、VST3やAudio Units環境下でも利用可能となるプラグインが導入された[23][24]。 2020年10月30日には、AI版の歌声データベースとなるSynthesizer V AIが発表された。これにより、エンジン・エディタに続いて歌声データベースもAI版となり、従来の歌声データベースはスタンダード版(std版、非公式にはR1版に対してR2とも)として区別されるようになった。[25] 同年12月25日に、AI版歌声データベースの第1弾となるSaki AIが発売された[26]。AI版データベースでは、収録言語以外の多言語の歌唱も可能となっているが、この機能はSynthesizer V Basicでは非対応となっている[27]。 2022年のアップデートでは、AIリテイク機能が実装される[28]。 2023年には、ラップ歌唱や広東語・スペイン語歌唱への対応、歌声にユーザーの好み反映する人間のフィードバックによる強化学習機能(RLHF機能)、ARA2プラグインへの対応等が順次実装された[3][29][30][31]。 2024年初頭に歌声の入った音声データから自動で音程と歌詞が入力される音声データのMIDI変換機能が実装された[32]。
Synthesizer V Studio 2
2024年12月25日にXで開発が発表[33]、アメリカ合衆国カリフォルニア州アナハイムのアナハイム・コンベンション・センターで開催されたNAMM2025(NAMM Show)でも展示された[34][35]。 アルゴリズムの改良やマルチスレッドの強化により、レンダリング速度がSynthesizer V Studioに比べ300%向上し、より自然な歌声合成を実現している。エクスプレッションパッドや韓国語歌唱の実装などインターフェースにも改善が施されている[36][2]。 Synthesizer V Studio 2 Proは2025年3月21日に発売された[37]。Synthesizer V Studio 2 Proの発売に伴い、旧エディターのSynthesizer V Studio Proの販売は終了された。
ユーザーインターフェース
Synthesizer V シリーズの操作画面は複数のエリアやパネル、バーに分かれており、以下にその一例を記す[38][39]。
- トランスポートエリア - データの再生・停止等を行う。
- トラックエリア - 各トラックの音量調節等を行う。
- ピアノロールエリア - メロディと歌詞の入力などを行う。
- パラメータパネル - 各種パラメータやボーカルスタイルを時間的な調節を加えることで、手動で表現を細かく変化させることができる。
- サイドバー - 使用するボーカルや歌唱言語を管理するボイスパネル、トラック中の選択したノートに対する調整を行うノートパネル、オーディオファイルに出力するレンダリングパネルなどの種々のサイドパネルの表示/非表示を行う。
パラメーター
パラメータパネルで調節できる項目は歌声のボリュームや太さなどを調節できる基本パラメーターとそれぞれの歌声データベース固有のボーカルスタイル(Synthesizer V EditorやSynthesizer V Basicは非対応)の主に2つに分けられる。 ボーカルスタイルは、歌声データベースによって数や種類が異なっている。例えば、Synthesizer V AI MaiではEmotionalとSoftの2種類があり[40]、Synthesizer V 2のUNIは、Whisper、Bright、Matureなど16種類のボーカルスタイルが存在する[41]。
AIリテイク機能
ノートパネルに搭載された機能。選択部分の歌い方を変化させたノートを自動生成する。生成するたびに歌い方が変化し、生成されたテイクの中から好きなものを採用することができる[3]。RLHFによる補正機能もある。
Remove ads
歌声データベース
要約
視点
Synthesizer V Studioのスタンダード版歌声データベースは、録音フレーズを集めたコーパスによるものであり、収録は東京にあるDreamtonicsスタジオで行われていた[8][9]。Synthesizer V AI以降の歌声データベースは、歌唱データから機械学習によって作られたものとなっており、スタジオ以外での収録にも対応するようになった[9]。 Synthesizer V Studioでは、一部歌声データベースに対して、歌唱合成の品質を下げ、機能を制限した無料のLite版や機能制限版(FLT版、ラップ音源のみ)も存在する[42][27][43]。 Synthesizer V Studio 2では7日間試用できるトライアル版がV2版データベース全てに提供されており、Lite版は無い。
歌声データベース一覧
Animen
Animenは台湾のエンターテイメント会社[44]。バーチャル・シンガー専門ブランド「VOLOR」としてSynthesizer Vを販売している[45]。
平行四界
平行四界(Quadimension)は中国のクリエイターサークル。バーチャルシンガーのプロジェクトの五维介质(MEDIUM⁵)として、企画、販売が行われている[54][55]。
Dreamtonics
他社製品と異なりいずれの製品もイメージキャラクターは設定されておらず、製品イメージとしてはSaki〜Kevinはアルファベット1文字、 默辰以降はアルファベット2文字のロゴマークが設定されている。
AHS
AHSはVOCALOIDやVOICEROID、VOICEPEAKなどを販売している日本のソフトウェア販売会社。
AUDIOLOGIE
Eclipsed Sounds
VOICEMITH
インターネット
インターネット(INTERNET)はVOCALOIDやDAW等を販売している日本のソフトウェア販売会社。
ブシロードミュージック
ブシロードミュージックは日本のレコード会社。メディアミックスプロジェクト「BanG Dream!」のキャラクターをモデルとした「夢ノ結唱プロジェクト」による製品[101]。
Studio ENTRE
Studio ENTREは日本のスタートアップスタジオ。アニメーション制作会社ゴンゾとのコラボレーション企画「GEMVOX」としてAIシンガーをプロモーションしている[105]。
ST MEDiA
一二三
一二三は日本の音楽プロダクション。グリーエンターテインメントと共同でボイスライブラリを発売した[107]。
未発売の歌声データベース
一般販売なし
Remove ads
脚注
注釈
関連項目
外部リンク
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads