こんにちは!
ところてんです!
(=゚ω゚)ノ
2021年11月26日に「VOICEVOX」の更新版(Ver.0.9)が公開されたのを知ったので、早速試してみました。
★過去にも「VOICEVOX」の記事も書いていますので、宜しければ見てください。
「VOICEVOX」のダウンロード
以下のサイトからダウンロード可能です。
利用環境に応じて、任意のものを選択すれば良いと思います。
(どれが良いか迷う際は、初期状態(OS:Windows、対応モード:GPU/CPU、パッケージ:インストーラ)を選べば良いと思います。)
後は「利用規約」も確認した方が良いと思います。
ダウンロードについて、特に迷う事は無いと思いますが、簡単に手順を纏めておきます。
パッケージにZipファイルを選択した時
以下は、zipファイルを選択した時の手順となります。
インストールについて
特に迷う事は無いかもしれませんが、簡単に手順を纏めておきます。
「次へ」を押すと、上記のダウンロード画面が表示される。
ダウンロードが終わるまで、しばし待つ。
初回起動時について
「VOICEVOX」初回起動時に、各キャラのデフォルトのスタイル(喋り方)を選択します。
「赤枠」クリックでスタイル選択、「青枠」クリックでサンプル音声が聴けます。
他のキャラ(「ずんだもん」、「春日部つむぎ」、「波音リツ」)も同様に選択します。
なお、0.9版からの新規キャラ(「春日部つむぎ」、「波音リツ」)は、現時点で「ノーマル」のみ選択可能です。
※後から変更する場合、上記メニューの「設定」⇒「デフォルトスタイル・視聴」を選択すれば良いです。
「CPU/GPU」の切り替えについて
デフォルトでは、エンジンに「CPU」が選択されています。
動作要件を満たすグラボを所有しているなら「GPU」を選択する事も可能です。
なお、「3GB以上のメモリがあるNVIDIA製GPU」が必要となります。
切り替える際は、上記メニューの「設定」⇒「オプション」を選択後、「エンジンモード」で「GPU」を選択します。
他にも色々と設定項目がありますが、とりあえず動かして遊んでみるのが良いと思います。
実際に使ってみる
とりあえず、色々喋らせて遊んでみましょう♪
(・∀・)
テキトーに色々喋らせるだけでも、面白いですよね♪
テキスト文字を入れるだけで、ある程度自然な発音で喋ってくれるのは凄いですね!
(*‘∀‘)
操作方法など
まずは公式の紹介動画(ヒホ様作成)を見て、実際にソフトを動かし、不明点をヘルプで見る、というのが良いのかと思います。
なお、音声の調整などは、右端(赤枠)、および、下側(青枠)の項目から変更できます。
変更する際は、各項目「●」をドラッグ&ドロップすれば良いので、直感的で分かり易いと感じています。
「アクセント」句の補足
「アクセント」句に関して、ちょっと補足します。(なお、ヘルプに記載されています)
連結する
アクセントの間にマウスカーソルを合わせると、色が変わる(水色)ので、クリックすると連結されます。
分割する
文字間にマウスカーソルを合わせると、色が変わる(水色)ので、クリックすると分割されます。
VOICEVOXで喋らせた際の所要時間
前回と同様、実際にVOICEVOXで喋らせた際の所用時間を纏めました。
PC構成について
OS | Windows10 Pro 21H1 |
CPU | AMD Ryzen 9 3900 |
GPU | NVIDIA GeFore GTX 1060 3GB |
メモリ | 32GB |
ストレージ | CT1000P5SSD8 (NVMe SSD) |
前回と、ほぼほぼ同じ構成です。
GPUについても、ちょうど動作要件を満たしているので、検証には持ってこいですね
新しいグラボ欲しいですけど、まだまだ高価ですからねぇ
(´・ω・`)
喋らせた文言 | GPU所要時間 | CPU所要時間 |
---|---|---|
おはようございます | 1秒 | 1.2秒 |
microsoftのwindows10はスタンダードなOSです | 1.8秒 | 2秒 |
お団子の種類で一番なのは、醤油も捨てがたいですけれど、やはり定番の餡団子で決まりですよね | 2秒 | 3.7秒 |
何言っているんですか、ずんだ餡が最高に決まっているじゃないですか! | 2秒 | 2.5秒 |
あ、だんごといえば、肉団子のカレーは美味しいよねー | 1.7秒 | 2秒 |
お前ら、チョコと団子を組み合わせたチョコマントも忘れるな! | 2秒 | 2.2秒 |
前回(Ver0.2)からの比較となりますが、前回上手く出力できなかった長さについても、しっかり出力できました♪
やはりGPUを利用した方が、所要時間は短めで、長い文章を喋らせるほど、CPUとの差が広がるといった結果になりました。
ただ、CPUを使った場合でも十分な速度が出ている(上記フレーズで2、3秒程度)ので、無理にグラボを購入する必要は無いかも、といった所感です。
あと補足ですが、現状では文字数制限(80文字程度)(※)があるので、適当な箇所で区切る等、工夫が必要です。
(※)あくまで警告なだけで、実際には出力可能な可能性もあります。
「A.I.VOICE」との比較
比較については、過去の記事に纏めています。
まとめ
今回「VOICEVOX」(ver.0.9)を触ってみましたが、前回(ver.0.2)と比較し、ソフトウェアの速度向上、使用キャラの追加等、大きく進化していると感じました。
本ソフトは、使用方法が視覚的に理解し易く、難しい設定が少ないので、とても使いやすい優れたソフトだと感じました。
(=゚ω゚)ノ
近々、新キャラも追加されるようで、今後のアップデート情報にも注目が集まりそうですね!
最後に、ワタクシは「みたらし団子」も大好きですw
( ゚Д゚)
コメント