テキスト読み上げソフト【VOICEVOX】(Ver0.9)を試す

IT関連
スポンサーリンク

こんにちは!

ところてんです!

(=゚ω゚)ノ

2021年11月26日に「VOICEVOX」の更新版(Ver.0.9)が公開されたのを知ったので、早速試してみました。

★過去にも「VOICEVOX」の記事も書いていますので、宜しければ見てください。

「VOICEVOX」のダウンロード

以下のサイトからダウンロード可能です。

VOICEVOX | 無料のテキスト読み上げソフトウェア
無料で使える中品質なテキスト読み上げソフトウェア。商用・非商用問わず無料で、誰でも簡単にお使いいただけます。イントネーションを詳細に調整することも可能です。

利用環境に応じて、任意のものを選択すれば良いと思います。

(どれが良いか迷う際は、初期状態(OS:Windows、対応モード:GPU/CPU、パッケージ:インストーラ)を選べば良いと思います。)

後は「利用規約」も確認した方が良いと思います。

ダウンロードについて、特に迷う事は無いと思いますが、簡単に手順を纏めておきます。

パッケージにZipファイルを選択した時

以下は、zipファイルを選択した時の手順となります。

インストールについて

特に迷う事は無いかもしれませんが、簡単に手順を纏めておきます。

「次へ」を押すと、上記のダウンロード画面が表示される。

ダウンロードが終わるまで、しばし待つ。

初回起動時について

「VOICEVOX」初回起動時に、各キャラのデフォルトのスタイル(喋り方)を選択します。

赤枠」クリックでスタイル選択、「青枠」クリックでサンプル音声が聴けます。

他のキャラ(「ずんだもん」、「春日部つむぎ」、「波音リツ」)も同様に選択します。

なお、0.9版からの新規キャラ(「春日部つむぎ」、「波音リツ」)は、現時点で「ノーマル」のみ選択可能です。

※後から変更する場合、上記メニューの「設定」⇒「デフォルトスタイル・視聴」を選択すれば良いです。

「CPU/GPU」の切り替えについて

デフォルトでは、エンジンに「CPU」が選択されています。

動作要件を満たすグラボを所有しているなら「GPU」を選択する事も可能です。

なお、「3GB以上のメモリがあるNVIDIA製GPU」が必要となります。

切り替える際は、上記メニューの「設定」⇒「オプション」を選択後、「エンジンモード」で「GPU」を選択します。

他にも色々と設定項目がありますが、とりあえず動かして遊んでみるのが良いと思います。

実際に使ってみる

とりあえず、色々喋らせて遊んでみましょう♪

(・∀・)

テキトーに色々喋らせるだけでも、面白いですよね♪

テキスト文字を入れるだけで、ある程度自然な発音で喋ってくれるのは凄いですね!

(*‘∀‘)

操作方法など

まずは公式の紹介動画(ヒホ様作成)を見て、実際にソフトを動かし、不明点をヘルプで見る、というのが良いのかと思います。

なお、音声の調整などは、右端(赤枠)、および、下側(青枠)の項目から変更できます。

変更する際は、各項目「●」をドラッグ&ドロップすれば良いので、直感的で分かり易いと感じています。

「アクセント」句の補足

「アクセント」句に関して、ちょっと補足します。(なお、ヘルプに記載されています)

連結する

アクセントの間にマウスカーソルを合わせると、色が変わる(水色)ので、クリックすると連結されます。

分割する

文字間にマウスカーソルを合わせると、色が変わる(水色)ので、クリックすると分割されます。

VOICEVOXで喋らせた際の所要時間

前回と同様、実際にVOICEVOXで喋らせた際の所用時間を纏めました。

PC構成について

OSWindows10 Pro 21H1
CPUAMD Ryzen 9 3900
GPUNVIDIA GeFore GTX 1060 3GB
メモリ32GB
ストレージCT1000P5SSD8 (NVMe SSD)

前回と、ほぼほぼ同じ構成です。

GPUについても、ちょうど動作要件を満たしているので、検証には持ってこいですね

新しいグラボ欲しいですけど、まだまだ高価ですからねぇ

(´・ω・`)

喋らせた文言GPU所要時間CPU所要時間
おはようございます1秒1.2秒
microsoftのwindows10はスタンダードなOSです1.8秒2秒
お団子の種類で一番なのは、醤油も捨てがたいですけれど、やはり定番の餡団子で決まりですよね2秒3.7秒
何言っているんですか、ずんだ餡が最高に決まっているじゃないですか!2秒2.5秒
あ、だんごといえば、肉団子のカレーは美味しいよねー1.7秒2秒
お前ら、チョコと団子を組み合わせたチョコマントも忘れるな!2秒2.2秒

前回(Ver0.2)からの比較となりますが、前回上手く出力できなかった長さについても、しっかり出力できました♪

やはりGPUを利用した方が、所要時間は短めで、長い文章を喋らせるほど、CPUとの差が広がるといった結果になりました。

ただ、CPUを使った場合でも十分な速度が出ている(上記フレーズで2、3秒程度)ので、無理にグラボを購入する必要は無いかも、といった所感です。

あと補足ですが、現状では文字数制限(80文字程度)(※)があるので、適当な箇所で区切る等、工夫が必要です。

(※)あくまで警告なだけで、実際には出力可能な可能性もあります。

「A.I.VOICE」との比較

比較については、過去の記事に纏めています。

まとめ

今回「VOICEVOX」(ver.0.9)を触ってみましたが、前回(ver.0.2)と比較し、ソフトウェアの速度向上、使用キャラの追加等、大きく進化していると感じました。

本ソフトは、使用方法が視覚的に理解し易く、難しい設定が少ないので、とても使いやすい優れたソフトだと感じました。

(=゚ω゚)ノ

近々、新キャラも追加されるようで、今後のアップデート情報にも注目が集まりそうですね!

最後に、ワタクシは「みたらし団子」も大好きですw

( ゚Д゚)

コメント

タイトルとURLをコピーしました