快速入門
本指南面向「想先跑起來看看」的讀者。
使用內建的官方說話人,到生成第一條語音約 10 分鐘,到基準測試約 15 分鐘即可完成。
閱讀順序
- 安裝 — CPU vs GPU — 選擇適合自己環境的安裝設定
- 生成第一條語音 — 用官方說話人儲存 wav 檔案
- 速度・韻律調整 — 了解速度/音高/韻律參數
- 註冊自訂詞彙 — 手動修正讀錯的詞彙
- 句子級串流傳輸 — 盡快發送長文本的第一條語音
- 在我的機器上做基準測試 — 測量在自己硬體上實際有多快
完成本節後能做到的事
- 自由使用 11 位預置說話人
- 調整速度・音高・韻律參數
- 在自己的硬體上直接測量「生成 1 秒語音需要幾秒」
可以隨意製作這樣的語音
完成快速入門後,以下說話人就到你手中了。
以下是各說話人朗讀同一句話(「こんにちは、はじめまして。」)的範例。
JVNV jvnv-F1-jp — 女性說話人 1
JVNV jvnv-F2-jp — 女性說話人 2
JVNV jvnv-M1-jp — 男性說話人 1
JVNV jvnv-M2-jp — 男性說話人 2

つくよみちゃん tsukuyomi_chan — 動畫風

あみたろ amitaro_normal — 普通

あみたろ amitaro_runrun — 興奮

あみたろ amitaro_yofukashi — 沉穩

あみたろ amitaro_punsuka — 生氣

あみたろ amitaro_sasayaki_a — 低語A

あみたろ amitaro_sasayaki_b — 低語B
