快速入門

本指南面向「想先跑起來看看」的讀者。

使用內建的官方說話人,到生成第一條語音約 10 分鐘,到基準測試約 15 分鐘即可完成。

閱讀順序

安裝 — CPU vs GPU — 選擇適合自己環境的安裝設定
生成第一條語音 — 用官方說話人儲存 wav 檔案
速度・韻律調整 — 了解速度/音高/韻律參數
註冊自訂詞彙 — 手動修正讀錯的詞彙
句子級串流傳輸 — 盡快發送長文本的第一條語音
在我的機器上做基準測試 — 測量在自己硬體上實際有多快

完成本節後能做到的事

自由使用 11 位預置說話人
調整速度・音高・韻律參數
在自己的硬體上直接測量「生成 1 秒語音需要幾秒」

可以隨意製作這樣的語音

完成快速入門後,以下說話人就到你手中了。

以下是各說話人朗讀同一句話(「こんにちは、はじめまして。」)的範例。

JVNV jvnv-F1-jp — 女性說話人 1

0:00 / 0:00

JVNV jvnv-F2-jp — 女性說話人 2

0:00 / 0:00

JVNV jvnv-M1-jp — 男性說話人 1

0:00 / 0:00

JVNV jvnv-M2-jp — 男性說話人 2

0:00 / 0:00

つくよみちゃん tsukuyomi_chan — 動畫風

0:00 / 0:00

あみたろ amitaro_normal — 普通

0:00 / 0:00

あみたろ amitaro_runrun — 興奮

0:00 / 0:00

あみたろ amitaro_yofukashi — 沉穩

0:00 / 0:00

あみたろ amitaro_punsuka — 生氣

0:00 / 0:00

あみたろ amitaro_sasayaki_a — 低語A

0:00 / 0:00

あみたろ amitaro_sasayaki_b — 低語B

0:00 / 0:00

自訂說話人訓練正在準備中

準備錄音並訓練自訂說話人的指南正在整理中。

準備完成後將發佈在自訂說話人訓練板塊。