Skip to content

快速入門

本指南面向「想先跑起來看看」的讀者。

使用內建的官方說話人,到生成第一條語音約 10 分鐘,到基準測試約 15 分鐘即可完成。

閱讀順序

  1. 安裝 — CPU vs GPU — 選擇適合自己環境的安裝設定
  2. 生成第一條語音 — 用官方說話人儲存 wav 檔案
  3. 速度・韻律調整 — 了解速度/音高/韻律參數
  4. 註冊自訂詞彙 — 手動修正讀錯的詞彙
  5. 句子級串流傳輸 — 盡快發送長文本的第一條語音
  6. 在我的機器上做基準測試 — 測量在自己硬體上實際有多快

完成本節後能做到的事

  • 自由使用 11 位預置說話人
  • 調整速度・音高・韻律參數
  • 在自己的硬體上直接測量「生成 1 秒語音需要幾秒」

可以隨意製作這樣的語音

完成快速入門後,以下說話人就到你手中了。

以下是各說話人朗讀同一句話(「こんにちは、はじめまして。」)的範例。

JVNV jvnv-F1-jp — 女性說話人 1
0:00 / 0:00
JVNV jvnv-F2-jp — 女性說話人 2
0:00 / 0:00
JVNV jvnv-M1-jp — 男性說話人 1
0:00 / 0:00
JVNV jvnv-M2-jp — 男性說話人 2
0:00 / 0:00
つくよみちゃん tsukuyomi_chan — 動畫風
0:00 / 0:00
あみたろ amitaro_normal — 普通
0:00 / 0:00
あみたろ amitaro_runrun — 興奮
0:00 / 0:00
あみたろ amitaro_yofukashi — 沉穩
0:00 / 0:00
あみたろ amitaro_punsuka — 生氣
0:00 / 0:00
あみたろ amitaro_sasayaki_a — 低語A
0:00 / 0:00
あみたろ amitaro_sasayaki_b — 低語B
0:00 / 0:00

自訂說話人訓練正在準備中

準備錄音並訓練自訂說話人的指南正在整理中。

準備完成後將發佈在 自訂說話人訓練 板塊。