快速开始
本指南面向"想先跑起来看看"的读者。
使用内置官方说话人,到生成首条语音约 10 分钟,到基准测试约 15 分钟即可完成。
阅读顺序
- 安装 — CPU vs GPU — 选择适合自己环境的安装配置
- 生成第一条语音 — 用官方说话人保存 wav 文件
- 速度·韵律调节 — 了解速度/音高/韵律参数
- 注册自定义词语 — 手动修正读错的词语
- 句子级流式传输 — 尽快发送长文本的首条语音
- 在我的机器上做基准测试 — 测量在自己硬件上实际有多快
完成本节后能做到的事
- 自由使用 11 位预置说话人
- 调节速度·音高·韵律参数
- 在自己的硬件上直接测量"生成 1 秒语音需要多少秒"
可以随意制作这样的语音
完成快速开始后,以下说话人就到你手中了。
以下是各说话人朗读同一句话("こんにちは、はじめまして。")的示例。
JVNV jvnv-F1-jp — 女性说话人 1
JVNV jvnv-F2-jp — 女性说话人 2
JVNV jvnv-M1-jp — 男性说话人 1
JVNV jvnv-M2-jp — 男性说话人 2

つくよみちゃん tsukuyomi_chan — 动画风

あみたろ amitaro_normal — 普通

あみたろ amitaro_runrun — 兴奋

あみたろ amitaro_yofukashi — 沉稳

あみたろ amitaro_punsuka — 生气

あみたろ amitaro_sasayaki_a — 低语A

あみたろ amitaro_sasayaki_b — 低语B
