快速开始

本指南面向"想先跑起来看看"的读者。

使用内置官方说话人,到生成首条语音约 10 分钟,到基准测试约 15 分钟即可完成。

阅读顺序

安装 — CPU vs GPU — 选择适合自己环境的安装配置
生成第一条语音 — 用官方说话人保存 wav 文件
速度·韵律调节 — 了解速度/音高/韵律参数
注册自定义词语 — 手动修正读错的词语
句子级流式传输 — 尽快发送长文本的首条语音
在我的机器上做基准测试 — 测量在自己硬件上实际有多快

完成本节后能做到的事

自由使用 11 位预置说话人
调节速度·音高·韵律参数
在自己的硬件上直接测量"生成 1 秒语音需要多少秒"

可以随意制作这样的语音

完成快速开始后,以下说话人就到你手中了。

以下是各说话人朗读同一句话("こんにちは、はじめまして。")的示例。

JVNV jvnv-F1-jp — 女性说话人 1

0:00 / 0:00

JVNV jvnv-F2-jp — 女性说话人 2

0:00 / 0:00

JVNV jvnv-M1-jp — 男性说话人 1

0:00 / 0:00

JVNV jvnv-M2-jp — 男性说话人 2

0:00 / 0:00

つくよみちゃん tsukuyomi_chan — 动画风

0:00 / 0:00

あみたろ amitaro_normal — 普通

0:00 / 0:00

あみたろ amitaro_runrun — 兴奋

0:00 / 0:00

あみたろ amitaro_yofukashi — 沉稳

0:00 / 0:00

あみたろ amitaro_punsuka — 生气

0:00 / 0:00

あみたろ amitaro_sasayaki_a — 低语A

0:00 / 0:00

あみたろ amitaro_sasayaki_b — 低语B

0:00 / 0:00

自定义说话人训练正在准备中

准备录音并训练自定义说话人的指南正在整理中。

准备完成后将发布在自定义说话人训练板块。