Skip to content

深入解读

HayaKoe 是将 Style-Bert-VITS2 精简为日语专用,并重新构造为适合 CPU 推理和服务器运维的 TTS 引擎。

本板块整理了 修改了哪些地方、如何修改的、结果有多大改善,附带实测数据。

可以根据感兴趣的主题选择性阅读。

概览

HayaKoe 相比原版 SBV2 的实测改善如下(详情请参见各页面)。

类别原版 SBV2HayaKoe差异
CPU 速度 (短句, 约 2 秒)1.13 s0.68 s1.67x 更快
CPU 速度 (中等句子, 约 8 秒)3.35 s2.44 s1.37x 更快
CPU 速度 (长句, 约 38 秒)35.33 s10.43 s3.39x 更快
CPU 内存5,122 MB2,346 MB减少 54%
GPU VRAM3,712 MB1,661 MB减少 55%
运行架构x86_64x86_64 · aarch64 Linux支持 ARM 开发板

各页面的结构

各页面以 为什么是问题 → 实现 → 改善效果 的流程为基本结构,根据主题灵活调整。

目录

全局视角

CPU 推理的实时化

GPU 推理的额外优化

运维便利

其他

建议阅读顺序

初次阅读建议先浏览 架构概览,然后根据兴趣选择性阅读其他主题。