Skip to content

深入解讀

HayaKoe 是將 Style-Bert-VITS2 精簡為日語專用,並重新建構為適合 CPU 推論和伺服器運維的 TTS 引擎。

本板塊整理了 修改了哪些地方、如何修改的、結果有多大改善,附帶實測資料。

可以根據感興趣的主題選擇性閱讀。

概覽

HayaKoe 相比原版 SBV2 的實測改善如下(詳情請參見各頁面)。

類別原版 SBV2HayaKoe差異
CPU 速度 (短句, 約 2 秒)1.13 s0.68 s1.67x 更快
CPU 速度 (中等句子, 約 8 秒)3.35 s2.44 s1.37x 更快
CPU 速度 (長句, 約 38 秒)35.33 s10.43 s3.39x 更快
CPU 記憶體5,122 MB2,346 MB減少 54%
GPU VRAM3,712 MB1,661 MB減少 55%
執行架構x86_64x86_64 · aarch64 Linux支援 ARM 開發板

各頁面的結構

各頁面以 為什麼是問題 → 實作 → 改善效果 的流程為基本結構,根據主題彈性調整。

目錄

全局視角

CPU 推論的即時化

GPU 推論的額外最佳化

運維便利

其他

建議閱讀順序

初次閱讀建議先瀏覽 架構概覽,然後根據興趣選擇性閱讀其他主題。