Skip to content

深掘り

HayaKoe は Style-Bert-VITS2 を日本語専用に縮小し、CPU 推論とサーバー運用に実用的な形に再構成した TTS エンジンです。

このセクションは どの箇所をどのように修正し、結果がどれだけ変わったか を実測値とともにまとめます。

関心のあるトピックから選んで読めます。

一目で要約

HayaKoe がオリジナル SBV2 比で確保した実測改善は以下の通りです(詳細は各ページ参照)。

区分オリジナル SBV2HayaKoe差分
CPU 速度(短文、約2秒)1.13 s0.68 s1.67x 高速
CPU 速度(中文、約8秒)3.35 s2.44 s1.37x 高速
CPU 速度(長文、約38秒)35.33 s10.43 s3.39x 高速
CPU メモリ5,122 MB2,346 MB54% 削減
GPU VRAM3,712 MB1,661 MB55% 削減
実行アーキテクチャx86_64x86_64・aarch64 LinuxARM ボード対応

各ページの構成

各ページは なぜ問題か → 実装 → 改善効果 の流れを基本としつつ、トピックに応じて柔軟に構成されます。

目次

全体像

CPU 推論のリアルタイム化

GPU 推論の追加最適化

運用面の利便性

その他

読む順番の推奨

初めてなら アーキテクチャ一覧 をまず目を通してから、その後関心のあるトピックを選択的に読む方法を推奨します。