Fish-speech - 任意の人の声をクローンするためのわずか10秒の音声提示

このプロジェクトは、安定性と感情表現の向上を提供し、たった10秒の音声サンプルで誰でも音声をクローンすることができます!

まず、その効果を見てみましょう:


Input Sample(Nahida | Genshin Impact):

合成された音声:

人間の灯火が湖に映り込み、彼女の願望が静かな水面に波紋を広げます。もし代償が孤独であるならば、その願いを自由に流れさせましょう。彼女が見つめる世界へ、そして彼女の澄んだ湖水のような視線へと流れ込ませましょう。

GitHubでのスター数が急上昇しています。

に基づくテキストから音声への変換モデルには以下の特徴があります:

  • 70万時間の多言語データを使用して訓練されています(以前の20万時間から大幅に増加)
  • 現在8つの言語がサポートされています:英語、中国語、ドイツ語、日本語、フランス語、スペイン語、韓国語、アラビア語
  • 完全にオープンソースであり、世界中の開発者や研究者を支援します

主な機能:

  • 超低遅延の高速TTS(テキストから音声への変換)
  • 即時の音声クローン
  • ローカル展開またはクラウドサービスに対応

皆さんは公式サイトで試用できます:https://fish.audio