マイクロソフトTTS最新モデル

先月の終わりに、マイクロソフトはより現実的な9つの新しいAIテキスト・ツー・スピーチ音声を発表しました:

  • en-US-AvaMultilingualNeural
  • en-US-AndrewMultilingualNeural
  • en-US-EmmaMultilingualNeural
  • en-US-BrianMultilingualNeural
  • De-DE-FlorianMultilingualNeural
  • De-DE-SeraphinaMultilingualNeural
  • Fr-FR-RemyMultilingualNeural
  • Fr-FR-VivienneMultilingualNeural
  • zh-CN-XiaoxiaoMultilingualNeural

特徴

  • 音声ベースのチャットボット、音声アシスタント、または対話エージェントを作成する場合でも、これらの新しい音声により、インタラクションがよりリアルで生き生きとしたものになり、魅力的になります。
  • 会話向けに最適化された音声は、対話や非公式なテキストを読む際に、より自然で魅力的に聞こえます。
  • 笑いやフィラーとなる間合いなども含み、仮想的な対話に人間らしいニュアンスを加えています。

以前と後の比較を見てみましょう

古いバージョン(硬い表現)

新しいバージョン(非常に自然)

比較

  • en-US-AvaMultilingualNeural(女性):明るく魅力的な女性の声で、美しいトーンを持っています。
  • en-US-AndrewMultilingualNeural(男性):温かく、引き込む力のある男性の声で、知りたいと思うような人のように聞こえます。
  • en-US-EmmaMultilingualNeural(女性):フレンドリーでリラックスした女性の声で、教育や説明に非常に適しています。
  • en-US-BrianMultilingualNeural(男性):若々しく、愉快で、多才な声で、さまざまな場面に非常に適しています。
  • De-DE-FlorianMultilingualNeural(男性):ドイツ語の男性の声
  • De-DE-SeraphinaMultilingualNeural(女性):ドイツ語の女性の声
  • Fr-FR-RemyMultilingualNeural(男性):フランス語の男性の声
  • Fr-FR-VivienneMultilingualNeural(女性):フランス語の女性の声
  • zh-CN-XiaoxiaoMultilingualNeural(女性):中国語の女性の声


使用

これを使用するには、ai.azure.comにアクセスし、音声ライブラリからデモを確認するか、ChatGPT Playgroundで音声機能を有効にできます。この強化された機能は、シームレスなオーディオテストを実現し、ロボットアプリケーションへの統合に向けたより洗練され、よりリアルな会話体験を提供します。