品玩 7 月 27 日訊,據微軟官方消息,微軟推出一款名爲 NaturalSpeech2 的語音模型,可帶來高質量的語音合成産品。
微軟表示,NaturalSpeech2 可以生成具有不同身份的人聲語音,擁有不同的韻律和風格,還具備唱歌能力。
實驗結果表明,NaturalSpeech2 在零樣本條件下生成的語音與語音提示和真實語音的韻律近乎一緻,并且在 LibriTTS 和 VCTK 測試集上的自然度(以 CMOS 爲度量)與真人語音難以區分。