IT 之家 8 月 23 日消息,微軟 Azure AI 語音服務允許開發者構建多語言生成式 AI 語音應用,Azure AI 語音服務最新推出了文本到語音虛拟人功能,可以将簡單的文本轉換爲人類自然說話視頻。
今天,微軟宣布全面推出 Text to Speech Avatar 功能。這項新功能使開發者能夠爲其用戶創建個性化虛拟人。該服務的輸出視頻分辨率爲 1920 x 1080,每秒 25 幀。IT 之家附示例如下:
Text to Speech Avatar 具有以下功能:
将文本轉換爲由 Azure AI 文本轉語音提供支持的人類說話視頻,該視頻具有自然的聲音。
提供不同的人物預設形象。
形象的聲音由 Azure AI 文本轉語音生成。
使用批量合成 API 異步或實時合成文本到語音人像視頻。
在 Speech Studio 中提供内容創建工具,無需編碼即可創建視頻内容。
通過 Speech Studio 中的實時聊天頭像工具啓用實時人像對話。
定價方面,文本轉視頻服務的收費将根據視頻輸出的長度計算并按秒收費。該服務現已在東南亞、北歐、西歐、瑞典中部、美國中南部和美國西部地區推出。