品玩 6 月 25 日訊,據 huggingface 頁面顯示,谷歌研究團隊近日推出一款大語言模型産品 AudioPaLM,可以實現語音理解和生成功能。
AudioPaLM 将兩個大語言模型 PaLM-2 和 AudioLM 融合到一個統一的多模态架構之中,利用該架構處理和生成文本和語音。 AudioPaLM 還支持語音識别以及語音翻譯。
試驗表明,AudioPaLM 的表現顯著優于現有的語音翻譯系統。
品玩 6 月 25 日訊,據 huggingface 頁面顯示,谷歌研究團隊近日推出一款大語言模型産品 AudioPaLM,可以實現語音理解和生成功能。
AudioPaLM 将兩個大語言模型 PaLM-2 和 AudioLM 融合到一個統一的多模态架構之中,利用該架構處理和生成文本和語音。 AudioPaLM 還支持語音識别以及語音翻譯。
試驗表明,AudioPaLM 的表現顯著優于現有的語音翻譯系統。