品玩 1 月 29 日訊,據澎湃新聞消息,當地時間 1 月 27 日,谷歌公司發布了對 AI 模型 MusicLM 的研究,該系統可以從文本描述中生成任何類型的高保真音樂。但因擔心風險,谷歌沒有立即發布它的計劃。" 我們強調,需要在未來開展更多工作來應對這些與音樂生成相關的風險——我們目前沒有發布模型的計劃。" 谷歌發布的論文寫道。
據了解,谷歌自己的 AudioML 和人工智能研究機構 OpenAI 的 Jukebox 等項目也都可以從文字生成音樂。然而,MusicLM 的模型和龐大的訓練數據庫(280000 小時的音樂)使其能制作出作曲特别複雜或保真度特别高的歌曲。MusicLM 不僅可以結合流派和樂器,還可以使用計算機通常難以掌握的抽象概念來編寫曲目。比如 " 一種舞曲和雷鬼音樂的混合體,其曲調空曠、超凡脫俗,能喚起驚奇和敬畏之感 ",MusicLM 就可以實現。
谷歌研究人員表明,該系統可以建立在現有旋律的基礎上,無論是哼唱、演唱、吹口哨還是在樂器基礎上演奏。此外,MusicLM 有一個 " 故事模式 " 來編程特定時間的風格、氛圍和節奏的轉變,比如可以采用幾個按順序編寫的描述 " 冥想時間 "、" 醒來時間 "、" 跑步時間 " 來創建一種 " 故事 " 叙事旋律。
圖源:谷歌