本周一,钛媒體 AGI 發布了 " 比 Suno 好 10 倍的 AI 音樂應用 " 消息,引發關注,甚至當時名字都還沒得到正式确認。
如今,這款 AI 音樂産品終于被官宣了。
北京時間 4 月 11 日淩晨,全新的音樂生成應用 Udio 正式亮相,輸出效果超越熱門的 Suno,尤其是中文歌曲甚至直逼人類唱歌水平,堪稱 " 錄音室 " 級别,成爲 Suno 勁敵,引發廣泛關注。
目前,Udio 已經開始公測,用戶可免費體驗,每月可生成 1200 首作品。體驗地址:https://www.udio.com/
據了解,Udio 采用先進的 AI 技術,通過簡單的文字輸入,就能生成各類風格的原創音樂作品。從抒情的福音音樂,到滄桑的藍調,再到夢幻的流行電音,應有盡有。同時,Udio 還支持多種語言,用戶可以創作出日語流行、俄羅斯流行、拉丁節奏等多元化的音樂作品。
就目前體驗來看,Udio 的優勢和特點包括兩部分:體驗比 Suno 好,更好的可擴展性。
其中,Udio 生成的音樂效果比前段時間大火的 Suno 有了質的提升;同時,可擴展性方面,用戶不僅可以指定音樂的引子和尾聲,還能以此爲基礎向前向後延伸,生成更長的音樂作品。完成創作後,隻需點擊 " 發布 ",作品就能與 Udio 社區的其他創作者們分享交流。
注冊 Udio 帳戶後,任何人都可以通過輸入文本提示來創建曲目,其中可以包括歌詞、故事方向和音樂流派标簽。然後,Udio 分兩個階段處理該任務。首先,它利用類似于 ChatGPT 的大型語言模型 ( LLM ) 根據提供的提示生成歌詞(如果需要)。接下來,它使用 Udio 沒有公開的方法合成音樂,但這很可能是一種擴散模型,類似于 Stability AI 的 Stable Audio。
根據給定的提示,Udio 的 AI 模型會生成兩個不同的歌曲片段供您選擇。然後,您可以将歌曲發布到 Udio 社區,下載音頻或視頻文件以在其他平台上共享,或直接在社交媒體上共享。其他 Udio 用戶也可以重新混音或在現有歌曲的基礎上進行創作。Udio 的服務條款規定,該公司對音樂世代不享有任何權利,并且它們可以用于商業目的。
企業層面,公開消息顯示,Udio 的創始團隊來自谷歌 DeepMind 等頂尖 AI 機構,團隊在音樂和技術領域均有深厚積澱。他們的目标是讓 Udio 成爲一款真正改變遊戲規則的音樂創作工具,不僅面向專業音樂人,也希望讓廣大非音樂人也能輕松參與到音樂創作當中。
盡管 Udio 團隊尚未透露其模型或訓練數據的具體細節(其中可能充滿了受版權保護的材料),但它告訴《tom 指南》,該系統具有内置措施來識别和阻止與特定的藝術家,确保生成的音樂保持原創。
當前,Suno、Udio 也讓一些人類音樂家感到害怕。上周,超過 200 名音樂藝術家簽署了一封公開抗議信,批評 Udio 這種由 AI 驅動的音樂生成服務,影響音樂者創作。一位 Reddit 評論者在有關 Udio 的帖子中寫道:" 說實話,這太令人沮喪了。" " 我仍然普遍樂觀地認爲,從長遠來看,音樂在某種程度上會很好。但是,爲什麽要這樣做?爲什麽要自動化藝術?"
也有分析稱,就像 Sora 一樣,Udio 生成的音樂和 Spotify 上聽到的歌曲幾乎沒有任何區别。而且根據他的感受," 要比 Suno 好 10 倍。"
早前钛媒體注意到相關報道,Udio 稱爲 xgboost 技術,後來被證實後者是一種數據集技術,它采用開源數據集 Medley-solos-DB,最初發布時間爲 2019 年 9 月 29 日。該研究參與方包括紐約大學、加州大學伯克利分校、Spotify 等機構人員。另據論文顯示,山東理工大學工程與信息技術系 Yijie Liu,Yanfang Yin,Qigang Zhu,Wenzhuo Cui 等人采用利用 XGBoost 結合特征融合進行樂器識别。
據報道,Udio 團隊正在快速叠代優化,計劃未來陸續推出更長音頻、更高音質,以及更強大的可控性等衆多新功能。
針對 AI 音樂生成生态,Suno 首席執行官 Mikey Shulman 在紅杉資本活動上表示,這是一個非常酷的工具,它正在擴大用戶,從而讓我們對傾聽創造性音樂的品味能夠引起更多人的共鳴。未來 suno 會有大量的玩家,占比或超過 80%。
(本文首發钛媒體 App,作者|林志佳)