當前,在音樂的世界裏,一首由 AI 生成的歌曲火了。
這首名爲《We Go!》的歌曲,由音樂大模型 Suno 生成,其播放量已經超過十幾萬,甚至一度沖上熱度榜首位,引發了網友們的廣泛熱議。
有網友評論表示:"《We Go!》有點像專業的作品了 ",也有其他網友說:"《We Go!》聽上去好像沒有感情 "。
雖然對于 AI 音樂,網友們褒貶不一,但如果 AI 能直接生成專業作品,而且受到大多數聽衆的喜愛,是不是意味着 AI 将改變音樂界的專業分工甚至促使整個音樂行業革新呢 ?
視頻大模型後,音樂大模型來了
日前,音樂大模型 Suno 發布 V3,并且開放給個人用戶,随即便引爆了互聯網。
其實,Suno 已經發布了一段時間,但這一次将免費用戶的音樂生成時長增加到 2 分鍾,并且有更豐富的定制選項,比如可以定制純器樂作品。這一舉動激發了網友們的使用熱情,大量 AI 生成歌曲蜂擁而至。
此次,更新的 Suno V3 模型的亮點之一是其對用戶提供的歌詞的高效處理能力。用戶僅提供歌詞,V3 便能生成符合多種曲風、流派的歌曲,甚至可定制 AI 歌手的音色。這種高度定制化和個性化,不僅滿足用戶基本需求,還激發創作靈感,推動音樂創作的邊界。
其中,有一首名爲《We Go!》的中文歌在 3 月 24 日發布之後,很快就沖上了熱度榜第一。我們聽到《We Go!》總體感受是,這首歌有着典型的重金屬音樂特征和結構,且完整度相當高,因此被不少國外網友分享并熱議。
而且,有國内用戶用很多耳熟能詳的歌詞作爲基礎,讓 Suno 重新生成曲調," 重制 " 了《讓我們蕩起雙槳》《聲聲慢》《以父之名》《夜曲》《七裏香》等經典曲目,生成效果令人驚豔。
過去一年,我們看到,生成式 AI 在産生文本、圖像甚至視頻方面取得了重大進展,特别是 OpenAI 的新 Sora 工具,帶起了全民文生視頻的熱潮。但是音頻,尤其是音樂方面卻一直落後。
除了 Suno, 2023 年以來,越來越多的 AI 生成音樂類産品出現。去年 8 月,Meta 以 AudioCraft 名義發布了三款 AI 音樂生成研究工具 ; 谷歌子公司 DeepMind 也與 Youtube 聯合推出了人工智能音樂生成模型 Lyria、23 年 11 月推出了 Dream Track,它可以按照選定的著名歌手的風格創作原創歌曲,12 月 14 日,谷歌又推出 AI 音樂創作工具 "MusicFX",僅需幾句話用戶即可生成原創的音樂作品。
但這些看似更大廠商推出的軟件都是不溫不火,其實是有理由的。
有業内人士分析認爲,相比圖文和視頻,音樂的機器學習要複雜得多,AI 需要理解和模拟複雜的音樂結構、和聲、旋律以及節奏等元素,這在技術上是非常複雜的。
音樂不僅僅是技術的堆砌,它還包含了深厚的文化背景和個人情感的表達。而且,人聲和音樂的結合,也是一個難點。
值得注意的是,Suno V3 對于著作權的歸屬問題在官網做了詳盡的描述與規定,同時爲了防止模型作品被濫用,還開發了專有的無聲水印技術,用以檢測歌曲是否是使用 Suno 創作。
Suno 官方稱,V4 已經在開發中,并将在未來推出一些全新的功能。
那麽,很多人都在好奇,到底是一個什麽樣的團隊創造出這個爆款的軟件呢 ? 其實,這又是一個天才團隊成立的故事。
12 人團隊給音樂圈的驚喜
Suno AI 成立于 2022 年,其創始團隊位于麻省劍橋市。在創立 Suno 之前,他們一起在劍橋的一家公司名叫 Kensho Technologies 的公司工作,據了解,Suno 創業團隊目前僅 12 人。
創始人是 Mikey Shulman,博士畢業于哈佛大學物理學專業。他是創始團隊在 Kensho 時的機器學習團隊主管,在創立 Suno 之前,他還是一名 MIT 斯隆管理學院的兼職講師。
其他 3 位創始人分别是 Shulman、Freyberg、Georg Kucsko 和 Martin Camacho,他們都是機器學習專家,還有在 Tiktok、Meta 等互聯網公司的從業經驗。
在 Kensho 工作期間,四人的主要任務是開發一種 AI 語音轉錄技術,用來轉錄上市公司的财報電話會議。後來他們發現,AI 音頻領域好像還沒有現象級的産品出現,于是他們開始創業。他們先做了個文本轉語音程序 Bark。但當他們對早期 Bark 用戶進行調查時,發現用戶真正想要的是音樂生成工具。于是他們才找到了真正适合自己的方向。
2023 年 7 月他們推出了音頻生成模型增加人聲音樂功能 ;9 月,更新後的模型,可以讓用戶可以在 Suno 的 Discord 頻道體驗文字生成音樂 ;12 月 20 日推出了 Suno 網頁版本應用。
這次推出的第一款可制作廣播級的音樂生成模型 V3,一經發布就在網上爆火。
别讓 AI 替代的創作
元宇宙新聲也聽到很多關于 AI 用途的聲音,有人質疑 AI 的方向問題,他們希望機器人幫人類掃地、洗碗,是因爲人類要去寫詩、畫畫 ; 現在是 AI 都去寫詩和畫畫了,而人類還在掃地、洗碗。那麽,研究 AI 寫詩、畫畫、做音樂的意義是什麽 ?
我們認爲,現在也已經有掃地機器人、洗碗機等工具,機械類的工作早就有機器可以替代。而現在 AI 應該深入各個領域去擴散思維,替代或者輔助人們來做更多的工作,如果,AI 連藝術都能做,做那些機械類的工作豈不是更容易 ?
有業内人士認爲,随着數據庫的更新、技術的叠代,AI 将在未來 10 年内’幹掉’作曲人。
其實,AI 顯然爲業内人士敲響了警鍾,但即便 AI 技術再升級,永遠有 1% 是無法被替代的,這 1% 的來源也正是音樂行業的核心部分,那就是創造力。
而且,AI 合成音樂可能會将音樂創作過度商業化,這完全本末倒置了。他認爲音樂創作很多時候是主觀的、能動的、感性的,是自己的生活記錄和情感抒發。
元宇宙新聲認爲,機器與人之間的最大區别往往就在于人文情懷,再好的詞曲也比不上 " 周傑倫 "" 林俊傑 " 三個字在聽衆心中的存在意義,再無瑕的人聲演繹也難以與明星演唱會現場的萬人大合唱相比較。
寫在最後
我們看到,Suno 沖擊的不僅是行業分工,還有音樂流媒體。在早前發布的宣傳片裏,Suno 勾勒了這樣一個未來的音樂場景:用戶不再使用流媒體,而是想聽歌的時候,直接用 Suno 生成。
但我們擔心的是,随着 AI 的發展,AI 音樂泛濫,用戶還能不能在更多的歌曲中找到符合自己審美的音樂和聽音樂的初心。如果,可以克服這樣的困難,大模型與音樂内容、創作者的結合或許将成就新一代音樂,同時帶來行業的變革。