小冰公司聯合創始人,産品副總裁彭爽
2023 年 12 月 1-3 日,2023T-EDGE 全球創新大會暨 EDGE AWARDS 創新評選在北京 751D · PARK 傳導空間舉辦。
今年大會以 " 新視野 新鏈接 " 爲主題,邀請了近百位來自不同國家,不同領域的國際創新領袖分享嘉賓,設置了四十餘場現場讨論,從新一輪全球 AI 革命浪潮、産業鏈重塑、新一輪企業再全球化浪潮、全球化下的産業創新升級和投資新趨勢等維度,共同回顧過去一年的洞察與發展,展望未來的創新趨勢與經濟新格局。
12 月 2 日下午,小冰公司聯合創始人,産品副總裁彭爽在钛媒體 2023T-EDGE 大會上發表了名爲《AIGC 的創新未來》的主題演講。
每一次科技變革,變革的都是人和世界的關系。彭爽認爲,從門戶網站到搜索引擎再到後來的推薦引擎,人和世界以及人和知識的關系都是在随之變化的。随着人工智能時代的到來,人與世界的關系還将再次得到改變。
變化的過程中,大量的創新機會也會随之而來。在彭爽看來,人工智能已經成爲了内容的創作者,而交互界面也将因爲人工智能的賦能而變得更加拟人化。這些變化的背後,包含了所有人可以一起探索的創新機會。
事實上,小冰公司在研究人數字人和虛拟人的時候,非常注重創作和交互的自然,也包括了數字人在各個場景中的一緻性。彭爽表示,這些細節決定了小冰公司的虛拟人和數字人可以實現跨場景存在。而這種一緻性框架在當前人工智能系統中還未被重視。
" 我們認爲我們現在處于人工智能時代早期,但這也是我們能夠發掘創新的最好時代,跟大家一起共勉 ",彭爽說道。
以下爲彭爽演講實錄,經钛媒體 App 編輯整理:
大家好,很高興今天有機會來到這裏參加钛媒體的創新分享,我的分享主題是人工智能内容創造的創新未來。我叫彭爽,我來自于小冰公司,我們做的所有事情都是爲了賦能人工智能時代下所有人工智能的主題,也就是虛拟人、數字人,各種各樣搭建爲人工智能智能主體的機構。
我們這家公司有相對更早的周期。我們最早是微軟中國的一個團隊,随後從微軟分拆出來成爲獨立的公司獨立發展。今天有機會做這個分享,我相信在座每個人都能感知到,人工智能科技帶來巨大的影響力。
實際上我們感覺每一年這個世界都會發生很多新的變化,過去 2023 年更是如此。作爲互聯網和人工智能整個行業十幾年的從業者,我想跟大家分享的是基于我的從業經驗和公司的從業經驗,我們感覺每一次科技帶來特别巨大的變革,事實上都是變革人和世界的關系。
從互聯網和數字世界誕生之初,最早先出現了門戶網站。它太早了,我估計一些年輕的觀衆聽衆那個時候還非常小。在那個時候,門戶網站提供了一種非常好的媒介,讓人有機會接觸到缤紛而精彩的數字世界。
很快,它随着科學技術的變革,随着搜索引擎的出現而帶來替代。搜索引擎是非常簡單的交互界面,就是很簡單的框。人們通過這個框非常快速的學會了新的交互方式,通過輸入關鍵詞通過搜索引擎巨大的檢索和數據庫定位到我想要找的知識信息甚至一些服務。這就是一次巨大的人和數字世界關系的變革。
當然,再往後大家比較熟悉的,推薦引擎的出現,把這個關系繼續往前走了一步。搜索引擎像巨大的管道一樣,管道裏面人作爲主動型的人通過關鍵詞信息的輸入,像釣魚一樣把他想要的知識信息勾回來的話。推薦引擎是反向的。推薦引擎作爲主體,主動篩選對于每個人不一樣的,他認爲有價值的信息和内容主動推送過來。
大家也能感知到,在這樣變革過程中人和世界或者和數字世界知識信息的關系,由相對主動的關系變成被動接受的關系。從門戶到搜索引擎到推薦引擎時代,人和世界的關系在不斷地變革。接下來人工智能時代即将來臨,這個關系肯定還會再次變革,到底會有哪些東西帶來變革?這個過程中能夠出現哪些創新的機會呢?我想跟大家分享一些我們自己的思考。
在這個變革過程中,人和世界的關系就不是人和世界産生橋梁的管道關系的變化,會在這個結構中每一個節點,每一個方面都會産生巨大的變化,當然也會帶來巨大的創新機會。
首先,以前數字世界内有價值的知識信息,包括服務,本質上都是由人類長期積累的或者是提取出來的經驗所形成的。在新的人工智能時代,大家已經感知到的,人工智能不再是一個管道或者輔助,成爲了這些内容可能的創造者之一,或者協助的創作者之一。這也就是我們所說的 AIGC 人工智能内容創造主體的重要變化。
人工智能時代,所有計算機工具會遠超于過去的 Word 文檔。Word 文檔最大的作用是幫助你把這些文本類型進行更好的格式化,呈現出更好更精美的格式。今天你打開的是人工智能,他能幫你做的不僅僅是格式化處理,幫助你填寫空白,甚至跟你一起創造出更多好的内容。
交互的一方也是這樣。之前每一次變革都要進行一些交互界面形态的變化。以前門戶網站的界面,後來推薦引擎變成推送被動接受的界面。新的人工智能時代的來臨,我們相信新的界面一定是一個更加拟人化的。
這個交互界面來自于這次巨大變革大的語言模型的推動力,更自然的計算機語音技術的變革,以及更豐富的計算機視覺的變革。通過這樣的變革,我們認爲帶來最大的價值并不僅僅是交互界面變的更加簡易或者更加自然,使交互關系之間人類主動變到後面信息或者知識主動,最終變成相對而言更加平穩的關系。這個關系更接近于人和人之間的關系。
當然,所有的界面交互方式也好,生産内容的提供者也好,最終發生的主體,我們認爲所謂的部署界面也會發生變化。具體是什麽?這就是所有人一起探索的創新機會。
在我們看來,在新的人工智能時代之下,創新的機會無處不在,最重要的是遍及從底層技術架構到生态系統的重新構建,都會受到新的創新的沖擊,都會帶來巨大的機會。這也是我們認爲創新的未來。
之後簡單跟大家分享一下,從小冰公司過往經驗中我們做的探索和思考。從 AIGC 出發,推出人工智能類似的創作者或者協助創作者,小冰公司做了哪些事情?我們有哪些思考?
大家看到圖中截屏是我們工具型産品,我們承載 AI 歌手或者 AI 合成的工具性平台,我們通過這個平台跟音樂從業者進行合作。爲什麽會有這樣平台,以及音樂人爲何需要這樣平台?
我們做了很多研究發現,在完整歌曲成品創作過程中,會經過很多非常系統化的流程。一個完整的歌曲成品發布之前,會經曆從最開始寫曲寫詞的創作到後面編曲,到後面小樣錄制演唱成曲錄制演唱整個流程。
當後續效果呈現出來一些并不盡如人意或者需要調整的時候,音樂創作者需要回到前面環節重新來過。整個音樂作品完整的呈現,可能創作的周期短則幾周長則幾個月都是正常的周期。
我們的 AI 歌手歌聲合成平台提供了新的創作泛式,與原創創作者進行配合,寫詞和寫曲的原創音樂人本身并不一定具備非常适合的嗓音條件。合成平台可以把他們寫的歌曲實時演唱出來。
音樂人想驗證結果的時候更加需要類似的工具。這個工具使他第一天創作的時候就有一位 AI 歌手随時陪伴在身旁,把他創作階段性作品實時演繹出來。創作者可以在最早期驗證他的想法,确定跟他期待的是否有所偏差。這個過程可以實時進行,非常迅捷。
AI 歌手演唱效果可以達到人類專業歌手水平,很多詞曲作者在這樣協作過程中感受到創作上限被極大拉高,創作過程中所花費的時間叠代的精力被大大降低。
我給大家分享一小段人類創作者和 AI 歌手最終協作産生的歌曲作品,是由我們的 AI 歌手陳水若演唱。聽到歌曲和歌手本人都是由我們人工智能技術進行生成創作的。這個歌曲和 MV 也都在音樂流媒體平台上可以找到。你們看到的這位歌手并不真的存在,臉部表情和對歌曲的演繹都是人工智能生成的。
我們并沒有停留在僅在創作者這一端進行參與,交互端也有更多思考。我們知道計算機語音技術相當成熟,自然度到達了非常自然的水平。我們會進一步思考現有計算機語音停留在 24K 采用率的基礎上,是否足夠呢?我們嘗試做了更多,這裏有小的 demo 給大家聽一下,demo 裏面兩個人工智能語音進行對話的片段。
這是很自然的一段對話,這裏面的技術探索在于,我們希望一個語音說話的時候聽起來和唱歌的時候聽起來,甚至大笑的時候跟朋友交互的時候能夠一緻。如果要做到這一點,當前所有音頻技術基礎上都需要做拔高和一緻性提升。
我們爲什麽關注這樣的細節?因爲我們非常關注作爲人工智能賦能的虛拟人和數字人,他們需要實現跨場景同時存在。當你在錄音室裏跟一位 AI 歌手進行歌曲創作的時候,你是否想過,當你進入雲音樂這樣平台,這位 AI 歌手會在評論區内與你互動。當你進入抖音平台,她依然在,并且能與你交互。
我們考量交互系統交互信号一緻性框架,這樣框架在當前人工智能系統中還未被重視,甚至有跨人工智能之間的框架,應該遵循什麽樣的交流原則和數據分享機制,這背後是考量整套信号和數據進行跨平台,進行創作的機制。
這樣機制本身也是新的數據形式,也必将幫助我們進一步學習,如何構建新的人和人工智能世界交流的關系。這又回到我們的主題,我們認爲我們現在處于人工智能時代早期,但這也是我們能夠發掘創新的最好時代,跟大家一起共勉,謝謝大家。
(本文首發钛媒體 APP)