從短劇、音頻到二次元社區，大模型創業者如何用AI重塑内容形式及生産模式？

AI 時代，在大模型能力還在進化、還在苦苦尋找 PMF 之前，創業者之間的交流和共識似乎變得更爲重要。

一次成功的嘗試，或者是失敗的反思；

或者是最近的創業新方向和新收獲；

或者是對于某個垂直領域的新觀察。

……

3 月 23-24 日，由上海市人工智能行業協會（SAIA）主辦的 2024 全球開發者先鋒大會（2024 GDC）在上海成功舉辦。同期，3 月 22 日，Founder Park 也邀請了四位創業者，在大會周邊進行了一場閉門交流分享，暢談他們在過去一年内 AI 創業的得與失，進行了一場大模型創業的認知碰撞與對齊。

我們節選了嘉賓分享中，對于 AI 如何影響内容創作者、如何改造不同内容的生産流程，甚至如何滿足小衆人群的内容閉環的一些精彩讨論。

交流嘉賓介紹：

朱江井英科技創始人 & CEO

胡修涵：捏 Ta 創始人

呂睿韬（秀才）：喜馬拉雅珠峰 AI 産品研發總監

尹伯昊：猴子無限創始人 & CEO

再次，特别感謝上海市人工智能行業協會、出門問問、上海西岸集團對本次活動的支持。

01 AI 短劇≠ AI+ 短劇，而是全新的内容生态

分享嘉賓：井英科技創始人 & CEO 朱江

在這部分，他分享了目前對于 AI 短劇行業的觀察和心得。

今天的短劇和免費小說有非常大的關系。最早拍短劇的人，就是免費小說的廣告演員，還有那些給免費小說投廣告的廣告代理公司。大家發現，這種短劇其實本身就挺好看的，不一定非要去看小說了。2021 年開始就有一批先行者，到 2022 年發生了一個關鍵的點，就是抖音和微信小程序之間打通了。這導緻大量的公司可以通過抖音買量，然後跳轉到微信小程序裏。原來那些做免費小說、新媒體的人通過短劇的方式，把 ROI 跑起來了。短劇的前身其實就來自于免費小說。今天短劇的興起可以講就是免費小說的一個升級版，是視頻化的小說。

爲什麽是小說，因爲一次性看不完，需要反複看，和抖音短視頻的邏輯是不一樣的，這是一個很好分發的點。

從體驗上來看的話，在 AI 上面還要往前走，交互上也會有新的變化，你要想它其實不是個劇了，能看、能互動，這是一種新的内容，隻是現在看起來是視頻化的，

換句話說，如果今天用 AI 去做 Vision Pro 的空間視頻，可能就會變成另外一種媒介。但可能還是需要一個過程。

這次創業，我們用 AI 來生成視頻内容，也是做短視頻的，從廣告到短劇全都覆蓋。但是我有個非常大的體會，就是一定要做優質内容的創作。優質的内容創作在市場上是有價值的。但凡一個娛樂型的、充分競争型的内容市場，優質是一個入門的門票。沒有優質内容，最終遲早要被淘汰。

我們會覺得豎屏短劇不是短視頻，是個新東西。其實是個長視頻，隻是切短了之後變成了一集一集的連續爽點，很密集的呈現方式。長視頻在于追，短視頻在于刷，體驗是不一樣。

豎屏短劇這種形态是個新的分發渠道的機會，就是國内、海外用戶刷豎屏短劇在哪刷？沒有一個人有這個心智，國内海外的用戶都沒有一個固定渠道。

第二個問題其實更關鍵，内容供給。

我們設想，如果要 1000 萬 DAU 的話，大概需要 1000 部好劇，按照現在的爆款率，需要 1 萬部劇打底。現在中國的整個的供給量是多少呢？一年 3000 到 5000 部劇。

現在内容的消耗量根本撐不住這麽大的 DAU。所以我的判斷是短劇的需求端被驗證了，但是問題在供給側。如果不用 AI 生成方式的話，不可能成爲一個平台，這是我的判斷。

現在的月活的短劇用戶量已經是 1.2 億，這些内容刷完了就走了，留存不下來。當你真的要聚成一個内容平台的量級，是不可能用現在的工作室方式去拍的。

這個跟以前的網文小說不一樣，作家寫作，隻有時間成本。但是你說一堆人湊在一起，演員、服裝、道具、攝像，他不可能爲了興趣去拍短劇，團隊成員都要吃飯的。所以制作方一定要付錢，成本是一方面，制作内容的效率也很低。AI 的好處是在于，它并不是提高内容上限，但是 AI 可以把團隊的事情變成一個人就可以做。如果你能夠達到優質的基線，讓這些有能力的創作者一個人就能創作的時候，這個内容供給才能夠打開。隻有用 AI 降本增效到這個程度，平台才能夠出現。

我覺得今天短劇的賽道，也還隻是下半場的開場。

中國市場真人拍攝的短劇，年産量才 3000 到 5000 部。我去年和客戶、投資人都在講，今後用戶一定分不出來 AI 和真人拍攝的區别，未來就是 AI 内容的時代。

從現在的角度來說，至少站在海外平台的視角來看，競争還沒有絕對的勝負的方式，現階段存在一個階段性的機會，因爲 Netflix、Disney 以及其他的視頻平台現在對于豎屏短視頻的認知還沒到這個點。國内的話，大平台可以一次性把内容團隊都收了，就沒什麽機會了。

提問：AI 在多長時間之内有機會成爲視頻的創作者？

這個是很好的問題，我們覺得短劇還是一個 PGC，但 AI 有點區别。

我覺得 AI 時代不太一樣，不是 PUGC， PUGC 是專業的人去創作，而 AI 是讓一部分本來不專業的人，因爲 AI 解決了下限的問題，用戶用 AI 工具成爲了可以生産内容的專業人士。

我們會覺得其實真正最終能代替抖音的未來平台，現在的 AI 體驗還要往前走，隻有 AI 短劇是不夠的。

短劇可以是 AI 時代的内涵段子，但不是真正的今日頭條或者抖音，但是它是在那條路上，是其中很重要的一塊。而其他内容體驗的提升有賴于其他 AI 能力的補充。

提問：AI時代的個人創作者會呈現非常強的頭部效應嗎？

坦白來講我們内部也有分歧。一種觀點是認爲超級個體會崛起，厲害的人會變得更強，因爲效率提升了。還有一種觀點就是，能人的數量也變多了，不會變成像 Netflix 或者愛奇藝的上遊一樣被少數的内容制作方所控制的局面。

所以我感覺，一開始超級的内容創作者會崛起，但是慢慢會有更多的人進來。頂部可能是個百萬量級的存在，然後腰部也會有更多創作者數量的提升。

02 AI 讓小衆群體的内容閉環不再是問題

分享嘉賓：捏 Ta 創始人胡修涵

在這部分，他分享了捏 Ta 切入二次元内容社區的觀察和判斷。

我第一次理解數據驅動不能解決很多東西，包括不少内容的問題，是在聯合利華工作的時候。

聯合利華當時會給廚師做分享菜譜的社群工具，用來作爲提升調味料銷量的一種方式。爲什麽是建社群？其實明明有不少不那麽曲線救國的方式：直接發優惠券、線下超市鋪貨等，爲什麽要社群，其實是他們在整合零散渠道的優質内容，進行社會化創新。

如果把菜譜當成内容，廚師就是創新菜的驅動力，在食材之外，調味料也是菜譜的關鍵要素。但這個部分，制作調味料的廠商其實很難理解怎麽做創新，因爲沒有那麽多的數據反饋和數據驅動，隻有銷量數據，而銷售數據其實滞後于民衆的口味變化。

那什麽反饋是最快的？

如果一個廚師在一道川菜裏放了甜口的調味料并且大受好評，周圍的廚師就會很樂意分享這個食譜，如果能第一時間獲取到這個菜譜，就可以進行調味料的創新。某種程度上來說，這是廚師的 Github。

而爲什麽一直沒有内容的 Github 呢？

因爲内容的 Github 很難做，大家要凝聚共識，要互相讨論，但内容又是個很主觀的事情，所以編輯部需要有主編拍闆，因爲要有核心創作的最後決策。

但是這件事對于更高效的 AI 時代的内容創新，已經不是最高效方案了。比如說小衆愛好的内容創作，一直有内容創新的瓶頸，因爲它的供給和消費的循環沒法建立起來，人數太少了，沒有足夠的創作者去創造内容，就會導緻消費也循環不起來，然後社群就會消亡。

但是這件事情本身的價值其實很大，小衆人群的内容可以構成共識，而共識會形成很大的價值。

那麽，今天的 AI 就可以改變這種現狀。

AI 改變了内容創作的協作流程，但不是像 Reddit 那樣進行像素級别的協作，那隻有行爲藝術價值，但結果沒價值。

但如果在角色上，或者基于某些特定的概念，如果我們有共同的創作目的，我相信在 AI 的幫助下，是可以自下而上産生好内容的。我們花了一年時間，至少做了 30 多個新媒體賬号，在小紅書和視頻号上跑出來成功的案例，而且這個是跟非 AI 内容一起競争取得的結果，我們覺得這算是找到了 Content Market Fit 了。

這其中最重要的一點就是 AI as Composer，not Creator。

最終的内容還是由專業的人來供給，大家一起參與把一個角色玩起來變成一段劇情，這段劇情可能是 PGC 創作或者其他的用戶來供給，我們可以把角色世界觀、場景以及發生的劇情重新拆出來，一點點控制變量，讓 AI 去補到足夠好，最後的結果還是有人願意看的，有足夠消費屬性的。這樣最終通往一個真正的 AI-native 内容形态。

比如說這張圖，其實就是用戶提議做 CP 圖，柯南和灰原哀，然後 AI 生成了這樣的圖，這張圖在 B 站獲得了兩百多的點贊。東西是人想的，但是 AI 很容易把這個想法還原出來，甚至還能帶點意外驚喜。

基于這樣的形式和内容要求，我們在初期其實也是切入到幻想和二次元類别。因爲這些類别上有成熟的創作模式，比如 Lofter 上的同人内容。

在此基礎上，會發現這個模式其實不支持長叙述，隻能支持一定程度的短叙事。同樣是互動叙事，橙光模式就不适合，因爲橙光的遊戲是追求長叙事，講究前期的引導和後期的解密，是常見的草蛇灰線的模式。什麽樣的内容适合做呢？像《名偵探柯南》《哆啦 A 夢》這樣長線由劇場版推動、短線由單元劇推動，然後基于角色 base、事件 base 來展開的内容内核就很好。

用戶會因爲角色或者事件參與進來，還有就是用戶對于角色的故事線（角色驅動）是有預期的，比如成長環境、家族關系、社交等，都是可列舉和填充的，但如果是故事支線驅動（情節驅動）的，這個分支就沒法枚舉，無法預料。

這些内容的創作者，也不是目前已知的優質創作者，因爲他們（現有優質創作者）都被他現在能做好的内容形式綁定了，隻能去一個 Ta 不被看成是優質創作者的地方淘金，然後通過各種創作活動或者比賽，挖掘出其中的好苗子，而不是一開始就征集到好的創作者。

而最終，每個人都能參與創作，也能享受看故事的樂趣，看自己的故事的樂趣。

03 大模型的核心是降低用戶創造内容的成本

分享嘉賓：喜馬拉雅珠峰 AI 産品研發總監呂睿韬（秀才）

珠峰 AI 将在今年推出他們的語音大模型，在語音生成上能力更強。秀才則從語音生成的角度分享了他對于大模型如何改造内容生産的理解。

從定義來說，什麽是大模型？我們覺得人就是一個大模型。人從小到大、從無到有，進行了不同角色的轉化，不同能力象限的提升。把人拆解的話，我們認爲人是由三部分組成的，分别是形 + 語 + 意。

形是是指人的外設，包括形象、動作、神态表情等。

語就是語音交互，從寶寶出生到成長，一直是語音交互的，語音信息裏 40% 是文本， 60% 是富語言信息（情感情緒、韻律、口吻等）。文本本身是一個概念抽象的内容，但是語音的富語言信息是有情感的、有特性的，語音更有溫度、更多樣性，所以語音也是人 " 成長 " 過程中很核心的一環。

意就是思想智慧，構建這部分的就是大語言模型。

所以我們的訴求就是打造一個具有角色人物視覺外設，有情感、有垂直任務能力的大模型。一定是垂直任務能力，隻有在一個垂直任務能力上做好，單點擊穿才是有壁壘的，什麽都做 60 分不如做一個 90 分，選擇的核心邏輯是聚焦。

我們對整個模型的思考，核心應該是讓用戶充分把 AI 用起來。這一代的大模型核心是把創造的邊際成本降低，讓用戶充分參與進來。大模型就是超越用戶現有的能力，對用戶做增益。那我們覺得語音這條線的增益就是讓用戶可以具備超越自身限制的語音語言能力。

我們構建的第三代語音大模型，相比行業内第二代模型，不僅僅對音色的還原度極大提高外，還完美還原韻律腔調和口吻，同時支持音頻 prompt 和文本 prompt 兩種方式提示方式調整音頻創作效果。

用戶使用 15 秒的聲音作爲音頻 prompt 喂給大模型，可以迅速得到完美複刻，而且是原有韻律和腔調的，然後用文字 prompt 來調節輸入音頻文本的音色，或者音頻中要包含的各種情感，都可以直接調整。這就是一個創造力再造的過程，把創造的能力不斷放大。

大家一定要重視數據工程産品的建設。相較于文本标注來說，視頻标注和語音标注非常難，我們現在會先用模型自動化标注提供算料處理效率和質量，另外我們甚至還有 100 多個 " 音視頻導演 " 來做數據處理管線的設計，隻有用專業的人才能做出高質量的數據。強大的數據工程産品是構建富有産品競争力多模态大模型的基石。

AI讓所有人都可以成爲創造者

現在很多家都在做數字人，我們在這方面的思考是，我們認爲未來的這種交互形式，或者說内容形式，一定是 AI 生成的。我覺得未來隻有AIGC， PGC 和 UGC 隻是 AIGC 的過程，它們給 AIGC 提供養料，未來都會被 AIGC 替代掉。

數字人這個事情，GPT 讓我們擁有更多的文本能力上限，把我們的能力邊際打開。我覺得 2024 年一定是超級個體元年，用上 AI 之後，人人都是創造者，而且是快速的創造。

提問：什麽叫好的數字人交互？我們本身也是做數字人的，現在的交互就是把文本、語音、表情、動作四個單獨的模态疊加在一塊，但效果很普通。很多用戶反而會喜歡迪士尼動畫裏的那種效果。

合成數據，動漫、遊戲的數據都往裏面放，而不是單純真人。數字人不是一味追求真實性，而是追求演繹效果。一味地還原不是用戶最終想要的，用戶想要的是表達和演繹的增益，包括形象增益、知識增益還是表達增益。" 理解 " 用戶、" 成爲 " 用戶、" 超越 " 用戶。