滿天飛的大模型,有幾個能掙到錢?
文 | 世昕
編 | 園長
僅憑幾十個提示詞,就能生成一段流暢完整、視角多元的視頻,其内容質量幾乎能以假亂真,甚至不亞于專業拍攝團隊,這就是 OpenAI 首款文生視頻産品 Sora,一經發布便激起千層浪,讓全球感受到新的 AI 震撼。
2024 年的 AI 故事,伴随着這款殺手級應用的橫空出世拉開帷幕,Sora 再度讓所有人注意到了 AI 的無限可能性,爲略顯疲軟的市場再打了一針雞血。
回看 2023 年,AI 産業迎來了空前發展,海内外 AI 企業如雨後春筍,國内更是迎來了聲勢浩大的 " 百模大戰 ",通義千問、文心一言、智譜 AI、盤古大模型 ..... 卷多模态、卷算力、卷 token,一時間百家争鳴。
但一個核心的問題仍舊盤桓在所有人頭上:大模型産品到底如何實現商業落地?商業是技術發展的内生動力之一,唯有業務飛輪轉動起來,才能讓企業們真正走向未來。
垂直大模型,走向落地
2023 年的 " 百模大戰 " 到底爲行業帶來了什麽?
或許是一個清晰的商業認知:垂直化,才是大模型走向落地的實際路徑。
" 事實上 AI 大模型産業還處在一個很初級的階段,創造的内容、解決的問題還相對比較初級。"初心資本合夥人李可佳向刺猬公社表示。
初心資本是國内一家專注于人工智能、智能硬件、前沿科技及探索性投資的早期股權投資機構,對于 AI 産業有着較深的洞察。
李可佳用丹尼爾 · 卡尼曼《思考,快與慢》一書中的系統概念爲我們解釋了目前大模型産業的發展階段:
丹尼爾 · 卡尼曼認爲,在人的大腦中有兩套系統,系統 1 指的是快系統,是一種涉及直覺的思維方式,用于快速決策。它做出決策的依據主要依賴于偏差、偏見和錯誤的啓發法,它是無意識且快速的;系統 2 則是一種慢系統,它更爲慢速和理性,負責對系統 1 進行有意識的控制,特别是在涉及複雜問題的情形中,是否形成系統 2 也是區分人與動物的重要指标。
" 現在整個産業的發展仍處于系統 1 階段,在對創造力要求比較高的文科、藝術等領域,AI 已經有很好的表現,它的泛化能力也非常強,但如果希望它能解決一些很實際複雜的技術問題、商業問題,我們仍然需要等待‘系統 2 ’的到來。"
AI 目前正處于互聯網的 " 雅虎時刻 ",甚至還沒有發展到 " 谷歌崛起 "。OpenAI Sora 這樣的明星産品固然能讓人提振信心,但商業落地問題是全行業都要面對的問題:
目前人們已經能與 AI 展開對話、通過 AI 生成文本、圖像、甚至高質量的視頻,但問題在于,這些生成能力目前還處在較低水平,Sora 還不夠多,當幻覺與新鮮感散去,在 C 端難做突破的大模型們,該去哪裏實現自己的價值?
B 端是較爲實際的出路。
這也是李可佳口中的 " 系統 2" 發展方向,通過理性、高效的 AI 爲商務、工業提供助力,從而深刻改變整個産業,這也是大模型商業落地最實際的方向。但另一個事實是,通用大模型往往不能很高效快速地适配于企業的需要。
于是,大模型産業走向垂直化、細分化、專業化,已經成爲了未來最重要的趨勢之一。
無論是 GPT 還是其他基于 Transformer 架構下的大模型産品,其生成反饋的原則都并非線性的邏輯思考,而是根據 " 學到的知識和規律 " 來進行概率組合,這也是爲何大模型學的越多越強悍的原因。
通用大模型的問題就是,它學習的主要是通用的、可公開的知識數據,針對擁有信息壁壘的産業領域,通用大模型很難發揮作用。
這也是目前國内外許多廠商在做的。在教育、政企服務、醫療等領域,許多大模型都開始了走向垂直化,包括網易的子曰教育大模型、專注政企客戶的雅意大模型、在金融、醫療等領域深耕的百川大模型等。
通過小而精的訓練方法,不僅能夠突破大模型無法解決專業問題的阻礙,還能進一步降低成本,讓大規模推廣成爲可能。
" 以前很多人都認爲,隻要模型的規模夠大,過了多少億參數,模型就能達到很強的能力,但其實其對于任務的理解能力還是比較淺顯的。"
在 2023 年底,雅意 2.0 大模型發布時,中科聞歌董事長王磊曾向刺猬公社表示,在他看來,垂直專業才是大模型發展的未來方向,雅意 2.0 大模型也同樣遵循了這樣一個方向,不再一味的追求規模與 C 端反饋,而是選擇摒棄娛樂向的内容,将更多專業知識數據融入訓練中,從而實現更好的政企服務。
那麽有哪些産業能夠更快的實現 " 大模型化 " 呢?
李可佳認爲這主要看行業的容錯率與專業度。在智慧教育領域的多年深耕讓他認識到,在容錯率相對較高、對專業精準要求相對較低的領域,AI 帶來的變革将更容易發生。" 在拍搜、語言學習這些領域,大模型帶來的效率提升是非常顯著的。"
他認爲,醫療、金融等領域也正在産生變革,伴随着大模型能力的不斷進化,更多工業、科技領域的生産制造都會迎來一場 AI 改造。
AI Agent:突破 AI 需求困境
那麽如何将大模型的能力更直接的運用到我們的生産過程中?AI Agent 或許是一種更現實的路徑。
" 可以這樣構想一下,我還在做别的工作或是休息,在一個類似元宇宙的空間裏,我的 AI Agent(代理)與另外一位創業者的 AI Agent 相遇,它們聊的很開心,或許等我醒過來,我的 AI Agent 就拿着對方的商業計劃書來給我看了。"
AI Agent 在未來将成爲人與 AI 大模型連接的工具,成爲 AI 領域繼 GPT、文心一言等大模型産品的下一個熱點,正在被越來越多人所認同。
一位 AI 從業者向刺猬公社表示,AI Agent 不僅僅會成爲便利工作生活的工具,還能真正推動大模型從 B 端到 C 端的實際落地,推動 AI 産業的商業化成熟。
換言之,AI Agent 是 AI 産品更成熟的形态,它真正的使命就在于将 AI 能力封裝化,讓 C 端、B 端用戶都能更便捷更直觀的運用,從而助力生産力的解放。如果說大模型産品隻能被動的接收 - 生成,那麽 Agent 的使命要複雜的多,它更類似智能助手,需要借助自身的 AI 能力幫助使用者解決切實問題。
" 其實這是一種 AI native 的認知。" 李可佳表示,不同于很多企業 +AI 的思維,Agent 事實上是一種 AI+ 的邏輯。
" 面對 AI 浪潮,我們不能隻去想如何利用 AI 能力加持我們已有的業務形式。我就認識很多創業者,希望通過大模型提升自己的 Saas 服務能力,比如做一個郵件營銷的生成式 AI 産品等等,但他們卻忽略了一點,以後有些 SaaS 類産品可能都直接 autopilot 了,這個産品對應的環節可能都沒了。"
Agent 的意義就在于,它正在改變着人機協作的邏輯:
不僅僅是協助工作,AI 就可以獨自幫助使用者完成任務,它不需要事實的提示詞輸入,也不需要使用者一步步的繁雜操作,隻需要一個指令,Agent 就能幫你完成很多在過去時代無比複雜的工作,比如數據分析、廣告營銷投放、甚至是社交、銷售這樣主觀性很強的工作。
這幾乎是革命性的,在 Agent 日漸成熟的情況下,很多行業的許多環節都能夠被改寫,甚至取代。
GPTs 就是 OpenAI 針對 Agent 概念推出的産品之一,定制化的 GPT 機器人、能夠滿足不同的使用需要、專注于不同的領域,GPTs 的推出一度讓全球 Agent 企業大感危機。
目前來看,GPTs 似乎還沒有達到 Agent 的程度,對于國内外的許多 AI 企業來說,機會仍然存在。
但 Agent 不是更智能的 AI 聊天機器人,其最主要的能力是主動調用 AI 工具,爲使用者解決問題,想要實現這樣的能力,除了技術能力外,與 Agent 背後的大模型基底息息相關,比如多模态的輸入輸出能力、幻覺問題、多輪交互的高效靠譜,都将影響 Agent 的表現。
更重要的是,Agent 的應用往往要與不同的産業領域、應用場景相結合,這就與前面提到的垂直化趨勢深度相關。
現如今國内也已經出現了很多垂直領域的 Agent 産品,百度研發的營銷 Agent 輕舸、釘釘、飛書的 AI 辦公助理,這些企業從自身已有的産品和業務優勢出發,希望借助 Agent 創造新的産品邏輯,從而實現産品的二次成長。
以釘釘的 AI Agent 爲例,其 AI 助理可以與釘釘本身 " 融爲一體 ",根據用戶的指令,與平台上的應用和第三方插件、企業自建應用等結合,對這些功能進行調用。這樣一來,也讓釘釘龐大的插件和應用庫變得簡單易用,用戶不再需要一個個找應用,AI 助理就可以做到更符合用戶使用場景的匹配。
類似釘釘 AI 助理這樣的産品,正在解決大模型的 " 僞需求 " 困境,帶有強烈的 "AI native" 思維。當更好用、更有效的 Agent 産品被用戶看見、使用,甚至解決工作生活中的種種痛點,大模型的商業落地難題也終将得到解決。
從娛樂需求,到更廣闊的世界
現如今整個産業到底還面臨着哪些問題?
最重要的仍是技術能力問題。" 如果從創業的角度出發來看,或許你在進行邏輯推演時,能夠獲得一個不錯的推算結果,但真正重要的還是能否讓用戶感受到‘神奇時刻’。"李可佳表示。
對于大模型産品來說,最重要的仍舊是通過技術解決用戶需求的能力,自 ChatGPT 橫空出世以來,無數人都認爲大模型産品将改變整個互聯網的生産邏輯,但未來的進程似乎要遠慢于我們的期望。
歸根結底,是大多數大模型産品的能力遠沒有達到 " 神奇時刻 ",簡單的多輪對話或許能爲用戶帶來一刻的驚豔,但缺乏實際解決問題的能力。
" 質量信号沒有達到效果,還要看數量信号,也就是用戶的留存情況。" 這也與産品的實用性相關,GPT 能夠在全球席卷上億用戶,除了出類拔萃的能力外,優質的交互體驗,不斷推出的多模态生成産品,都是關鍵因素。
有 Sora 這樣的殺手級應用,OpenAI 自然不會爲用戶、商業化發愁,但對于其他玩家來說,除了在研發上下苦功外,垂直專業化、加強體驗、創建多元應用場景就成爲了重要的路徑。
除此之外,抛開大模型産品、Agent 等固有思路,大模型還有許多新的機會。
作爲早期投資市場的布局者,李可佳和所在的初心資本的投資邏輯可以概括爲 " 兩橫三縱 ",在這樣一個坐标圖譜中,蘊含着初心觀察到的産業機會。
" 兩橫分别是人才紅利和供應鏈紅利,在過去十幾年中國移動互聯網的飛速發展之下,整個行業培養了大量的工程師、科研人員,在全球都有着不少的優勢,另一方面,中國在制造業上擁有很強的優勢,尤其是在 3C 硬件等領域,我們的制造業供應鏈相當完備。"
以這樣兩個紅利爲基礎,三縱則代表了幾個重要的技術變量,第一就是生成式 AI,其餘兩縱則爲算力的性能躍遷和電動化到智能化的變遷。三縱與兩橫之間的許多交叉點則蘊含着新的機會,例如 AI+ 硬件、AI+ 元宇宙、AI+XR 等可能,都正被深切關注着。
在海外,Rabbit R1 等 AI Pin 硬件令人關注,而在國内,榮耀、OPPO 等廠商相繼推出 AI 産品、AI 手機等,希望實現彎道超車;在 XR 領域,萬衆矚目的 Vision Pro 同樣與 AI 有着千絲萬縷的聯系,在 AI 大模型的支持下,新的世界圖景正在逐漸展開。
但最重要的仍舊是 AI native 思維。
" 最讓我感覺興奮的是,在矽谷這些地方,我們接觸到了很多非常年輕的創業者,他們從不懷疑 AI 能否改變世界,他們的創業項目,都是基于 AI 時代已經到來的前提下開展的。" 李可佳向我們回憶,而這些 AI native 思維加持下的創業者,也讓他真正看到了未來的圖景。
" 新的技術正在改變世界的每個角落,如果沉溺在舊世界裏,很可能會被時代抛棄。"
商務合作聯系微信号 |yunlugong
如需和我們交流可後台回複 " 進群 " 加社群