圖片來源 @視覺中國
文 | 獵雲精選,作者 | 盛佳瑩
" 盡管在泡沫期,貼上大模型标簽的公司都很貴,沖上十幾億甚至數十億估值,但這依然是出手的窗口期。" 常年看 AI 賽道的天堂矽谷高級合夥人王偉興奮地說道,他堅信,将大模型的思想和技術武裝到牙齒,必然會建立起一個全新的商業帝國。
由 ChatGPT 掀起的這一波大模型浪潮中 , 百度、阿裏等大廠相繼下場,王慧文、王小川、李開複等大佬也紛紛入場,而創業公司在這波浪潮裏的最大機會在哪裏?
大多數人都并不看好創業公司入局通用大模型,遠望資本創始合夥人程浩就曾公開表示,大廠肯定比創業公司有流量、有錢,而重要的是大廠的核心優勢是自帶場景,不論是百度的問答和搜索,還是騰訊的微信、阿裏的天貓精靈和釘釘,都具備成熟的落地場景。
既然通用大模型機會鮮少,不少創業公司瞄準了垂直大模型。
如今,通用大模型數據來源于公開互聯網場景,但互聯網數據并不等同于全世界的數據,尤其在垂直賽道,依然有很多私有數據。
而深耕垂直領域的創業公司已經積累大量數據和 know-how,具備核心優勢,而大廠的基因并不在垂直領域。範特科技 CTO 郭長柱表示,大模型對于大廠而言在通用和垂直領域之間是魚和熊掌不可兼得," 做通用大模型的大廠,它要的是生态,讓衆多的企業接入它的大模型,以它的大模型作爲底座去賦能百業,這個時候它自己也下場踢球就和它的身份不符,所以它們一般不會輕易這樣做。"
如果在互聯網時代,每個行業都值得用互聯網重做一次,那麽在大模型時代,每個行業依然如此,甚至此前在互聯網時代依然保守的賽道,極有可能被大模型重塑。
這讓投資人足夠興奮,在奇績創壇 2022 年 11 月舉辦的秋季路演日中,陸奇投了 55 個項目,其中有 16 個是 " 預訓練大模型 " 方向,而彼時 ChatGPT 還未發布。
而到今年,前四個月國内 AI 領域就已經完成融資 243 起。面對越來越熱的風口,創業公司們都拿出渾身解數,捕捉這輪機遇。
垂直大模型:變革的生産力
在 ChatGPT 爆火前,大模型已經默默發展了數年,極驗 AI 實驗室負責人曹佳豪坦言,多模态大模型的核心技術本質并沒有發生大的改變。但是在訓練規模大到一個量級以後确實出現了一些感受上是質變的效果。最終大模型能否走到通用人工智能,還是一個未知數。
三維家 CEO 蔡志森也表示,大模型是 AI 從量變到了質變的階段性裏程碑,最大價值在于通過千億數據訓練,其生成的内容超出想象,驗證了這條路徑是正确的。
可以說,這波熱浪更多得益于 ChatGPT 商業和營銷方面的成功,而不是技術叠代。
但不可否認的是,大模型會改變很多垂直行業的業務和商業模式。
對于驗證碼這個行業而言,垂直大模型可以幫助驗證碼廠商管理圖集,也可以誕生新的驗證形式,甚至基于文生圖和圖生圖模式,可以與客戶共創圖集,增強交互體驗。
但對于這樣一個需要人機對抗的領域,大模型也極有可能被用于驗證識别,爲黑産所用,這也更推動極驗在垂直大模型領域進行投入,從防禦角度而言,隻有了解黑産的工作模式,才能精準研發破解手段。
從目前的情況而言,極驗已小規模上線一批由垂直大模型自動生成的圖集,用于驗證碼圖形,極驗發現,雖然大模型對防禦黑産程度有限,但卻可以縮小對抗領域,進而優化對抗資源,從被動防禦轉變爲主動防禦。
而像金融行業而言,過去長尾算法數據收集難、标注時間長、數據不均衡導緻落地效果差,即便一些擁有算法自訓練平台的 AI 基礎設施供應商,像範特科技,其長尾算法的落地難度依然大且周期長。
郭長柱告訴獵雲網,主要是因爲其中包含了大量的人工工作。而如今結合 CV 大模型的能力之後,對于常見物體的檢測和分割可以實現全自動訓練,對于特殊物品也可以借助 CV 大模型把人工作業降到最低。
" 不僅工作量降低了,工作難度也降低了。" 郭長柱表示:" 原來做分割時需要沿着物體邊緣仔細描邊,現在隻需要點一下就能自動分割,這樣我們把系統私有化部署到客戶那裏,打通内部網絡的雲邊兩端,客戶自己坐在辦公室裏就可以對模型進行升級和維護,而我們專注做基礎算法和底層平台能力建設,這樣實際上分工也産生了變化。"
這意味着,垂直大模型将作爲基礎能力對外标準輸出,端到端的解決用戶需求。目前,範特科技已完成語言類大模型、視覺大模型以及多模态大模型的技術預研,将于近期推出相關産品進行落地。
而像家居和電商内容這樣的行業,垂直大模型可以賦能全流程。
聚焦電商内容解決方案的極睿科技創始人武彬告訴獵雲網,在電商内容生成全領域,從拍攝 - 場景圖 - 種草 - 直播切片 - 短視頻,過去的 AI 解決方案隻能賦能部分流程,而垂直大模型可以全流程自動生成,這可以極大地降本增效。
專注家居行業的三維家 CEO 蔡志森也表示,不論在設計場景、營銷場景還是制造場景,垂直大模型可以生産 3D 矢量化的内容,做到 " 所想即所見 "、 " 所見即所得 ",甚至在生産制造端,垂直大模型将取代規則驅動,生産自動化提效,優化人員結構和人機交互模式。
目前三維家已構建起室内空間大模型、定制家居大模型等垂類模型,應用于戶型識别、智能樣闆間、智能櫃體、智能硬裝、智能水電、智能家居布置等多種設計環節。
基于室内空間大模型通過可配置的 AI 知識圖譜和大規模神經網絡,深度學習海量家居家裝方案,可以自動完成智能設計。
而基于真實櫃體數據的定制家居大模型,則可根據尺寸輸入、對話文本生成參數化的定制衣櫃、櫥櫃設計,生産合理的櫃體方案,可直接對接生産,将大大縮減複雜易出錯的櫃體設計時間。
對于各行各業來說,垂直大模型是一種全新的生産力,底層能力的突破不僅可以降本增效,長期來看必然帶來上層應用的躍遷和變革。
如蔡志森所說,一方面,在當前中國的智能化浪潮下,産業側數字化革新本就有廣闊的市場需求;另一方面,在 toB 生态下,基于垂直大模型的應用實踐也有利于形成數據飛輪與場景飛輪。
天堂矽谷高級合夥人王偉也表示,大模型最大的價值在于建立新的商業模式和新的經營思想,重新改造商業組織的每一個環節。
這也是爲什麽創業公司紛紛擁抱大模型的原因。
創業公司垂直大模型第一仗:控本增效
雖然大模型 " 很香 ",但衆所周知,過去大模型的一次性投入成本極高。此前,有市場消息稱 GPT3 單次訓練的成本爲 400 萬美元,因此,不少聲音認爲訓練大模型門檻至少在數千萬元。
但在垂直行業,盲目追求 " 大 " 規模沒有意義,OpenCSG 創始人 & CEO 陳冉将大模型比作一塊 " 玉 "," 如何用好大模型能力,也就是說雕琢這塊玉更爲重要。"
郭長柱也提到,大模型的标準并不能以參數規模一概而論,核心在于其是否具備 " 湧現 " 能力,即其準确率是否達到突然躍升的階段。" 在垂直領域,同樣的效果,通用大模型要千億甚至萬億參數,垂直大模型百億數據也可以達到。"
參數規模的指數級下降,疊加這段時間湧現的衆多開源模型和蒸餾法等變革性技術,過去千萬級的訓練大模型 " 門票 " 已降至百萬級。
但這對于創業公司們而言,這仍然是一筆不大不小的開支,控制成本和提升效率成爲各家公司在百模大戰中的第一仗。
極驗在優化投入産出比方面,采取彈性計算環境,以按量計算完成前期零碎的探索任務。在明确方向後,再轉化爲周期性訓練。
極睿科技則聯合清華大學人工智能研究院,由學術團隊提供算力支持,優化投入産出比。
而三維家則打造了一套多服務器、多 GPU 并行的計算網絡,優化算力調配和運行機制,同時,三維家作爲英偉達的高級初創會員,得到高效利用 GPU 的技術支持,這也加速了三維家垂直大模型的叠代速度。
範特科技在成本和生成效率方面,一方面,通過在現有的産品中整合大模型能力,大幅提升了内部創新效率;另一方面,通過自研的推理引擎優化技術和并行計算技術最大限度的提升大模型推理速度和硬件利用效率,通過自研業務流編排引擎解決最後一公裏的業務流自定義問題,完成基于大模型的端到端的解決問題完整閉環。
事實上,控制成本不僅僅是爲了控制投入,小苗朗程合夥人俞佳偉坦言,對于用戶側而言,成本太高也難以被接受,尤其是在算力低、功耗低的終端場景。
垂直大模型:數據和 know-how 爲王
訓練大模型的成本下降,對于創業公司而言,隻是拿到了入場券。對于垂直大模型而言,核心和關鍵離不開算力、算法和數據。
在一定程度上,錢可以解決算力和算法,但卻很難買到數據,尤其是在垂直領域,很多都是私有數據,能買到的數據意義并不大。
這對一直深耕在垂直行業的公司而言,是天然的優勢。
蔡志森告訴獵雲網,依托其在線的 3D 設計軟件和 3D 制造軟件,三維家已經具備 2800 萬 + 覆蓋全國小區的戶型數據、8100 萬 + 軟硬裝、家具家電、材質飾品素材庫、16.3 億 + 風格種類多樣的設計方案庫,此外,還擁有數千萬參數數據的真實定制櫃體數據集。
與此同時,用戶不斷使用,這些數據集仍按照三維家定義的方向在自動實時生成。
和三維家一樣,深耕電商内容領域的極睿科技每年都在産生數百萬乃至數千萬的電商内容數據。
除了數據壁壘,定位清晰的應用場景、掌握垂直大模型落地的全流程也是核心競争力,這對了解行業 know-how 提出了極高的要求。
實際上,大模型提供的是基礎能力,具體業務則是專有能力的組合。
在郭長柱看來,目前基于大模型的模型即服務(MaaS)是一種創新的模式,即把大模型作爲基礎能力對外标準輸出,端到端的解決用戶需求。但直接使用大模型端到端的解決問題相對較少,尤其是在 CV 領域,更多的是在基礎能力之上針對垂直領域做定制。
" 比如使用大模型自動标注訓練垂直領域小模型,使用大模型更加 general 的特征做 VQA、檢測、分割和識别等二次開發。除此之外,部分業務可能涉及多項大模型能力的組合,甚至需要語言和視覺特征對齊的多模态能力。這就要求我們在實際的業務中必須支持多種大模型的自定義業務流,實現大模型的自由組合和業務的深度定制。"
OpenCSG 也從實踐中積累了大量大模型落地通用行業的實踐,包括垂直行業語料産生,大模型微調,業務結合等方面。
王偉也表示,投資大模型他看好在核心行業有海量行業數據,懂行業 know-how 的企業。
俞佳偉則看好有實際落地場景的企業,尤其是需求強、專業性強的場景,例如醫療、金融、法律等行業。
在陳冉看來,大模型具備了推演、舉一反三的能力,在一定程度上,具備類似人類的腦神經,可以替代不少人類的工作。" 過去最大的創業成本是人,而利用好大模型,重塑工作流,可以極大降低創業成本,這對創業公司來說是極大的利好。"
王偉也持相同觀點:" 将大模型的思想和技術武裝到牙齒,必然會建立起一個全新的商業帝國。"
時代的大幕已然拉開,燦若繁星。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App