圖片來源 @視覺中國
文 | AI 産業研究中心
在過去幾個月中,随着 ChatGPT 在全球範圍迅速火爆,國内 AI 大模型賽道的熱度也随之急速升溫。各路業界大神紛紛推出自己的大模型産品,八仙過海,各顯神通。
誰将打造出比肩 ChatGPT 的中國人自己的 AI 應用?誰将成爲中國的 Open AI?這兩個極具挑戰性的問題,不斷刺激着國内衆多互聯網大廠和科技大佬們的神經。同時,這兩個問題的提出,也預示着中國 AI 産業發展趨勢,已經從 1.0 版的 " 分封割據 " 期,邁入了 2.0 版的 " 戰國 " 時代。圍繞 " 大模型 " 的發布,國内 AI 界正在上演着一場 " 大混戰 "。
國内生成式 AI 大模型界進入 " 五霸七雄 " 争鋒時代
縱觀眼下國内涉足 AI 大模型賽道的玩家,如果按照已有相關産品落地的行業屬性來分,主要分爲 " 互聯網界 " 和 "AI 科技派 " 這兩大流派。
所謂 " 互聯網界 ",指的是目前已經有具體産品的互聯網大廠,其中又以百度、阿裏、騰訊、網易、京東這 5 家爲代表。先是百度和阿裏争相推出各自的超大規模語言模型 " 文心一言 " 和 " 通義千問 ",并開放内測;後有騰訊、網易、京東也競相公開自家的大模型産品 " 混元 "、" 玉言 " 和 "ChatJD",且紛紛預告上線發布。由此,也成就了這 5 家互聯網企業大模型界 " 五霸 " 稱号。另外,知乎、網易、360 等一杆互聯網企業,也紛紛推出新品或研發計劃。
而與此相對應的則是 "AI 科技派 ",即以 AI 硬核科技企業爲主的單位。它們也不甘寂寞,紛紛争先恐後地推出自己的大模型方案和發展計劃。其中又以華爲、商湯科技、科大訊飛、深蘭科技、昆侖萬維、出門問問、智源研究院這 7 家最具代表性。尤其是今年 4 月份集中爆發,如華爲、商湯、深蘭科技、昆侖萬維、出門問問等科技企業分别推出了 " 盤古 "、" 日日新 "、 " 矽基知識 "、" 天工 " 和 " 序列猴子 " 大模型, 5 月初,科大訊飛也發布測試很久的 " 星火 " 大模型。因此,這 7 家科技企業也被業界譽爲大模型界的 " 七雄 "。
由此,國内生成式 AI 領域的 " 大模型混戰 ",就此全面開打。
" 通用派 " 和 " 垂類派 " 的路線之争
但如果換一個角度,我們發現今天國内 AI 企業界,除了分爲 " 互聯網派 " 和 "AI 科技派 " 以外,還存在大模型開發的類型派系之争。從以上這些企業推出的大模型來看,基于目标人群、用途和适用場景的不同,又可以分爲通用和垂類兩種大模型開發企業。由此,也誕生了 " 通用派 " 和 " 垂類派 " 這兩大派采用不同大模型開發路線的企業群體。
其中,開發通用類大模型的企業,目的是爲了做理論框架的搭建、大模型的訓練以及算法等,且這一類大模型的目标人群基本是針對所有人,适用範圍也很廣。說穿了,這一派做通用大模型的企業,就是在做通用 AI 的技術攻關,目的是爲了打造中國版的 ChatGPT。
而開發垂類大模型的企業,則是以深度解決垂直領域問題爲主,以産品開發爲目的,即企業在自己擅長的領域開發一個産業版 ChatGPT,然後直接應用到自己的相關 AI 産品上,使該産品實現或增強某種功能。這一類大模型的搭建相較于通用大模型而言,在算力上的要求相對較低,但在數據量和算法上針對性會比較強。
由于在用戶群體規模體量和應用場景适用範圍上,通用大模型都要遠遠大于垂直應用類大模型,所以其開發周期和所需要投入繁榮财力、人力也遠高于垂直應用大模型。因此,目前國内做通用大模型的企業,基本上都是互聯網或科技大廠。像百度、阿裏、華爲等這些互聯網大廠和科技巨頭,就是屬于 " 通用派 " 系。
而就内容反饋數據來說,相較于通用大模型,垂直應用大模型生成的内容更符合特定垂直類場景的需求,質量更高。因此,也就吸引了衆多 AI 科技企業參與其中。如深蘭、出門問問、有道等聚焦 AI 具體賽道的企業,就是典型的 " 垂類派 " 企業。
就目前市場關注度而言,由于受 Open AI 成功開發 ChatGPT 并迅速走紅的影響,國内社會各界把目光大都集中到 " 通用派 " 企業和大模型上來,相反 " 垂類派 " 企業和産品卻受到了冷遇。
顯然,ChatGPT 的成功,正在潛移默化地引導着國内 AIGC 産業發展的走向。
諸神混戰之下,誰主沉浮?
那縱觀這些參戰的企業,到底誰能在這場 " 大模型混戰 " 中存活下來,并最後拔得頭籌?先後競相登場的那些大模型,它們的未來會是星辰大海,還是一地雞毛呢?下面我們就來盤點一下。
首先,來看目前市場上曝光率最高的大模型四巨頭 "BATH",即百度的 " 文心一言 "、阿裏的 " 通義千問 "、騰訊的 " 混元 " 和華爲的 " 盤古 "。這幾個大模型有以下幾個共同特點,那就是都布局了 NLP、CV、跨模态,适用範圍和對标人群都很廣,且都動用了海量數據參數進行了預訓練。
但這也導緻了這四家的大模型同質性太強,應用上基本沒有區隔,正式進入市場後,非但難以發揮各自優勢,反而極易導緻 " 内鬥 ",就好比在一個 " 浴缸 " 裏養了 4 條鲨魚,妥妥坐實了 "BATH" 之名。
然後,再來看市場上已公開的垂直應用大模型。這一類模型的特點是目前已經正式對外公開的不多,名氣也沒有 "BATH" 的響,且都不是獨立推出,而是附身于企業開發的某個具體 AI 産品上。
如有道近期推出的自研教育場景下類 ChatGPT 模型 " 子曰 ",就是服務于 AI 口語老師和中文作文批改應用上的;而面向金融領域的 AI 企業百融雲創,也将研發的與 ChatGPT 采用同源技術的智能語音機器人應用于金融行業的零售業務上;另外在 4 月 23 日舉行的全國工商聯物聯網委員會年會暨物聯網與人工智能高峰論壇期間,中新社報道深蘭科技開發的國内首款強化學習個人數字化産品 metamind 已經應用了自主知識産權的 " 矽基知識 " 大模型…這些都是 AIGC 大模型在垂直應用領域的成功案例。
從市場營銷角度來看,一個産品問世後,正确的市場手段是創造一個新的消費領域,以此避免自己陷入原有紅海市場的競争。這對于 AIGC 大模型開發應用來說,也是完全适用的。因此,像 " 子曰 "、" 矽基知識 " 這一類産品技術的研發,可以說是在 AIGC 大模型實際應用上的一次突破創新。
而從另一方面來說,目前國内市場上所出現的大小廠都一窩蜂地去做類 ChatGPT 産品,對整個産業發展而言,并不是一個好的現象,隻能說是脫實務虛,其中絕大多數企業應該是走不遠的。就以 "BATH" 這四巨頭而言,最終也很有可能陷入内耗式競争。相反,企業如果能集中力量,聚焦某個具體應用領域,開發垂直應用大模型,也許會有意想不到的收獲。
就以 " 矽基知識 " 大模型爲例,不同于傳統意義上的類 ChatGPT 大模型," 矽基知識 " 是專爲深蘭個人數字化産品 Matemind 研發的,具備内容生成、記憶和發現三大功能,不僅能智能生成内容,還能将所生成的内容轉化爲用戶個人記憶整體保存下來,作爲 " 數字分身 " 基礎數據,以備未來生成新内容和延續個人 " 矽基生命 " 所需,有效解決了個人數字化所必需的數字分身在知識學習、積累和應用方面的問題。
簡單地說," 矽基知識 " 不僅實現了人生命的 " 數字化永生 ",還指出了一條人工智能産業發展的新路。透過 " 矽基知識 " 大模型這個案例,我們甚至可以說每一款垂直應用大模型,都是一盞點亮人工智能産業發展新方向的明燈。
搞大模型,瞄得越小,做得越好
自從進入 21 世紀以來,我們分别經曆了互聯網熱、電商熱、大數據熱……每一次熱潮開始,都會引得各方都争先恐後地湧入,但潮水退去之後,就會發現當時那些蜂擁融入的弄潮兒們,絕大多數都不知所蹤,真正活下來的都是那些默默耕耘,在某個具體領域做出成績的企業。
那面對大模型混戰愈演愈烈的今天,中國企業應該如何參與其中?在我看來,做大模型既要看準大方向,也要瞄準小目标,切忌貪大求全,隻有這樣才不至于重蹈以前那些失敗者的覆轍。
百度的李彥宏就曾表示,ChatGPT 作爲一個通用模型,對于某些特定領域并不擅長,而大公司一般都從通用型産品開始做起,初期他們并不會特别關注某個細分垂直領域,但當你在某個細分領域内做到極緻,你就會發現你的産品和所積累的用戶需求,很難被其他産品直接複制,此時你再去拓展應用領域,就會比較有競争力。
錢學森在《系統工程論》提出這樣一個核心觀點,那就是做任何技術産品,都要從現有條件出發,不求單項技術的先進性,隻求總體設計的合理性,充分利用現有資源;以總體設計負責對各個分系統的技術協調提升改造現有的工業技術。把這個理論放在大模型的開發上,一樣适用。大模型再厲害,也隻是一項技術,它必須應用到具體産品上,才能發揮最大作用。因此一個企業做大模型,并不是做得越大越通用就越好,而是應該基于産品,聚焦在某個需求上,合理開發和利用,進而實現大模型在産品中功能的最大化。
不跟風,堅持做自己,保持一顆平常心,這一點對所有涉足中國 AI 領域的企業來說,都尤爲重要,無論你是否參與了這場混戰。
做 AIGC 大模型本身就不是一場百米賽,而是一場馬拉松,比拼的不是看誰眼前跑得快,而是看誰今後走得遠。無論是百度、阿裏、騰訊這些互聯網巨頭,還是商湯、科大訊飛、出門問問、深蘭科技這些 AI 賽道能手,誰能走到最後,關鍵還是看誰現在的做法對頭。
因此,有必要在這裏潑潑冷水,讓大家都冷靜冷靜,千萬不要盲目跟風,被 ChatGPT 引燃的這股通用大模型 " 虛火 ",給引火燒了身。(本文首發钛媒體 APP)
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App