前不久,原阿裏首席 AI 科學家賈揚清的一條朋友圈截圖四處流傳。賈揚清說,他的一個朋友告訴他,某國産大模型不過是 LLaMA 架構,隻是更換了幾個變量名而已。
很快有好事者發現,在大模型、數據集開源社區 Hugging Face 上,就有一位開發者發出了類似質疑:" 該模型使用了 Meta LLaMA 的架構,隻修改個 tensor(張量)"。LLaMA 是 Facebook 母公司 meta 旗下開源免費商用的開源大模型。
賈揚清的朋友圈之所以流傳,很大程度是因爲其戳破了 AI 圈一個人人皆知的秘密:所謂的自研大模型,其實 " 水分 " 很大。
一位投資人曾對「暗湧 Waves」說:兩個月就上線一個大模型," 想想就不對不是嘛 "。早在今年五月的 Waves 大會上,中國人民大學高瓴人工智能學院盧志武教授就指出,所謂 " 國産大模型的春天 ",不過是很多公司在 " 微調國外底座模型 " 的假象。
盡管從現實來看,微調似乎是不得而爲之的。原因可以很宏觀:openAI 如此兇狠,除非你能超越它,否則做半天,很可能也不值錢,甚至不如開源。原因也可以很具體:這是一個沒有兩三億美金幾乎上不了牌桌的遊戲,讓一個初創公司從頭訓練大模型幾乎是癡心妄想。
昨天的讨論中,青年 AI 學者符堯也在一個群中表達了自己的理解,他認爲 " 如果因爲架構不變而批評一個模型沒有創新,這樣的批評對任何一個模型都是不公正的 ",因爲所有的模型都是在前者的基礎上接力完成的," 每個模型架構基本都大同小異,但效果完全不同 "。
有投資人表示,在 Hugging Face 上,架構一樣但名字不同的模型的确很多,因爲大部分改動的是訓練方法以及數據配比。
賈揚清在後來的聲明中也進一步解釋道:他批評的并不是模型架構不改變,但是生生改了個名字。改名會帶來的麻煩是,原來适配 LLaMad 的代碼可以用,而現在則要做大量工作來适配新名字。
這起風波或許偶然,但也呈現出了在追趕 OpenAI 過程中,速度的緊張與邊界的模糊。
對于中國的 AI 創業者——尤其是應用型創業者來說,作爲新一代 AI 技術的追随者,他們正在進入的是一種前所未有的難以與 OpenAI 區分 " 你我 " 的模糊地帶。
前幾天召開的 OpenAI 開發者大會是一次最新的導火索。去年底,ChatGPT3.5 橫空出世後,中國的 AI 創業者有過幾波集中的人頭攢動。最早,無論是大廠還是創業公司,都有一種大模型執念。但 GPT4 的快速發布以及大廠進擊後,除了 Minimax 和智譜 AI,因爲 " 起跑早,已經有相對成熟的大模型産品出來 ",以及極少數其他公司,多數人快速放棄了大模型路線。
當時還存在、且大放光彩的王慧文創立的光年之外,以及王小川的百川智能,也很快選擇了大模型和基于模型應用兩條線并進。
但被稱爲 "AI 界春晚 " 的 OpenAI 開發者大會,預示了一大批初創公司的必然徒勞。這場大會不僅有會前流傳的 GPT-4 Turbo 和更強大的全新功能,還将推出 GPT store, 以及自定義 GPT ( GPTs ) ,而用戶也可以創建自己的 GPT。
這意味着,在中國創業者最擅長的應用這個賽道上,也極可能寸草不生:如果你沒有快速掌握垂直的場景、數據,可能随時被吞噬。
這就是這一代 AI 追随者的窘境:新一代 AI 應用型産品定義,必然要結合大模型的能力邊界,而關隘是,大模型的能力始終在快速演化,OpenAI 始終在演化。
前端的變動不居,後段的應用就如同是沙灘上的高塔。
今年 5 月,某知名初代産品經理還信心十足地表示,Chatgpt3.5 發布之後,中國的産品經理早已在行動。而這次 OpenAI 發布者大會之後,面對 "AI 創業者的機會還剩多少 " 的提問,他也隻回複了一個哭笑不得的表情包。
過去在互聯網和移動互聯網時代的傳遞鏈條上,從 copy to China 到 copy from China,中國的創始人憑借的是龐大的市場和用戶群,孕育出的龐大産品經理,整個過程可謂是行雲流水,異常絲滑。而在新的 AI 時代, 這種珠聯璧合顯然已經被打斷。新一代的産品經理,不僅僅需要産品能力,還要充分理解大模型以及數據。
當然還有一條衆所周知的變量在于:與技術與産品邊界定義權一起失效的外部環境。
那麽在當下,一個中國 AI 創業者、尤其是應用類公司,該怎樣找到解法?
一個樂觀者會告訴你,大模型一定分地域的,所以中國的大模型與 OpenAI 并不一定有直接競争。
其次,那些基于 AI 的原生應用、社區以及掌握垂直場景、數據的公司,也會存在回旋的餘地與大口呼吸的空隙。事實上,很多應用層創業者,也都來自教育、醫療、遊戲等垂直領域。AI 的進展也在進一步引燃自動駕駛、電動汽車、機器人等領域。
很多人提到 " 數據壁壘 " 之說:一種是垂直行業非公開數據積累,而 ChatGPT 主要是泛行業的公開數據;一種是用戶私有數據的積累," 了解越多,就越懂你 "。
這個邏輯大概率是成立的。因爲在未來的垂直場景、數據的争奪戰中,必然會迎來掌握嶄新技術的 AI 創業者與手握數據和客戶資源的傳統企業服務公司、垂直領域龍頭公司的一場厮殺。
讓我們回到問題的最初。一位 AI 投資人曾向我們提出一個問題:" 在 OpenAI 這個前所未有的新物種面前,誰又不是抄作業的那一個?" 從模仿到創新,是大部分後發地區的必然路徑,甚至這也是多數人生的路徑。
其實更務實地說,問題應該是:怎樣才是更有道德的 " 抄作業 "?
在瞬息萬變的創新生态裏,往往都是迅猛且邊界混亂的,過度 " 苛求規範 ",某種意義的确會影響效率甚至扼殺創新。但即便如此,也應存在底線。
就像在最早那條朋友圈的最後,賈揚清發出的具體請求:各位大佬,如果你們就是開源的模型結構,求高擡貴手就叫原來的名字吧,免得我們還要做一堆工作就爲了适配你們改名字……
保留原來的名字、或者多加個聲明,就是這個時代裏一份難得的體面。