深圳的科興科學園面前的那條路,地鐵修了好幾年,走動很不方便。
這裏是附近範圍裏的一個集散地。園區下沉空間裏的餐飲區域是包括騰訊在内的,周圍很多科技公司的 " 食堂 "。
也包括從創業之初就把公司放在距離騰訊不遠的追一科技。他們的辦公地在對面,與科興一街之隔。
很多追一科技的員工會去對面吃飯,但修了路,就不太方便了。
這很像這家公司最近幾年給人的感覺,它離熱鬧很近,但好像又不是很近。
不久前品玩寫過一篇對于追一科技的觀察文章,時間線終止在 2020 年。之後這家公司和整個 NLP 領域的沉寂一起消失在了外界的關注之中。
直到 ChatGPT 的出現重新把關于 AI 的一切活力喚起。但在生成式 AI 壓倒性的優越性面前,NLP 這個概念本身甚至有被整個抛棄的危險。
如果 NLP 都不重要了,一家以 NLP 領域技術爲根基的 AI 公司該如何變化?
在這個角度上,從上一次 AI 浪潮中存活下來的追一科技仍然是很多 " 不夠大又不夠新 " 的中國 AI 公司的合适樣本。
品玩在深圳與追一科技的 CEO 吳悅做了一次對話,我們想知道這家公司在 2020 年之後在做什麽,這樣一位具備商業和技術視角的創始人是如何看待大模型産業的,以及在大模型的競争中,這樣體量的 AI 公司究竟還有沒有獨特的地方。
吳悅不是一個耀眼的創業者了,也沒有選擇在這次新的 AI 浪潮中重新成爲一個 KOL 一樣的人物。他的身份是一家 300 人的 AI 公司的經營者。這意味着他必須專注和務實。
這幾年的沉默背後,追一完成了一個艱難的産品标準化的過程,這曾經是一塊 2000 個 Bug 的硬骨頭,啃下來後,變成面向未來的機會。
他不願陷在對 AGI 沒有答案的争論裏,但相信垂直大模型是堅實的機會,就像發現美洲大陸這件事遠不隻成就了一人而已。
一切尚未塵埃落定。
以下是品玩與吳悅的對話,部分内容有些優化和調整:
現在國内初創公司 " 百模大戰 " 的熱潮像 2016 年左右追一科技出現時的熱鬧一樣了。
現在不少創業公司做的主要還是對 ChatGPT 的解構和複現。這是一個非常有挑戰的事,我們樂見其成。
首先複現 ChatGPT 在現在是一個可以實現的事嗎?
首先相關的論文其實确實很多,并且開源社區中已經有非常多的團隊在做複現。并且 ChatGPT 這個産品已經在那裏了,它并不是一個不可體驗的技術。綜合這些維度來看,我覺得相對來說去複現這個事情的信心和信息密度還是夠的。
另外就是,你要解決的問題明确了,這就變成一個更确定性的事。
也就是說現在尋找的是一個結果确定的東西。
對。美洲大陸在發現之前的投入是很大的,因爲你不知道向哪個方向尋找。但一旦美洲大陸發現了之後,找到一條路去美洲大陸的航道其實容易多了。
這可以換一種更熟悉的說法——國内大模型的機會在垂直領域或者應用層面。但這有點像曾經智能客服和翻譯可能是 NLP 領域最容易摘的桃子那種感覺。
我覺得這個事情,從創業公司角度是生存下去,雖然要有理想,但是生存是第一位的。但是并不代表着說我們沒有一家公司在做這些事。但最終還是要基于有多大能力做多大事。
這是指追一的能力,還是整個中國 AI 領域的公司抽象成一個集體的 " 能力 "?
我不太好說,但我感覺大家現在還是以實用主義,也就是做應用的居多對吧?你說真的像 OpenAI 那樣燒幾十億美金,反正過去我覺得是很難,未來行不行?我覺得也不好說。
從最初頂着光環迎來高增長到後來的發展降速,直到 2020 年的那次裁員後從大衆視線裏消失。追一科技仍然有特殊的地方,它是少有在此前的 AI 熱潮中活下來的公司之一;它也有現在看來更平庸的一面,在大模型面前,他不夠龐大,也不是直接從大模型入手的充滿活力的初創公司。這樣的公司有些 " 夾生 ",但這樣的公司也正好是當下中國 AI 産業中的普遍樣本。
2020年之後的追一在做什麽?
我們進入到了服務傳統行業的一個産品化的階段。主要面向于金融和運營商、政務這種大型企業客戶。2018、19 年屬于大客戶的打樣階段,然後到了 19 年之後開始傳統大型企業客戶的規模化擴展,20 年就面臨到交付。
坦白來講這個難度已經比我們預期的要難很多。
有多難?
因爲我們定位自己是做 AI 産品,這裏面有兩個典型特征。第一是它底層是基于 AI 能力的,然後上層它其實是一個應用層的産品。但應用層産品的定義是要由客戶定義出來的,也就是要有足夠多的大型客戶來幫我們來定義這樣一個産品。
這些大客戶的本地化部署中暴露了很多關于軟件向下适配度和向上兼容度的問題。
這個其實挺誇張的,我們測算過軟件的産品部署到客戶現場之後,出現一個 bug 差不多就要 1 萬塊錢的成本來解決。我們累計做了 200 多個客戶,在那個階段已經有将近大幾十家頭部客戶,累計的 bug 有幾千個。
很大一筆開銷,所以 2020 年之前這些問題還不顯現。
做腰部還好一點,但是做股份支行這種大客戶要求确實很高,我們的産品又是客服和營銷這樣銀行裏的核心業務系統。
爲什麽頭部客戶要求更高?
同樣一個産品。可能腰部客戶沒有任何問題,但頭部客戶那裏會暴露很多問題,因爲他使用的很高頻。
并且對整個軟件的軟件的質量要求更高。它會有非常嚴格的安全漏洞掃描,并且——如果用銀行舉例——客戶的 IT 環境不一樣,操作系統不一樣,然後中間件也不一樣,數據庫也不一樣,這些都要适配。
頭部客戶對同一個軟件的使用深度會更深,也就會産生很多個性化的需求。如果說你整個軟件結構架構設計不合理,它的需求可能會關聯到這個軟件的核心系統,核心系統被牽扯就需要我們主線開發人員去參與進來了。主線開發人員的資源其實是非常寶貴的。他被調用的話我們花費的成本就很高。
什麽樣的需求會牽扯到主線的設計?
比如出現了 AI 助手在回答時不精準或者直接沒有回答的這種 bad case。
這意味着可能要改算法算子。問題直接就到了底層算法模型這一層,然後全公司的所有人都要卷進來解決這一個 bug。
但如果隻做腰部,對底層技術推進的動力就沒那麽大。我們定位是 AI 公司,需要找到大把手。
又要底層技術,又要産品。
對,兩頭都要特别難。
這逼迫團隊要把産品分層做的更合理,定制化需求最好在應用層解決而不影響主線。這是 PaaS 化之後才能實現的事,這個過程其實就是産品标準化的過程。
怎麽理解産品的标準化,有沒有明确的衡量方式?
我覺得有幾個,第一個産品的 bug 收斂的非常明顯,這是一個标準;另外就是面對客戶各種各樣的需求,可以通過一個應用開發團隊去自閉環,不需要牽扯主線團隊進來,我覺得這是第二個;第三個就是和産品相關的,從咨詢到交付的配套可以标準化,可以可以按照管理流程的方式來驅動,而不是靠人來驅動。
在中國做軟件,特别是大客戶方向,是要做從咨詢然後到産品,然後到實施三個環節的所有事的。理想狀況應該是比如 IBM 做咨詢,然後 SAP 做産品,然後艾森哲去做實施。
是因爲中國整個軟件行業不夠成型導緻的嗎?
對,整個生态仍然不是很完整。
吳悅在對話中補上了公司在 2020 年後的空缺。在一場産品标準化過程中沉澱下來的東西,又成爲追一在大模型時代的競争基礎。追一科技在前不久發布了自己的博文大模型。站在聚光燈和嗜血的資本之外,吳悅相信垂直大模型的機會在于這是大廠與創業公司之間的真空地帶。
談談垂直大模型吧。如果把大模型技術延展成一條技術鏈,垂直大模型看上去是很末端的一環。追一可以幫銀行做,銀行也可以跟大廠直接合作,這就跳過了追一。這會不會意味着垂直大模型領域的 AI 公司其實很被動,缺少議價能力?
這是三個角度的問題。第一個是客戶會不會自研,但對于傳統企業的客戶來說,因爲他主營業務不完全在 IT 上,出于投入産出比的考慮它不會自己來做這個事。
然後就是,這是不是意味着有通用大模型的廠家就能解決好垂直大模型的問題,或者說垂直大模型這個領域是不是因爲門檻不夠導緻競争非常激烈。
沒錯。垂直大模型的門檻到底在哪裏?
垂直大模型這個事的門檻不低。一個是私域知識如何融入到大模型裏;然後還要考慮領域知識在回答生成上的精準度和可控性;并且這些垂直領域的知識最終都需要和軟件産品做好融合才行。
從這幾個角度來說,不是說是一個特别低門檻這個事。
最後這一點怎麽理解?
軟件的成熟度是一個獨特的壁壘。這個就有點像比如說 Copilot 最終還是需要 GPT 去跟 Microsoft 365 結合起來做刻畫的,不能脫離 Microsoft 365 這個産品去做這個事情。
所以産品能力可能才是差異化的優勢,比如 CoPilot 的優勢其實是Microsoft 365,你們的優勢其實是之前已經成型的 AI 産品?
對。比如之前提到的牽扯到主線需要做分層設計的問題。在調整過程中可能會做一些支持規則系統的改變,比如簡單的配一個規則,或者把算子的參數釋放出來,可以調參數來調效果。這些就是一些知識沉澱或技術沉澱。
确實碰壁碰的多了,問題解決的多了,産品才慢慢知道怎麽去設計,這不是拍腦袋想出來的。
大廠和創業公司都缺乏這個。
對。這種經驗是靠 bug 堆出來,靠客戶堆出來的。
大廠從頂層設計向下看,很順利,但碰到比如安全漏洞就很麻煩。一個漏洞可能涉及到你的算法模塊缺陷,然後你的後台模塊有缺陷,軟件後台也有缺陷,一動就有很多問題。
這是一些很泥濘的地方,大家看不到。
我覺得是。
還是一個精度的考量。比如說我們現在通過小模型模型能在對話中做到 90% 以上的準确率——雖然可能他的對話體驗可能沒想那麽好——比如金融行業的頭部客戶,它對對話答案精度的要求是挺高的。
然後在大模型的能力進入這個 AI 産品後,可能它的對話體驗變得更好,但是這個 90% 的精度可能會下降。因爲生成式 AI 本身是個概率問題,有更多不可控的因素。在 B 端市場這是一個挺棘手的問題。
但數據仍然在那些你服務的公司裏拿不出來,垂直大模型好像也沒有回答因爲缺少數據而影響軟件叠代的問題?
不同的客戶的數據差異度是 10% 到 20%,但之前在小模型技術的基礎上,因爲這個 10% 到 20% 的差異,你就要去訓練一個新的定制化模型——因爲小模型的理解能力不夠。但是現在大模型的優越性在于,他的理解能力充分了,所以這 10% 左右的差異其實不需要再去訓練一個新的模型。這其實是一個本質上的變化。
但客戶要一個适合自己的 AI 産品,其實就是要那 %10-20% 跟它相關的差異化。如果我隻是個 80% 契合的産品,但對所有銀行都可以用的話,那也就是對所有銀行來說它也都沒區别了?
這個差異化的數據變量其實隻是在表達上有差異。這部分表達上的差異在大模型下可以被理解出來。
也就是說數據這個痛點其實現在比原來小很多了。
對,是的。
2015前後開始的那一波 AI 熱潮現在回過頭來看,會給現在追一科技在垂直大模型的競争有些什麽啓發或者遺産嗎。
我們已經成立第七個年頭了。有了可靠的業務和客戶,也沉澱下來一個團隊。我們現在更加專注企業本身的經營,所以也會更加冷靜的來看待大模型這個事。