1 月 16 日,智譜 AI 發布新一代基座大模型 GLM-4。
GLM-4 在基礎能力上相比 GLM-3 性能全面提升 60%,支持最高 128K 長文本,原生支持自動聯網、圖片生成、數據分析等複雜任務,并在多模态能力上有了長足進步。據智譜 AI 透露,在内部測評中,GLM-4 在性能上逼近了 GPT-4。GLM 模型智能體和智能體中心也在 GLM-4 發布當天同步上線。
此前,去年 6 月 ChatGLM-2 發布,去年 10 月 ChatGLM-3 發布,而去年 3 月 GLM-4 已經完成第一個版本。CEO 張鵬認爲三到四個月完成一次基礎模型叠代是正常的研發速度。
去年年初,這家中國最重要的基礎模型公司定下了朝 GPT-4 追趕的目标,之後一年基礎模型繼續快速發展,Meta 把持着開源生态,領頭羊 OpenAI 拿出了 GPT-4,谷歌帶着 Gemini 姗姗來遲。基礎模型的競争者逐漸收斂到少數幾家,而觀察中國公司在其中的位置時,目前中國唯一估值超過百億人民币的智譜 AI 或許是那個錨。
在 GLM-4 發布之際,我們與智譜 AI CEO 張鵬進行了一次獨家對話。
以下爲對話實錄:
什麽最重要?模型,模型,還是模型
矽星人:我們先聊聊 GLM-4 本身。智譜 AI 對标 GPT-4 去做自己的升級和演進,這個整體思路是怎麽樣的,如何讓追上 GPT-4 這件事看起來可行,并且可能還會有一些超預期的東西?
張鵬:首先肯定是模型能力方面差距的追趕,比如多模态能力,GPT-4 在 3 月份發布的時候其實已經帶來多模态能力了。我們判斷對于 AGI 來說,多模态這件事情可能是必須要去解決的,所以這個能力你必須有。包括模型本身能力提升所帶來的像 CoT 這樣的高階能力,它其實根植于你底層的基礎模型的能力。
第二件事是,有了大腦,需要眼睛和耳朵,手和腳——需要要把這些基礎模型的能力輻射出去,跟外界系統産生更密切的交互,而不是簡單的做文本和圖像的輸入輸出。這個事情就偏向應用了。
矽星人:基礎模型能力的輻射,這是關于 Agent(智能體)的想法了。現在人們談起 Agent,正在陷入一個概念的陷阱裏,智譜 AI 對于 Agent 的有什麽自己的理解?
張鵬:Agent 在人工智能或者說計算機科學史上是個 " 老概念 ",有一套相對完整的解釋體系。大模型下 Agent 找到了一個新的視角。但 Agent 的本源仍然是大模型的基礎能力,大腦的智力水平足夠高,才能去談理解、推理、以及規劃和執行這些事。
智譜 AI 還是從技術角度的的定義和演進來理解 Agent 的。然後從大模型角度來看,Agent 應該怎麽去演化,怎麽去提供這個能力。以及它跟需求語言之間應該如何相互翻譯,找到通路去對應上。
矽星人:Agent 和所謂的 AI 原生應用(AI Native App),這兩者之間是什麽關系?
張鵬:首先 AI Native 這個範疇還是太大,我們更願意叫做大模型的原生應用。
首先說大模型原生應用,它實際上是指的我們希望說從大模型的原生能力出發,去設計和開發的應用,我們期待它是一種新的東西,而不是說把原來的應用拿來做一個升級。
這個是有的,比如 ChatGPT,這個産品在工程化層面其實很簡單,核心就是一個模型。而對于 Agent,我們的理解始終是它是模型某種能力的外化,你可以把這種能力做成某種大模型原生應用。
但 Agent 本身也會給應用的開發過程帶來一些變化。當 Agent 能力被用在開發階段,它又變成一個賦能原生應用開發的過程,Agent 和大模型原生應用之間的邏輯應該是這樣。
矽星人:就是可能大模型原生能力本身體現了 Agent 的能力,Agent 某種程度上也在幫助大模型原生能力開發的自動化,這樣一種關系。
張鵬:對。
做垂直領域最終是爲了以後不做
矽星人:智譜 AI 在垂直領域的商業化很早,給外界的感覺一直是比較 to B,GLM 模型智能體會是一個跟 GPTs 很像的東西嗎,還是不一樣?
張鵬:商業化落地這件事還是圍繞着我們模型價值本身。我們早期的模型能力不太夠,那可能就需要去爲了填補模型本身的能力和最終業務需求之間的 gap,而去垂直領域多做一點事情。
你不去做,你不知道客戶在想什麽,也就不知道你的技術最終幫助客戶提升的用戶價值到底有多少。
這實際上是我們去尋找 Best Practice(最佳實踐)的一個過程。我們希望把這個路徑蹚通,回過頭來把這些東西沉澱下來之後賦能給生态。
矽星人:比如說 RAG(Retrieval Augmented Generation,檢索增強生成),智譜 AI 應該是國内最早把 RAG 用到垂直領域了的一個。
張鵬:算是比較早,因爲 LangChain 整個開源項目裏頭就有我們。RAG 是很典型的一個例子,就是從垂直領域沉澱出通用型的需求,以及一套方法。這套方法可以成爲一種标準化的解決路徑和産品。
矽星人:所以可以這麽理解,我們做很多垂直領域的事,其實是爲了反哺通用模型的基礎能力提升。做的目的是爲了以後不做。
張鵬:對。GLM 模型智能體就是在探索一種更通用的路徑。
傳統互聯網爆款産品經理不理解最新的 AI 技術
矽星人:智譜 AI 一直以技術能力見長,你怎麽看現在智譜 AI 的産品能力,比方說我們能夠支持多少個開發者在上面,怎麽提供好的工具,甚至讓開發者能得到更多曝光?
張鵬:如果我們現在真的進入到了大模型的應用半場的話,産品能力是大家都很關注的一件事。
智譜 AI 之前也有自己的一些産品化的東西,其實用戶量都還不錯,我覺得産品能力應該來說還不算差,當然我們會持續的在這方面去加強。
但是反過頭來講,你看 ChatGPT,作爲一個産品本身沒有什麽特别複雜的東西。所以——我個人感覺,因爲我不是做産品出身——所謂産品力這個東西,在這個時代它變成了一種對需求的敏銳感知能力和對于新技術的領悟能力的兼顧,在這個基礎上,考驗的是如何揉合這兩種能力,去産生一種新的産品表達形态的這樣一種複合的能力。
矽星人:這跟移動互聯網時期的小步快跑、快速叠代和敏捷開發這些東西可能是不一樣了。
張鵬:這一套沉澱下來的産品開發邏輯還在,尤其是 ToC。但爲什麽現在大家說要找一款所謂的 Killer App 這麽難,好像所有的産品經理都沒有頭緒。
我個人覺得其實矛盾在于,原來傳統的互聯網爆款的産品經理,他對于現在最新的技術沒辦法理解。真正懂技術的這些人,對于所謂的用戶需求和産品需求又沒法理解。
矽星人:那當一個基礎模型開始面對開發者了,也就存在一個模型的技術和産品适配問題(technology product fit)。你們要如何跟開發者去講,你能夠做什麽不能做什麽?
張鵬:好像現在隻能開發者自己去嘗試,但在這之外,其實有一些本質的東西做産品的人可以在間隙思考一下。
回到第一性原理,大模型本質上解決了什麽樣的問題,找到這個點,然後你把你所有需求寫出來,然後你去找到這兩者間的連線。
比如我反問你,Chatgpt 解決的是什麽問題?你第一天用上,它就直接告訴你這是個不一樣的東西,從來沒有人想過這個問題——雖然他幫你解決了很多問題。
矽星人:所以 ChatGPT 解決了什麽問題?
張鵬:我個人認爲它最本質上解決的還是人機交互的問題。機器終于有一天能夠比較像樣的能聽懂人說什麽,然後說出來的話也讓人能聽懂。這個是個本質的問題,它彌合了人和機器之間的距離,這是他第一性要解決的問題。
順着這個思路,哪些場景可以被這件事情解決掉,很容易判斷出自動客服這類的需求。
這是大模型解決的第一件事。第二是大模型在經過大量語料數據訓練之後,具備超越一般人積累的知識和數據量,能很好的去解答人們日常生活當中的問題。這件事本質上解決的是我們人類社會當中人與人之間的信息和知識傳遞的成本和範圍問題。
矽星人:那些讓人被迫爲了一份工作要學習一堆無用知識的問題,或者說是知識的快速消化的處理的問題,現在都可以處理了。
張鵬:對,我有更低的成本,更大的範圍去獲取知識了。所以這個事情又可以 cover 掉教育、員工内部培訓這些事情。所以如果按這種邏輯分析方式的話,其實還是能找出來一些大模型應用産品具體的方向的。
矽星人:那這樣其實對做産品的人的要求是非常高的。過去互聯網時期中國的産品經理群體裏,設計師出身的人很多,做交互做 UI 的人很多。那時候美國的産品經理,一看全是 MBA 背景。那時我們會嘲笑這幫人做 MBA 的怎麽做好産品,現在你發現還真得靠 MBA 去做産品經理。
張鵬:對,我特别贊同你這麽說。這背後其實是大家在對于 " 一個産品需要滿足什麽需求 " 這件事的着眼點不一樣。
設計美術出身的産品經理居多,是因爲我們認爲移動互聯網是一個注意力經濟,我要做到的事情是抓用戶的注意力,隻要有人關注它、點開它,我的目的就達到了。因此整個産品、招的人也都會圍繞這個目标構建。
如果更在意的是整個互聯網經背後的經濟邏輯和價值邏輯,那就不會是這樣。
生态好才是真的好,不要在摩擦中消耗力量
矽星人:再度回到 GLM 模型發布的智能體,智譜 AI 希望給到開發者或者第三方怎樣的一個開發環境。現在有兩種方向,一種是往開發平台裏邊去堆各種各樣的工具和能力,降低開發門檻,吸引更多人。另一種就是 OpenAI 這樣隻提供一個很簡單的 instruction,反正我有什麽你都知道。
張鵬:我們比較接近 OpenAI 那種思路,首先還是強調基礎模型本身的技術能力。模型能力足夠強,你才有可能讓大家真正用起來。
在這個時間發布智能體,還是因爲我們覺得我們模型的能力到了這個水平了,所以就開放給大家。至于工具是可以慢慢增加的。問題的根本并不在于說你工具多少,工具少的時候我能解決少的問題,工具多了能解決更多問題了。
矽星人:國外 OpenAI 已經通過 ChatGPT 走向大衆了,國内一些入局大模型的大廠有自己的流量資源優勢。目前智譜 AI 的姿态仍然是面向業界的,有沒有想過轉變成真正的面向公衆的一個 AI 品牌,這個問題重要嗎?
張鵬:首先這個事兒我認爲還是挺重要的,我們有我們自己的理念和終極目标,但這個過程當中,作爲一個創業公司要活得好,其實還是比較依賴一個良好的生态,生态這個事情就是需要去發聲,需要跟大家去講我們怎麽想。
做一場 DevDay,做很多活動,一是希望大家多互動,也是希望把生态發展的理念傳遞給大家。大家好才是真的好,很多時候我們在摩擦中消耗了太多力量了。
矽星人:那再進一步,智譜 AI 有沒有可能成爲一個面向世界的,而不是僅僅是面向中國的 AI 公司 ?
張鵬:我們沒有給自己設這個限制。智譜 AI 的目标是要做到全世界最好的水平,我們做的所有事情都是朝着這個大目标去的。