最聰明的大腦、最火爆的話題——清華大學張亞勤和朱民暢談ChatGPT

編輯丨沃特敦

4月28日，清華論壇迎來了本校的兩位大神級人物。一位是科學家張亞勤，12歲就讀中科大少年班，之後擔任微軟亞洲研究院院長和百度總裁，目前是清華智能産業研究院院長。另一位是經濟學家朱民，曾任IMF副總裁、中國人民銀行副行長，現在是清華國家金融研究院院長。兩顆最聰明的大腦圍繞當前最火爆的話題ChatGPT展開了長達100分鍾的對話。

創業邦經授權刊發此次主題對話《颠覆認知的AI時代與産業機遇》，内容經編輯整理。

朱民：我們先談談你的智能産業研究院。三年了，你現在做的怎麽樣，主要在做什麽？

張亞勤：2019年底我離開百度，一直想做一個研究院，和當年20多年前微軟亞洲研究院在某些方面相似，都是從事基礎研究。但這個研究要爲産業服務，解決真正的問題。另外，微軟研究院是企業做的，我希望研究是面向整個産業開放的。還有一點在于清華，有最優秀的學生和老師。所以，研究院的縮寫AIR的意思也很簡單，就是AI for industry research。這裏I的話有三個含義，就一個是國際化（international），一個是AI，一個是産業（industry）。

現在我們有21位全職老師，還有博士生、博士後研究人員，還有學生一共200多人。目前研究院的主要研究還是人工智能。由于我們面向産業，所以選擇了我們認爲有很大機遇的三個方向：機器人和自動駕駛、生命和生物科學，另外是物聯網，特别是面向雙碳的領域，我們叫綠色計算。

朱民：最新的突破在哪裏？

張亞勤：我們一直從事這些算法，包括模型方面的研究，我們和很多企業合作，在語言模型，比如多模态、強化學習、聯邦學習，然後也做一些垂直模型，比如說面向自動駕駛機器人的，面向生命科學的。前幾天還開源了一個生物醫療的GPT，叫BioMap。在自動駕駛方面，我們也有一個基礎決策感知的模型。

朱民：所以你的研究也是和現在崛起的ChatGPT和GPT大模型的趨勢是一緻的。我們就聊聊大模型，這是現在最熱的事兒。ChatGPT當然是驚豔，一出來以後又能畫畫，作詩、寫歌。可能大家聽說了它做了一個貝多芬的音樂。

當然，作爲一個老貝多芬的愛好者，我覺得它做的不怎麽樣，但它居然也是能裝模裝樣做作曲了，還有4個樂章，太搞笑了，但它确實影響很大，寫代碼做文件檢索都做的很好。關于它的争論很多，有觀點認爲它已經走向AGI，也有觀點認爲它還不成熟，技術上并沒有很大突破，隻是商業模式用的好，路徑好，它很聰明。你是真的專家，你怎麽看這件事？

張亞勤：你剛才講的是過去這2-3年，一個大的趨勢就是生成式AI。ChatGPT可能做的最成功，其它的也包括比如像DALL-E、stable diffusion，等等一系列的生成式AI。

ChatGPT推出之後對我的震撼還是挺大的。前段時間談到"我的GPT時刻"是什麽樣的？我有三個想法，第一個我感到就是人類曆史上第一次我們有了一個智能體，然後通過了圖靈測試。

朱民：通過了圖靈測試，我們回頭再說這一點，這個是個了不得的結論。

張亞勤：對，圖靈測試，咱們知道是圖靈1950年提出的，機器可以thinking，是可以思考的機器，然後提出了圖靈測試。它是我們做計算機科學這麽多年夢想的一個目标。ChatGPT我認爲是第一個軟件智能體通過了圖靈測試。我太太是ChatGPT或者GPT這些産品系列的大粉絲，當時我在看的時候，她說ChatGPT也能幻想，也經常說錯話，也會說謊，我說那和人類就更像了。

所以，第一點還是通過了統一測試，包括語言對話的引擎（conversational AI），其實對話引擎也很多年曆史了。1966年MIT第一個做出了對話的引擎ELIZA，這麽多年有很多次叠代，到了Siri，到了Alex，到了Cortana，然後國内有小度，有天貓精靈，有很多對話的産品，都是針對某一些領域或者聊聊天，或者某些領域。

朱民：包括微軟的小冰。

張亞勤：是的。包括小冰，都是對話引擎的産品。但ChatGPT在功能和通用性方面遠遠超過了早期的産品，它用了大規模Generative AI，這是我第一個感受。第二個感受，我認爲它是AI時代的一個新的操作系統，就像在PC時代Windows，移動時代的iOS。一會我們可以再展開講。

朱民：我覺得這個比你的第一個結論更重要，因爲過了圖靈測試，這是過去。如果是新操作系統的話，那是一個巨大的未來。

張亞勤：就會重寫、重塑、重建整個生态系統。第三點咱們原來也讨論過，我認爲它是我們從面向具體任務的AI走向通用AI的一個起點。雖然ChatGPT更多的是大語言模型，大基礎模型，但它開啓了一個亮光。因爲我們多少年也是在往那個方向走。這就是"我的ChatGPT時刻"。

我經常跟我們的學生老師講，這麽多年來AI，還有整個IT領域，出現了有好多熱詞，一會兒是區塊鏈、加密貨币、比特币；一會兒又是Web3.0、NFT、元宇宙。有些可能是真的，有些可能是個概念，但整個大語言模型，包括ChatGPT,GPT4.0，這是一個大的變革。

朱民：所以這次是真的讓你興奮了，讓一個科學家興奮就表明something is happening。所以這個還是挺有意思，圖靈測試過了，因爲機器和人對話，當然還有很多誤差，它會撒謊等等，因爲它是token system,這個都是在不斷完善，并且通過人類的反饋機制訓練，我覺得Fine-tuning都會不斷提高，這個沒問題。

張亞勤：你們聽朱民講，他在講算法，他完全不像是央行的副行長。

朱民：這個是跟你學的。但是你大操作平台可有意思了，因爲現在ChatGPT出現了API，然後出現了插件，所以它逐漸可以把專業的東西放進去，垂直系統，然後現在出現了plugins，plugins出來又是一個特殊的路，很多東西又可以往上放。所以，如果以後變成生态的話，真的是一個大的操作平台，然後就會出現一個我們以前讨論過的super app，整個的産業就被徹底颠覆了。這個在什麽情景下會發生呢？

張亞勤：盡管目前有新的插件也好，API也好，或者新的應用也好，本質其實并沒有變化。大家都記得在PC上面本身也有很多應用，Office就是一個大的超級應用，到移動時代的話，有的操作系統上面有應用商店，上面也有很多超級應用，微信、短視頻、淘寶、搜索等等，都是上面的超級應用。

我覺得AI時代也會很像，有一個大模型作爲操作系統，plugin也好，API也，在上面你就可以有APP。有很多APP可能需要有垂直的模型，因爲有些行業比較深，比如自動駕駛、生物計算等等，但這些垂直模型可以建立在橫向的大語言上，這個大語言不僅僅是語言，其實是多模态的，也包括視頻、圖像，語音等等。有了這個之後，你的垂直模型也好，包括你剛才講的，它都有更多的應用。

你剛才提到一點很重要，現在大語言模型，或者說我們的基礎模型，它自己是個工具，它也可以使用别的工具，它可以去使用比如說Hugging Face各種開源的這些數據、模型，然後去執行新的任務或者構建新的應用。同樣，我們也可以用不同的大模型，然後去構建新的應用。也就是說，大模型可以使用你，你也可以使用大模型，彼此互相使用。

朱民：以後想象中的世界，因爲智能了，機器就自己講話了，它已經脫離人了。一旦你給了數據，機器自己生成，生成完又出現智能，然後它就可以自己交流，自行不斷地改進，那是不是一種新的物種正在出現？

張亞勤：可以這麽理解。

朱民：這又是一個很重要的概念，我們理解的物種都是電影裏的外星人。如果把AI大模型看成一個物種的話，那就是大家讨論的關于人類面臨的根本挑戰了。是這樣嗎？

張亞勤：首先是一種新的能力吧，叫物種也好，能力也好，比如說現在GPT4plus，之後還有4.5、4.9、5.0。5.0主要的開發者是誰呢？是4.0，所以它自我在開發，自我在叠代，自我在進化，所以這是一種和人類一樣的、很強的能力。

但我并不認爲人類會被替代，我覺得AI還是一個工具，是我們的延伸。也就是說，我們人類、我們碳基生命有這樣的一個智慧，我們可以發明東西，我們也可以去控制它，讓它按照我們的方向去演化。我是樂觀者。

朱民：對，你是樂觀者，我也是樂觀者，但最怕的是過分樂觀，我們要小心。這其實是很有意思的一件事，我們先不講人類和機器的對比，現有的人其實提出了哲學命題，或者提出了一個根本的問題，就是AI是人的智能的一部分，還是人的智能之外的，一種新的或者人還沒有悟到的智能。你怎麽看？

張亞勤：這是一個特别好的問題。我認爲現在的大語言模型，它的很多智能是我們不知道的。我們可能有，但我們沒有認識到的，因爲我們所認識到的知識，我們所看到的所謂的智能，其實是我們人類很少一部分。然後，機器把一部分我們有的但不知道的，找出來了。但它可能會有新的能力，但我不希望大家有一種想法，就是新能力會像科幻電影裏說的那樣把人替代了。未來的智能一定是Human Intelligence,一定是人類的智能和機器智能的一個融合，而且機器一定是我們的一個很強的延伸，它很多事做了我們可能做不了。就像汽車一樣的，汽車跑得比人快，它比人有更強的能力，但它并沒有替代人。

朱民：工業革命是擴展了人的肌肉，現在是AI要擴展人的智能，我覺得這是一個很大的判斷。現在關于機器智能究竟是人的智能的發現，還是一種人的潛在不知道的智能的挖掘出現，或者是更新的一個我們根本就不知道的智能，所以你認爲是？

張亞勤：我覺得三者都有。

朱民：這個很有意思，所以從這意義上來說，根本的一個fundamental的哲學問題是，智能不隻是人類獨有的。

張亞勤：是的，就看你怎麽定義。比如生存的能力、繁殖的能力。繁殖能力很強的物種，最強的不是人，是細菌，是病毒，你像新冠那麽小的一個病毒，可以給我們造成這麽大的麻煩，對吧。而且它上幾十億年就存在，它的壽命也一定會比我們人類要長，所以我覺得我們智能有很多不同的維度，不同的方面。發展到現在，給我們提供了很多新的啓示，包括就是延伸我們。

我再講一下，就是說我們可能還是要把智能分成幾個不同的層次，然後有些東西我們要有邊界。

這個又回到圖靈了，還是機器第一個層次是感知，就是我要聽得見，要能說話。就是視覺、語音識别、語音合成、人臉識别，圖像識别，包括文字OCR都屬于這種感知層面的方面。現在機器已經比人厲害了，機器識别人臉比人可能厲害，我覺得這個可能5年前基本上就和人是同樣一個水平了。

第二層次智能的話是可以思考，可以決策，可以推理，在這個認知層面，現在的大語言模型出來之後，和人的距離就差距就越來越小。過幾年，在這個方面，就和人類差不多了。現在大家看到說ChatGPT考試比人還厲害，能考SAT。兩個星期前,我的一個朋友在北大教量子力學，量子學是很難的，她期中考試已經高于班裏的50%，它也沒有經過任何專門的學習。所以說機器在認知方面也會和人類差不多。

另外還有幾個層次，我覺得是我們不應該去觸碰的。我一直在講，我們做AI倫理也好，治理也好，比如說它的個體能不能作爲獨立個體？人工智能有沒有自我意識？它有沒有感情？這些方面我不認爲我們可以達到，但我也不認爲我們人類應該做這樣的研究，就像基因編輯某些方面我們不應該去觸碰。

另外就是人工智能的治理。人工智能需要一個邊界。咱們有信息社會、有物理世界、有生物世界。在這些世界，其實這些空間都在走向一種融合，新的數字化走向融合，但我們需要有一些邊界。比如ChatGPT可能先把它放到信息世界裏面，然後如果真正去到了物理世界。自動駕駛我們可能要小心點，還有金融系統。

我剛在新加坡開會，在兩個不同的場合。一個是WPP公司，做廣告策劃的。如果是做創意，我就鼓勵多用ChatGPT這樣的東西。但在銀行，我覺得你先别用，你可以用作爲信息類的，但牽涉到核心金融系統，涉及交易的，還是要比較小心。

朱民：所以，科學家既有樂觀也有謹慎。從樂觀的方面，毫無疑問這是個颠覆，但從謹慎的方面，我們還是要很小心地劃個邊界。在我們不知道的情況下，我們先謹慎，我覺得這個還是很有意思的。但這個邊界是會被不斷地突破的。你剛才講了一個特别重要的概念，就是工程應用。人工智能現在越來越多地被認爲是工程學，你可以應用大模型，大模型也可以應用你的這個東西，所以它越來越變成一個工程了。如果從工程學角度看大模型，大模型的發展會怎麽樣？

張亞勤：我覺得它肯定是會變得越來越準确，然後變得越來越成熟，而且它進化的速度也會越來越快。但是，在我們沒有很清楚它的成熟度之前，我們需要給它個劃邊界。

我相信對我們以後整個物理世界，比如說機器人自動駕駛，對于物聯網都會有很大的應用，但我覺得根據你的需要不一樣，應用不一樣，就更要謹慎一些。比如對于核心的任務（mission critical），我們還是要有更多的可控性，因爲現在生成式AI，它生成什麽東西我們并不完全知道。而且，不僅我們知道，我們甚至不知道爲什麽會發生這樣的事。我們隻知道一部分。

朱民：所以這又涉及到我們現在大模型的根本概念，emergence「湧現」，這個是以前沒有的。因爲它開始有數據邏輯推演以後，它開始「湧現」一些非線性的發展。這個「湧現」怎麽講？它未來的發展前景怎麽樣？我覺得這是一個很重要的問題。

張亞勤：朱民行長講了一個特别重要的概念，這個都是比較專業的詞彙，叫做「湧現」emergence。

emergence确實目前是在這種大模型裏面，當模型的參數體量大到一定程度的時候，基本上是到了百億參數的時候，開始「湧現」，就是你可以看到它在準确度還是可預測性都跳躍式提高。爲什麽這個時候出現「湧現」，具體這些數學模型或者因果關系，現在并不是很清楚。

但你可以這樣想，當我的數據量體量大到一定程度的時候，參數到一定程度的時候，而且我的訓練方法是正确的。這個很重要，數據是高質量數據，我訓練的方式是正确的，可以利用這麽多數據，有好的方法時候。

如果用一個拟人化的來比喻，我們每天讀書，讀到一定的時候忽然就開竅了。靈光一閃，開始的時候，讀書隻是填補個知識，但到了一定程度我就可以掌握這個規律了。比如我建的大模型，參與到一定程度之後，它把真正的架構（Structure）找出來。

朱民：這裏又提出一個重大哲學問題。如果「湧現」是像靈光一閃那樣的跳躍式的變化。我們人的經曆都講有頓悟，但頓悟是有點智慧含義的，「湧現」是智慧嗎？

張亞勤：你可以這樣理解。如果拟人的話，就是參數到一定程度之後，它忽然就很準确了，就像語音識别，貫通了。這個非常重要。如果你直接看的話，由于我數據量特别大，參數很多，因爲它做預訓練的時候用的是這個叫自監督學習，然後它自己是In-context learning，在它這個語料很大的時候，它要把裏面一些mask出去，然後自己去訓練自己，所以模型大到一定程度時候，它準确率就比較高。

但是爲什麽會在那麽多參數的時候會這樣，而且不僅僅ChatGPT，很多别的大的模型，不僅是openAI的，很多别的模型也有類似的這麽一些現象了。

所以這個現象我不能講是這個靈光一閃，是哲學或者宗教的概念，但是我們現在并不清楚爲什麽，清楚一部分，但不清楚全部。所以這個是emergence.

然後包括另外一個是統一性，這也是現在GPT裏面T很重要一部分。過去可能對不同的任務有不同的算法，現在有了transformer之後，不管你是語言也好，還是語音也好，還是圖像或者是視頻或者是蛋白質，你都可以用token based裏的token轉化。這跟人的大腦思維方式比較像，我們的neural，都是neural。

朱民：所以我們現在又往裏走一步，現在如果回到深層的方法上面來看的話，兩三年前都有一種議論，說深度學習已經不行了，是嗎？

張亞勤：我沒有聽到。

朱民：大概四五年以前開始，有很多這樣的說法，就是覺得深度學習，大數據的應用開始出現了小數據。那麽現在的新的工具transformer是一個foundation。這個是一個很重要的基本結構。GCAI或者AIGC是一個很重要的方向approach，那麽技術上來說，你覺得transformer模式成型了？還是以後會有怎麽樣的發展？因爲你是科學家，咱們得想一想科學的問題。

張亞勤：第一個我認爲transformer确實是挺了不起的，當時2017年Vaswani在Google，當時一開始是爲了其實在做Google translate來做的這麽一個算法。這個算法出現之後，确實是把整個深度學習的進展推到更高的一個層次。但是，如果我們看一下transformer或者看一下包括現在大模型，其實它的效率還是比較低的。

我們再和大腦比一下，我們人的大腦經過幾十萬年的進化，确實不得了，差不多不到三斤的大腦，然後有860多億個神經元，每個神經元差不多有1萬個Synapse突觸，你如果把每個連接做一個相當于參數的話，我們大腦比現在GPT4，我假定是1萬億，比它要高上千倍。我們就三斤重，而且我們功耗30瓦，你這GPT功耗多少瓦，所以我覺得我們效率還是很高的。而且目前這種大模型，雖然讓很多工作變得更高效，但耗電和運算的效率還是很差的。transformer當然是很好的一種算法，但在計算方面确實十分耗能。

朱民：所以從能耗來說還會有很大的突破的空間。

張亞勤：我認爲5年之後也許就會有一個不同的算法。

朱民：怎麽叫不同的算法？

張亞勤：就也許就不是transformer算法，也許是，也許不是。

朱民：你會發明一個嗎？

張亞勤：我把希望寄托在我們的博士生上。

朱民：回到工程學，工程學就很有意思了，因爲它等于一個輔助工具，它無所不能了。所以我覺得現在比較有意思的一點，用我的語言來說，是大模型的脫虛向實。所謂虛就它離開了服務業，實，就是說它進入了物理世界，去操縱和管理物理世界。我覺得這是一個工程學的很重要的概念和一個很重要的應用場景。

所以現在我們出現了AI for science，而且現在科學研究進入了第四範式。那麽就把整個科學研究的方法全部變掉了，是數據主導，不再是獨立的由根開始往上走，而是逆向發展，這個就很厲害了。最近的很多事，比如說常溫超導，這個鹵是算出來的，最近的可控核聚變，可控是大模型控的。蛋白質，現在我們已經有了那麽多三維的蛋白質的結構分析，你也做生命是吧？大模型在科學研究方式的方面，對它将來會怎麽樣？

張亞勤：這是特别好的問題，我稍微花半分鍾講一下範式這個定義，其實提出第四範式，包括最近提到的第五範式，都是微軟的科學家提出來的。範式從最早在亞裏士多德，後面到了伽利略。牛頓是第一次把所謂的第一範式數學化方程式化，包括到Maxwell，包括薛定谔，愛因斯坦後面是方程式的第二範式。第三範式是計算機出來之後的事。後面大數據來了之後是圖靈獎獲得者Jim Green提出的數據驅動，就是第四範式。

最近微軟英國的科學家又提出第五範式，就是深度學習。作爲科研的一個新範式，我認爲第四和第五基本上是不同階段，你可以都叫第四範式。

這裏面有很多新的工具，比如剛才你講的工程學，新的工具可以使用，就是我們可以把我們方程式的東西，結合到我們觀察的，測量的數據裏面來。比如我們現在可以生成大數據，用方程式來生成，加上我們觀測的數據把它結合起來，開始預訓練，然後結合起來。

朱民：是。現在的科學研究上或者說是第四範式也好，出現了兩種流的合作，一個是人的流，他把一些觀察到想象中的參數什麽放進去，一個是數據位自由，就機器深度學習，然後讓這兩種東西結合起來，是朝我們想象中的用預訓練的模式來實現它的未來，所以這個很有意思。人工智能和人的智能開始合作，那麽現在看的比較多的是材料科學，數字材料現在是很明顯，生物對蛋白，做three dimensional structure這個也是很多的。你覺得像物理或者數學這種根本的科學研究，在方法論上會被颠覆嗎？我覺得化學是很容易突破的。

張亞勤：我認爲會的，但是怎麽颠覆我也不是很清楚。我那天開玩笑說我現在比較保守了。我說5年意義，我們所有的奧林匹克的冠軍，數學、物理包括所有的考試，冠軍一定是機器，從阿爾法狗開始，一定是機器。另外，我認爲AI可以證明一些我們沒有證明的事兒，哥德巴赫猜想等。

朱民：我覺得科學家還是很嚴謹的，哲學家可以在這個天空裏思索。

張亞勤：新的方程式以後可能是AI發明的，這都有可能。

朱民：量子力學就會可能會有很大的突破，所以這是一個很大的事情。如果科學有這麽大這麽變化的話，反過來人類的進化速度會大大加強。5年真的是一個很短的時間。

張亞勤：剛才你問的特别好，就是科學的範式。其實如果看一下我們物理學，每一個科學都需要一種描述的語言。數學是物理學最好的描述的語言。我認爲AI整個來講，從我們這種發展的方向，不一定是GPT，也會成爲一個好的描述的語言。當科學的東西沒法去表示出來的時候，我就用一個大的模型加上一個參數去表示它，然後它就變成一種新的語言。

朱民：講到現在我們已經走得很遠了，天馬行空。那麽落地到現在的話，大家很關心中國的大模型發展怎麽樣？現在百度出了文心一言，現在我看能列出的大模型大概有幾十種了。

張亞勤：百模大戰。

朱民：當然困難是很明顯的，第一個是，美國把芯片卡住了。那麽算法當然也受到很大的影響；數據也有一個質量和規模的問題；對語言也是個問題，對中文和英文之間其實還是在自然語言處理的方面還是有不一樣的。你怎麽看百模大戰中國的差距究竟有多大？我們怎麽幹？

張亞勤：不想得罪人。（現場笑聲）

朱民：科學家沒問題的。我先說我的觀點，我不怕得罪人（現場笑聲）。我1月7号的時候我說，大模型，中國落後兩年。

張亞勤：對，我覺得大模型方面肯定是落後的，具體落後多少我就不說了。但是，目前這麽多企業，包括BAT、華爲、字節在内的很多大公司都在做大語言模型，包括新創公司，大家都在做，最後就是充分競争。隻有經曆充分競争的企業才是好企業。而且中國的競争有中國的特點，這些人都是經過互聯網時代的千錘百煉，經曆過血腥的競争，知道怎麽競争。第二點就是在競争的過程中，每個企業的人都很聰明，他自己會去定位，就讓市場去檢驗它。政府就别管了，政府鼓勵競争就行。

我個人看的話，可能最後會有五六個大模型。所有的操作系統，大部分的話可能還是面向行業的很多垂直模型，它會結合大模型解決行業大的問題，但在每個行業可能也需要細分。

你剛才提到芯片和數據，我稍微講一下。數據是問題也不是問題，就第一點你看目前大模型也沒有人把充分把自己的數據都用了，以及比如企業外面我們有很多這種公用的數據，然後每個企業剛才我講的大企業都有自己好多數據，他都沒有用完，可能用了很少一部分，因爲時間不夠，這幾個月。然後第二點就是你看現在做多模态，剛才講的語言多模态裏面多少視頻的數據，多少這些圖像的數據也都去使用。

還有一點。你看GPT用了很多中文的數據，用了很多法文的很多各種不懂語言的數據，咱們也可以用别的語言，我們完全可以用英文的數據，對吧。

這些數據能用就用，所以我認爲長期不是大問題，短期也不是大問題。而且說實話，數據不僅量要大，重要的是你怎麽樣去清洗它，怎麽樣把它變成高質量的數據。其實做大語言模型也很有意思，就是數據太輕，太幹淨也不行，還是需要一些有免疫力的，就像人身上需要一點有要和細菌和病毒共存的時候需要一點免疫力，所以怎麽樣去獲得這個數據，其實是做大語言模型，1/3的工作是關于怎麽樣把這些數據叫data engineering很重要。

算力的确是比較挑戰，如果咱們把中國所有的算力加在一塊，現在至少也有50萬個，至少50萬個A100這麽一個體量加在一塊，你訓練100個模型有點小問題，但是訓練5個模型是沒問題的。另外一點，這個東西你也不是永遠在用它，你在預訓練的時候用它，用了之後你幾個月可能就不需要用這個東西了。

還有一點，現在很多的工作是怎麽樣把這個模型簡化，然後怎麽樣小型化邊緣化。所以我認爲這些東西是有挑戰，但不能是我們兩三年之後沒做好的一個借口。我認爲我們一定會做的不錯的。

然後還有一點就是中國自己也在做芯片，現在你看到有昆侖，汽車的地平線等等許多公司都在做這些芯片。

朱民：所以你還是樂觀的，算力算法和這個數據，我們還是有資源可以解決，是吧？但是大模型它有幾個特點，第一個是它進入的門檻很高，它不是一個可以自由競争的世界，是第二個它有些地方具有天然的壟斷性，算是有壟斷性的，算法取決于你是不是開源。而且這個規模也使得進去不那麽容易。所以在這個情況下，那是一種市場充分競争，還是一種類似于寡頭競争。未來的中國發展大模型的路徑大概是個什麽情況？

張亞勤：如果把大模型比喻成42公裏的馬拉松，現在跑了5公裏，目前是春秋戰國，大家要充分競争。等競争到一定程度，肯定就不可能有那麽多大模型了。就像操作系統和雲一樣，一開始有多少朵雲？現在的雲，不管美國也好，中國也好，最後可能就四五朵雲。所以我認爲最後肯定是要收斂的。

朱民：你還是很樂觀，中國人會長出自己的大腦模型。

張亞勤：對。但我想講一點，我們現在不能假設就是那幾個大公司的事兒，初創公司也有希望，OpenAI就是一個小公司。所以大家都有機會。但平台的門檻很高。比如我們這樣的研究院，我們一開始就說不要自己去做大型語言模型，我們也不會去買上萬個GPU，很多工程的東西我們也不會去做，我們可以和企業去合作。

朱民：這就提出了很重要的一點。在我們追趕的道路上，第一個是算力算法數據，你有沒有底氣？第二個是市場準入競争公平，這個結果會怎麽樣？但形成生态合作共赢還是很重要的。你看大概會是怎麽樣的一個生态呢？

張亞勤：比如說N年多之後，4-5年之後會有幾個大的模型，就是可能主要在雲上面，在雲上面有大量算力的，有這麽橫向的，我把它叫做AI的雲的操作系統，在這個上面有很多的vertical很大的一些apps，而且我認爲有些apps會在一個雲上一些APP在很多雲上，有些souper apps可能它會調用不同的models的，剛才你講的工程化和工具化，你可以用你的操作系統可以用别的，别的APP，我也可以用我這個APP也可以用好多不同的模型，然後可以用open source模型，也可以用這些商業化的模型，還有一個open source，現在這是很重要一個力量，不在我們剛才講的這些裏面。

朱民：你看現在美國出現了stability。對這樣一個平台，作爲一種生态的構造形式的培訓，像這樣的模式可采用。

張亞勤：我覺得都會，各種不同的模式都會發生。

朱民：這裏又回到了平行模型和垂直模型的區别，我看現在的大模型現在主要是做美國和中國，但美國的模型還是平行的，廣義的模型多一些，中國現在來看是垂直模型比較多一些。

張亞勤：不能這麽講，我覺得都有。橫向的模型很多，但是解決某一些問題的也都有垂直模型。

朱民：所以現在市場競争的是橫向模型，現在是"百模大戰"，對競争的結果活下來的人會支撐垂直模型。

張亞勤：對，可以這樣講。垂直模型、以及面向一些任務總是要做的。橫向模型會幫你解決很多橫向的問題，比如說自動駕駛長尾的問題。但是，它沒法去替代垂直模型。咱們回到操作系統這個比喻，操作系統裏面安卓和iOS也很強大，它上面有商店，但是很多Super APP還在上面。

你不可能操作系統做所有的這些應用，特别我們如果面向工業互聯網，它更細分，更加深度。就像在PC時代，微軟很強大，但也隻能做個office，上面别的應用還是要靠生态。我經常講，生态操作系統如果算一的話，它整個生态是乘100倍，在上面它的價值是100倍。

朱民：這個世界不可能隻有唯一，一定是一個生态的，在上面會産生更豐富的應用場景，等等。

張亞勤：而且我覺得對以後垂直領域，或者對一些創業者其實是件好事。我看了很多言論說大模型出來之後别創業了，都被大公司做了。我認爲不是這樣，我覺得恰恰相反。比如，現在做某些面向某些任務的時候，我更容易做了。再比如說，過去我做一個什麽事，我自己沒數據或者數據很少，我需要收集數據，現在很多這些數據已經被預訓練變成模型了，你就去靠那個模型，然後加上你自己這個領域的精準數據，或者結合你自己的模型，你可以開發應用出來。

這有點像雲計算的時候，創業公司過去要買一大堆服務器，自己要有it方面的人。有了雲之後，你買雲服務就行了。你的算力、存儲，你的網絡能力都按需分配。所以，我覺得這是件好事，但創業公司可能要注意别做太簡單的東西。如果太簡單，大模型馬上就幫你做了。創業者稍微要做一些有門檻的事。

朱民：創業的門檻高了。

本文爲創業邦原創，未經授權不得轉載，否則創業邦将保留向其追究法律責任的權利。如需轉載或有任何疑問，請聯系[email protected]。