百川智能創始人王小川：OpenAI正嘗試把1000萬顆GPU連在一起

作者葉蓁

編輯康曉

出品丨深網 · 騰訊新聞小滿工作室

AGI 大模型，無疑是 2023 年最炙手可熱的風口。自 2016 年開啓人工智能元年，AI 産業已經曆好幾輪洗牌，借着 ChatGPT 的東風，通用人工智能大模型創業再次被置于聚光燈下。

" 這個時代跟淘金時代很像。如果你那個時候去加州淘金，一大堆人會死掉，但是賣勺子、賣鏟子的人永遠可以賺錢。大模型是平台型機會；以模型爲先的平台，将比以信息爲先的平台體量更大。" 奇績創壇創始人陸奇表示。

工信部等機構發布的報告顯示，中國 AI 大模型專利申請總數已突破 4 萬件。僅上半年，國内已有 70 多家大模型創業公司，而在技術、算力和融資能力等多方面比拼中，大模型創業公司的洗牌正在加速。

AI 大模型對中國創業者來說意味着什麽？中國大模型未來技術突破和核心競争力會在哪些方面？在 2023 年騰訊 ConTech 大會上，長江商學院教授、數字化轉型中心主任孫天澍，與百川智能創始人、CEO 王小川，複旦大學計算機科學技術學院教授、Moss 系統負責人邱錫鵬就此展開對話。

王小川給出了自己的答案，" 理想上慢一步，落地上快三步。" 王小川認爲，與 ChatGPT 相比，從信仰層面、資源層面我們還有差距，但是到業務層面，大模型和應用的結合我們确實強很多，像淘寶、微信，包括抖音，中國互聯網的産品體驗是遠遠優于美國的。

私人助手和娛樂産業，是王小川所見的未來最大的商業應用機會。

邱錫鵬則表示，趕超 ChatGPT 要結合當前我國具體的實際情況，比如靠産業的帶動，從中産生的需求，再把它轉化到技術研究上。" 我們技術研究的問題，要由真實的需求凝練出來，所以産學研合作在下一步變得非常重要。"

以下是孫天澍與王小川、邱錫鵬對話實錄，經《深網》編輯整理：

" 中國大模型的應用會跑得更快 "

孫天澍：相比美國，我們大模型技術研究，還在學習還在突破。在産品應用領域，中國的公司基于自己上一代的互聯網經驗，産品經驗，以及基于中國大的消費市場，在産品應用能不能做到全球領先？

王小川：我今年提了一個概念，理想上慢半步，落地上快一步。就是覺得我們中國的機會，不是技術科研上跑得更快，但應用是我們能跑得更快的地方。

我 6 月份去了一趟美國，跟 OpenAI 和其他做大模型的同行做了很多交流，回來之後這個話改了，從 " 理想上慢半步，落地上快一步 "，變成了 " 理想上慢一步，落地上快三步 "。

OpenAI 在技術積累和投入、場景布局上與我們是有很大的差距，OpenAI 到現在已經幹了 7 年了，我們才一年的時間，它還有百億美金投進去，持續發展它的核心技術。我跟他們聊的時候，我說你們現在還做什麽研究嗎？他說我們現在正在嘗試把 1000 萬顆 GPU 連在一起訓練一個大規模的模型。

什麽概念呢？英偉達一年大概生産 100 萬顆 GPU，訓練 GPT4 要 2.5 萬顆，GPT3.5 國内對标 4000 顆，我們現在做 4000 顆對标的事情，他們是在研究如何用 1000 萬顆 GPU 做這個工作，從資源層面我們是遠遠不夠的。

但是到業務層面我們确實強很多，像我們的淘寶、微信，包括抖音，中國互聯網的産品體驗是遠遠優于美國的。

我們培養了大量的産品經理，因此這種情況下，我認爲我們是有巨大的經驗和優勢的。要把它發展起來，有兩個難點需要解決，一個是你要有模型，模型差一些可能就落後一些，所以我們得用更多的聰明才智去彌補，甚至做模型公司跟應用公司要結合，用開源和端到端的模式解決。

國外模型技術強的公司并不代表它擅長做應用，這是第一件事情，模型跟應用的能力合作。

第二，産品經理也會有一些相對的轉型和提升。以前産品經理叫 PM，怎麽能夠定義好産品是符合市場需求的。以前遇到難題的時候，我們默認技術不是瓶頸，比如做微信，雖然大家對技術有要求，但是這個是能實現能達到的，更多是工程效率和穩定性的問題。今天是一種算法帶來的産品，這對産品經理而言，他懂得什麽樣的産品今天技術是夠用的，甚至走一步還能夠引領技術的發展。我對技術的評測，我的測試集是什麽，怎麽評價好不好，怎麽讓算法工程師跟上這個步伐。

因此，這個時代的産品經理要對技術有判斷和評價，解決這兩個問題，中國的應用就能走在美國的前面。

孫天澍：從基礎研究的角度，第一，AI 大模型的基礎研究怎麽往更有效率的方式走，小模型、小數據，這是從平民化角度。第二個維度更加拉開，計算機的研究、人工智能的研究，大模型對于整個自然科學領域的研究帶來哪些沖擊和變化？

邱錫鵬：我們離 OpenAI 算力的差距太大，我感覺對 OpenAI 能保持緊密的跟随。一方面能夠鍛煉我們的技術，另一方面保持不掉隊，培養人才，能夠達到非常好的效果。

但是具體趕超，還是要結合當前我國具體的實際情況，比如靠産業的帶動，從中産生的需求，再把它轉化到技術研究上。我們技術研究的問題，要由真實的需求凝練出來，所以産學研合作在下一步變得非常重要。

另外一方面，不管是 AI 本身研究還是給整個科學研究帶來的沖擊，有可能它的範式會發生變化。AI for Science，它依然還是傳統的 AI 的模式，靠大數據，人去标大量的數據，去訓練一個模型。這個模型可能是專用的，給結構預測來使用，不能幹其他的事，隻能幹這個事。現在的大模型或者以大語言模型爲中心的新一代通用 AI 技術，是先用語言來打底，構造一個非常完整的系列知識。很容易把人的各種經驗通過語言作爲載體附加到模型中。

在非常多的科學研究應用上，模式和形态可能跟以前不一樣。未來會更加側重科研發現，類似于科研探索，或者主動讓他得到一些新的結論。這是之前 AI for Science 技術沒法完成的。

" 平民化與兩大商業機會 "

孫天澍：大模型在消費互聯網 C 端的産品形态和商業機會有哪些？到底是互聯網大廠的機會，還是新一代創業公司的機會？

王小川：我先從第二個事情說起，大廠還是創業公司的機會？今天我覺得大模型來了以後，不管是大廠還是創業公司，都已經很狂熱的研究相關技術。我的看法是大廠至少在現有的産品叠代升級裏面有挺多空間，人員密集型的地方可以用大模型來做替代，也能夠升級自己的産品。

但是對創業公司而言，死亡率會更高，很有可能最大的創新突破是屬于創新公司的。行業之前做大模型，有一個概念叫做大創新靠小廠、小創新靠大廠。所以今天大廠本身這樣的一種體量也會有大模型，隻要增加 1% 就是巨大的收益。但是最大的創新可能來自于創業公司。新的一波機會，我們的看法是從信息時代走向智能時代，一個大的時代，就像之前工業時代一樣，會有新的公司起來，所以我仍然覺得空間蠻大的。

C 端我想分成兩部分，第一個概念出現類似人的助手，因爲大模型到今天最大的變化，它不是一個工具。它是我們的夥伴，它自己開始會說話，跟人進行溝通，會語言了，動物和人的區别就是掌握語言。大模型語言今天掌握的不比人差，還有世界知識。因此，它是能夠陪伴我們的夥伴角色。所以很大的概念就是助手，能成爲各種各樣的助手，你的寫作助手、問答助手，甚至變成私人老師、私人醫生、私人律師，是拟人的角色。

第二，娛樂行業有巨大的需求，構造虛拟的物理世界。我們知道人除了工作創造以外也需要休閑，大模型可以做情感陪伴，它不僅可以拟人，甚至可以拟出一個虛拟世界來。我管它叫太虛幻境，裏面的故事情節，房屋空間構造，大模型都可以去虛幻。對于娛樂、遊戲行業會有很大的變化。大語言模型能構建出世界觀和世界中的自然、社會、文化邏輯，包括物理規則，都可以構造起來。

因此娛樂行業和助手，這是所見的 C 端裏重大的兩個方向。

孫天澍：未來開源模型在海外，在中國會不會收斂到一到兩個模型？爲開放生态進一步發展，大模型公司還需要做哪些準備？國内大模型公司需要在能力上做什麽準備，能夠達到像 OpenAI 和 Agent 智能體未來開放生态布局？

邱錫鵬：大模型現在生态變得非常開放，這裏有非常多的參與者。這裏涉及到平民化的問題。平民化可能分成兩個：一方面，因爲大家都在圍繞着某個開源，甚至不開源，像 GPT 也可以，圍繞着一個比較大的生态圈，如果提供非常好的個性化、定制化能力的話，就是技術棧，因爲參與者很多，積累凝練的也非常多。确實會降低很多研發成本。

但從另一個方面，類似算力成本和計算成本相對來講還是比較高的，所以還是有一定的阻礙。現在有比較高能力的支持非常蓬勃的生态發展包括 GPT 個性化，包括所謂的各種工具的使用、任務規劃等等，這些能力相對來講還是需要比較大的模型。

這些大的模型計算成本還是比較高的。所以可能在目前來講，特别是在國内，由于成本的原因還不能廣泛地應用到每個人身上，讓它變成每個人的助手。所以在将來，如何去進一步提高模型的效率？把大模型進一步壓縮，甚至有一些新的架構出來，來降低它真正的計算成本，讓每個人都能用得起，這才能達到真正的平民化。機會也是非常多。