作者 葉蓁
編輯 康曉
出品丨深網 · 騰訊新聞小滿工作室
AGI 大模型,無疑是 2023 年最炙手可熱的風口。自 2016 年開啓人工智能元年,AI 産業已經曆好幾輪洗牌,借着 ChatGPT 的東風,通用人工智能大模型創業再次被置于聚光燈下。
" 這個時代跟淘金時代很像。如果你那個時候去加州淘金,一大堆人會死掉,但是賣勺子、賣鏟子的人永遠可以賺錢。大模型是平台型機會;以模型爲先的平台,将比以信息爲先的平台體量更大。" 奇績創壇創始人陸奇表示。
工信部等機構發布的報告顯示,中國 AI 大模型專利申請總數已突破 4 萬件。僅上半年,國内已有 70 多家大模型創業公司,而在技術、算力和融資能力等多方面比拼中,大模型創業公司的洗牌正在加速。
AI 大模型對中國創業者來說意味着什麽?中國大模型未來技術突破和核心競争力會在哪些方面?在 2023 年騰訊 ConTech 大會上,長江商學院教授、數字化轉型中心主任孫天澍,與百川智能創始人、CEO 王小川,複旦大學計算機科學技術學院教授、Moss 系統負責人邱錫鵬就此展開對話。
王小川給出了自己的答案," 理想上慢一步,落地上快三步。" 王小川認爲,與 ChatGPT 相比,從信仰層面、資源層面我們還有差距,但是到業務層面,大模型和應用的結合我們确實強很多,像淘寶、微信,包括抖音,中國互聯網的産品體驗是遠遠優于美國的。
私人助手和娛樂産業,是王小川所見的未來最大的商業應用機會。
邱錫鵬則表示,趕超 ChatGPT 要結合當前我國具體的實際情況,比如靠産業的帶動,從中産生的需求,再把它轉化到技術研究上。" 我們技術研究的問題,要由真實的需求凝練出來,所以産學研合作在下一步變得非常重要。"
以下是孫天澍與王小川、邱錫鵬對話實錄,經《深網》編輯整理:
" 中國大模型的應用會跑得更快 "
孫天澍:相比美國,我們大模型技術研究,還在學習還在突破。在産品應用領域,中國的公司基于自己上一代的互聯網經驗,産品經驗,以及基于中國大的消費市場,在産品應用能不能做到全球領先?
王小川:我今年提了一個概念,理想上慢半步,落地上快一步。就是覺得我們中國的機會,不是技術科研上跑得更快,但應用是我們能跑得更快的地方。
我 6 月份去了一趟美國,跟 OpenAI 和其他做大模型的同行做了很多交流,回來之後這個話改了,從 " 理想上慢半步,落地上快一步 ",變成了 " 理想上慢一步,落地上快三步 "。
OpenAI 在技術積累和投入、場景布局上與我們是有很大的差距,OpenAI 到現在已經幹了 7 年了,我們才一年的時間,它還有百億美金投進去,持續發展它的核心技術。我跟他們聊的時候,我說你們現在還做什麽研究嗎?他說我們現在正在嘗試把 1000 萬顆 GPU 連在一起訓練一個大規模的模型。
什麽概念呢?英偉達一年大概生産 100 萬顆 GPU,訓練 GPT4 要 2.5 萬顆,GPT3.5 國内對标 4000 顆,我們現在做 4000 顆對标的事情,他們是在研究如何用 1000 萬顆 GPU 做這個工作,從資源層面我們是遠遠不夠的。
但是到業務層面我們确實強很多,像我們的淘寶、微信,包括抖音,中國互聯網的産品體驗是遠遠優于美國的。
我們培養了大量的産品經理,因此這種情況下,我認爲我們是有巨大的經驗和優勢的。要把它發展起來,有兩個難點需要解決,一個是你要有模型,模型差一些可能就落後一些,所以我們得用更多的聰明才智去彌補,甚至做模型公司跟應用公司要結合,用開源和端到端的模式解決。
國外模型技術強的公司并不代表它擅長做應用,這是第一件事情,模型跟應用的能力合作。
第二,産品經理也會有一些相對的轉型和提升。以前産品經理叫 PM,怎麽能夠定義好産品是符合市場需求的。以前遇到難題的時候,我們默認技術不是瓶頸,比如做微信,雖然大家對技術有要求,但是這個是能實現能達到的,更多是工程效率和穩定性的問題。今天是一種算法帶來的産品,這對産品經理而言,他懂得什麽樣的産品今天技術是夠用的,甚至走一步還能夠引領技術的發展。我對技術的評測,我的測試集是什麽,怎麽評價好不好,怎麽讓算法工程師跟上這個步伐。
因此,這個時代的産品經理要對技術有判斷和評價,解決這兩個問題,中國的應用就能走在美國的前面。
孫天澍:從基礎研究的角度,第一,AI 大模型的基礎研究怎麽往更有效率的方式走,小模型、小數據,這是從平民化角度。第二個維度更加拉開,計算機的研究、人工智能的研究,大模型對于整個自然科學領域的研究帶來哪些沖擊和變化?
邱錫鵬 :我們離 OpenAI 算力的差距太大,我感覺對 OpenAI 能保持緊密的跟随。一方面能夠鍛煉我們的技術,另一方面保持不掉隊,培養人才,能夠達到非常好的效果。
但是具體趕超,還是要結合當前我國具體的實際情況,比如靠産業的帶動,從中産生的需求,再把它轉化到技術研究上。我們技術研究的問題,要由真實的需求凝練出來,所以産學研合作在下一步變得非常重要。
另外一方面,不管是 AI 本身研究還是給整個科學研究帶來的沖擊,有可能它的範式會發生變化。AI for Science,它依然還是傳統的 AI 的模式,靠大數據,人去标大量的數據,去訓練一個模型。這個模型可能是專用的,給結構預測來使用,不能幹其他的事,隻能幹這個事。現在的大模型或者以大語言模型爲中心的新一代通用 AI 技術,是先用語言來打底,構造一個非常完整的系列知識。很容易把人的各種經驗通過語言作爲載體附加到模型中。
在非常多的科學研究應用上,模式和形态可能跟以前不一樣。未來會更加側重科研發現,類似于科研探索,或者主動讓他得到一些新的結論。這是之前 AI for Science 技術沒法完成的。
" 平民化與兩大商業機會 "
孫天澍:大模型在消費互聯網 C 端的産品形态和商業機會有哪些?到底是互聯網大廠的機會,還是新一代創業公司的機會?
王小川:我先從第二個事情說起,大廠還是創業公司的機會?今天我覺得大模型來了以後,不管是大廠還是創業公司,都已經很狂熱的研究相關技術。我的看法是大廠至少在現有的産品叠代升級裏面有挺多空間,人員密集型的地方可以用大模型來做替代,也能夠升級自己的産品。
但是對創業公司而言,死亡率會更高,很有可能最大的創新突破是屬于創新公司的。行業之前做大模型,有一個概念叫做大創新靠小廠、小創新靠大廠。所以今天大廠本身這樣的一種體量也會有大模型,隻要增加 1% 就是巨大的收益。但是最大的創新可能來自于創業公司。新的一波機會,我們的看法是從信息時代走向智能時代,一個大的時代,就像之前工業時代一樣,會有新的公司起來,所以我仍然覺得空間蠻大的。
C 端我想分成兩部分,第一個概念出現類似人的助手,因爲大模型到今天最大的變化,它不是一個工具。它是我們的夥伴,它自己開始會說話,跟人進行溝通,會語言了,動物和人的區别就是掌握語言。大模型語言今天掌握的不比人差,還有世界知識。因此,它是能夠陪伴我們的夥伴角色。所以很大的概念就是助手,能成爲各種各樣的助手,你的寫作助手、問答助手,甚至變成私人老師、私人醫生、私人律師,是拟人的角色。
第二,娛樂行業有巨大的需求,構造虛拟的物理世界。我們知道人除了工作創造以外也需要休閑,大模型可以做情感陪伴,它不僅可以拟人,甚至可以拟出一個虛拟世界來。我管它叫太虛幻境,裏面的故事情節,房屋空間構造,大模型都可以去虛幻。對于娛樂、遊戲行業會有很大的變化。大語言模型能構建出世界觀和世界中的自然、社會、文化邏輯,包括物理規則,都可以構造起來。
因此娛樂行業和助手,這是所見的 C 端裏重大的兩個方向。
孫天澍:未來開源模型在海外,在中國會不會收斂到一到兩個模型?爲開放生态進一步發展,大模型公司還需要做哪些準備?國内大模型公司需要在能力上做什麽準備,能夠達到像 OpenAI 和 Agent 智能體未來開放生态布局?
邱錫鵬 :大模型現在生态變得非常開放,這裏有非常多的參與者。這裏涉及到平民化的問題。平民化可能分成兩個:一方面,因爲大家都在圍繞着某個開源,甚至不開源,像 GPT 也可以,圍繞着一個比較大的生态圈,如果提供非常好的個性化、定制化能力的話,就是技術棧,因爲參與者很多,積累凝練的也非常多。确實會降低很多研發成本。
但從另一個方面,類似算力成本和計算成本相對來講還是比較高的,所以還是有一定的阻礙。現在有比較高能力的支持非常蓬勃的生态發展包括 GPT 個性化,包括所謂的各種工具的使用、任務規劃等等,這些能力相對來講還是需要比較大的模型。
這些大的模型計算成本還是比較高的。所以可能在目前來講,特别是在國内,由于成本的原因還不能廣泛地應用到每個人身上,讓它變成每個人的助手。所以在将來,如何去進一步提高模型的效率?把大模型進一步壓縮,甚至有一些新的架構出來,來降低它真正的計算成本,讓每個人都能用得起,這才能達到真正的平民化。機會也是非常多。