後ChatGPT時代，AI芯片如何繼往開來

集微網消息：" 英偉達是否低估了芯片危機？"

2022 年 9 月，《經濟學人》雜志向黃仁勳發出了這樣的質疑，彼時的英偉達，正被加密貨币泡沫破裂、高端 GPU 出口遭限等事件連番打擊，股價創下兩年新低，市值距離 2021 年末的高點已蒸發逾 60%。

雜志記者略顯刻薄地評論道：" 當他透過眼鏡打量他覺得會改變 AI 面貌的花哨新模型，以及像元宇宙這樣更模糊的概念，他是否存在低估此時此地殘酷性的危險？"

一百多天後如火如荼的 ChatGPT 熱潮下，黃仁勳在加州大學伯克利分校喊出 " 這是人工智能的 iPhone 時刻 "，一吐胸中塊壘。

的确，ChatGPT 既是熱度空前的 " 殺手應用 "，也爲英偉達股價注入強心劑，伴随去年末 ChatGPT 熱度起勢，英偉達在幾家大芯片巨頭中，也走出了久違的領漲表現，同期在外圍市場，但凡能編織出 "ChatGPT 與我的故事 "，不少芯片企業也獲得了投資者的追捧。

不過在短暫的集體狂歡後，"ChatGPT 概念 " 也必将分化，各路企業描繪的新藍圖成色幾何，需要一把技術的标尺加以衡量。

垂直一體化模式的松動

毋庸置疑，ChatGPT 遠超前輩 AlphaGo 的熱度，已經像火炬般清晰照亮了大模型應用前景。然而回顧 iPhone 當年橫空出世之時，不少外界觀察者仍習慣以現有廠商格局線性外推，認爲蘋果公司探明的 " 新大陸 "，最終仍将是諾基亞囊中之物。

在 " 人工智能的 iPhone 時刻 " 後，AI 産業新機遇，同樣并非理所當然應許給舊玩家。

值得指出的是，從 0 到 1 完成複現乃至超越 ChatGPT 實際體驗的大模型，對許多團隊而言面臨工程能力和經濟成本的雙重約束。

從工程能力要求看，大型語言模型（LLM）參數量短短幾年從億級邁入千億級，對算力需求已遠超處理器性能叠代速度，分布式并行計算也因此進入 " 深水區 "，易并行（embarrassingly parallel）方法撞上天花闆，必須開發子計算任務與處理器之間更爲複雜的調度方法，相關人才目前十分稀缺。

而在經濟成本上，以 ChatGPT 的 " 母體 "GPT-3 模型爲例，據稱如使用英偉達 V100 GPU 集群訓練一次，不考慮調參排故的理論最低成本也将達到 460 萬美元，微軟公司專門爲其開發者 OpenAI 打造的超算系統據稱擁有超過 28 萬個 CPU 内核和 1 萬個 GPU，整體性能可以達到 2020 年時全球 TOP500 超級計算機榜單前五，如果這一宣傳基本屬實，則相當于 OpenAI 在用一套完整的天河 2 号超算系統專門支撐其模型訓練，這對大多數企業而言無疑太過奢侈。

以此觀之，人工智能廠商目前從數據、算法到AI芯片、硬件終端、項目實施的端到端垂直一體化模式，未來或将走向更明晰的專業分工，少數擁有巨型算力集群的科技巨頭在雲端進行大規模預訓練模型叠代，并将接口開放給下遊廠商、開發者，産業鏈下遊則基于領域特定知識在邊側、端側以更低代價、更短周期完成模型精調，實現對垂直應用場景的高可用交付。

面對呼之欲出的 " 範式轉變 "，對大多數新老廠商而言，比起搶發 " 我司也有類似模型開發中 " 的新聞，更重要的工作，恐怕是對如何挖掘特定場景商業價值深思熟慮。

針對該話題的采訪中，思必馳研發總監樊帥指出，" 從現實來講，平台巨頭企業在研發投入、團隊投入等方面擁有優勢，這是毋庸置疑的 "。不過随着 ChatGPT 的應用延伸，上下遊企業都将在産業鏈關鍵環節做出貢獻，對于下遊廠商而言，" 探索類 GPT 産品的市場應用，實現技術的商業價值是企業關注的重點，無論是産品工具還是産品方案，挖掘潛力場景，進行技術融合，輸出整體性、結果導向性的實用解決方案才是現實問題。"

作爲國内專業的對話式人工智能平台型公司，思必馳在類 GPT 模型的應用落地上也有頗多洞察。

樊帥表示，現在 ChatGPT 是以文本交互機器人的形式呈現，這種文本生成的方式其實有很大的應用空間，比如在智能客服方向，現在的智能客服是檢索式 AI，但是生成式 AI 主動性更高，更具親和力和有效性。不論是搜索引擎、電商客服還是 AI 輔助生成，ChatGPT 應用級創新能力很強。

樊帥預測，在需要基于一定背景知識的創作型産業，以及剛需 AIGC 的場景、具有 SOP（标準作業程序）的行業，比如智能寫作、智能客服、文檔管理、代碼生成、甚至遊戲 NPC 等，是 ChatGPT 适宜落地的土壤。大模型技術可通過強化上下文理解能力、思維鏈推理、增強指令學習，來實現場景的融合應用。例如，在會議場景下，根據上千字的會議記錄，工具可以迅速根據需求指令，整理出會議綱要及重點，清晰列出待辦事項。

進一步具體到語音交互領域，樊帥認爲，" 未來往語音對話機器人去進階，強化語音、文本、圖像等深度融合的多模态交互技術應用，應對複雜場景的變化。這些都給大家留下思考、應用和探索的空間。思必馳聚焦對話技術，從對話能力輸出上來看，具備情感化、高度拟人化的語音 TTS 存在發展潛力 "，他還介紹稱，思必馳在這一方向上已進行了探索，推出過具有 " 高興、撒嬌、抱歉 " 情感的語音合成技術，應用在有聲閱讀、智能客服、語音助手、視頻配音等行業場景，能夠滿足更接近真人情感化表達的語音效果。

AI 芯片路線之辨

正如上文所述，類 GPT 大模型的開發極度依賴于算力支撐，随着大模型參數量從百億、千億向萬億演進，新的人工智能産業競争将進一步向算力環節聚焦，與此同時，上下遊推理、訓練工作負載的需求差異将越來越顯著，也對芯片技術演進帶來了新的牽引。

圍繞這一議題，集微網采訪了國内通用 GPU 領域産業化步伐領先的天數智芯半導體有限公司（簡稱天數智芯），該公司是國内首家實現通用 GPU 産品量産及規模應用的廠商，其天垓 100 産品目前已支撐近百個客戶應用，産品涵蓋數百個人工智能模型的訓練業務場景。

天數智芯産品線總裁鄒翾分析，ChatGPT 背後的 GPT3.5 是一種颠覆性的底層技術，其驚豔的應用效果建立在巨量語料庫以及超大規模的 AI 算力基礎之上。随着應用場景的演進 , 核心技術會加速發展，包括 AI 模型的複雜度還會不斷演進 , 這将産生對算力的産生井噴需求。

國内頂尖的企業和機構正在進行 ChatGPT 相關的技術研究及商用級産品開發。面對國内應用環境及中文語料，相關算法及模型預計将在未來 1 年左右逐步成熟。在互聯網入口，家庭接入設備，辦公等各不同領域，針對不同的場景可能會有不同的算法及産品出現，而支撐這些模型的算力底座需要具有良好的通用性及擴展性，才能夠快速的支持這些變化的需求，實現商業的可持續化演化。

鄒翾表示，未來繼續看好通用 GPU 架構訓練産品的發展空間，其通用性、兼容性、以及生态成熟度仍是未來一段時間内人工智能算法及應用構建的主要支撐。

與雲側對通用性、擴展性的需求相比，

在邊側、端側，推理芯片面對的需求則有所差異。

思必馳研發總監樊帥表示，AI 專用芯片可以在側重于場景化的端側實現特定場景低能耗，高算力，從定制化來看，ASIC 專用 AI 芯片從效率角度更具優勢，随着大模型的普及及應用，能夠提升相關芯片産品的性價比。

與此同時，由于數據量的急劇提升，無論在雲側還是端側，對于數據的隐私保護也提出了更高要求。樊帥強調，爲了保證 AI 的良序發展，我們的确需要去嵌入一些相應的限制手段和規則約束。基于 AI 的應用和其他衍生的工具級産品，在隐私安全、知識産權風險等方面亟待規範。

鄒翾也談到，在近期的客戶交流中能夠感受到各界對 ChatGPT 的關注及開發态度，希望其成爲效率提升的有效工具。不過用戶也有對數據隐私的擔憂，未來随應用擴展，亟需提供隐私計算的技術方案，實現 " 可用不可見 " 的計算方式，這也要求更強及更通用的算力支撐。

值得一提的是，對于大模型訓練芯片，特斯拉、Cerebras 等海外廠商正試圖探索另一條前無古人的道路—通過設計等效超算集群的單個處理器訓練大模型，完全繞過分布式并行計算的調度瓶頸。

特斯拉近期公布的 Dojo D1 自研 AI 芯片，就是将 25 個裸片通過矽中介層互聯，構成單塊 "Dojo Training Tile"，更爲激進的 Cerebras，則推出了面積達 462 平方厘米的 WSE-2 處理器，聲稱具有 85 萬個用于張量運算的可編程内核，單張 WSE-2 支撐的 CS-2 機櫃，據稱最多可支撐萬億參數規模的大模型訓練。

鄒翾表示，新興技術是針對目标問題的探索，會呈現出百花齊放的局面，在開放環境下競争将驅使其收斂，市場是最終檢測的試金石。在技術發展路線上需要從各個方向去嘗試，最終都是爲産業的發展貢獻自己的力量。

結語

" 人工智能的 iPhone 時刻 "，的确代表了許多人對 ChatGPT 熱潮的感受，全球公衆與行業機構被 " 卷入 " 其中的速度，已經清晰昭示出未來更多、更大應用創新沿着這一方向噴薄而出的圖景。

在警惕短期過度炒作和跟風的同時，類 GPT 模型對人工智能商業模式和産業格局帶來的長期影響，亟需相關廠商冷靜觀察，沉着應付，有所作爲。