AI大模型，駛向産業何方？

圖片來源 @視覺中國

文 | 産業家，作者 | 鬥鬥

技術更叠，已不是壁壘，國産式 AI 需要的是産品的創新思維，以及對需求的産品變現能力。

"AI 炒了那麽多年，第一次感覺它真的要來了。" 國内某論壇中，帶有 ChatGPT 的詞條下，幾乎都會出現一句類似的表述。

ChatGPT 是美國人工智能研究實驗室 OpenAI 基于 AI 大模型打造的一款智能問答工具，用戶隻需在 ChatGPT 網站頁面的對話框中輸入問題并點擊确認，便可以得到答案。

就是這麽一個智能問答工具，在過去的兩周内，以各種形式席卷全球各大社區、論壇，占據各大新聞頭版頭條。

不同于過去 "AI 革命 " 中，專屬于相關企業與技術人員的搖旗呐喊、獨自狂歡。這次将 AI 推向風口的卻是 C 端用戶，這使得 ChatGPT 實現了快速 " 出圈 "。

一組數據是，ChatGPT 今年 1 月的月活躍用戶數已達 1 億，成爲曆史上用戶增長最快的消費應用。國外一家提供就業服務的平台對 1000 家企業進行了調查。結果顯示，近 50% 的企業表示，已經在使用 ChatGPT，30% 表示有計劃使用。

國外科技巨頭也紛紛開始布局，例如曾 all in 元宇宙的 Meta 發布了新的大模型系列 —— LLaMA；微軟公司宣布 ChatGPT 将與旗下浏覽器融合；谷歌宣布發布 "Bard"AI 聊天機器人服務。

ChatGPT 帶來的熱潮，同時也湧向了國内市場。

較爲明顯的是，百度、騰訊、阿裏等紛紛開始布局具體應用。其中，百度宣布将基于文心大模型推出 " 文心一言 " 後，400 多家公司相繼宣布接入，一度将其港股股價拉高超 12%。

另外，在過去的兩周内，諸多以 AI 大模型爲技術底層的廠商，開始獲得資本的青睐。

例如，緻力于企業創新數智化平台的銜遠科技完成數億元（人民币）天使輪融資；緻力于對話機器人行業解決方案的竹間智能完成 D+ 輪融資；醫療交互 AI 平台聆心智能完成 Pre-A 輪融資。

更有已退休兩年的前美團聯合創始人王慧文，在其朋友圈公開招納技術人才，助其打造 " 中國版 OpenAI；快手前 AI 核心人物李岩創業投身 AI 大模型賽道。

而在學術界，複旦大學自然語言處理實驗室，發布了國内首個類 ChatGPT 模型 MOSS，公開平台邀公衆參與内測後，數萬名用戶申請參與内測。

站在底層技術角度來看，從科技巨頭到互聯網大廠，從創業屆到學術屆，AI 大模型正在成爲各方搶灘市場的關鍵。

事實上，AI 大模型本質上是通過數據的訓練，進行歸集和表達。這意味着，如果對不同的數據進行訓練，便可以産生不同的模型。拿 OpenAI 來說，其就是基于底層大模型打造了 " 對話機器人 "ChatGPT。除此之外，其還基于底層大模型打造了 Dall-E" 繪畫機器人 "。

過去多年的一個市場共識是，如果要實現 AI 規模化産業落地，底層 AI 大模型就必須是一個通用的大模型平台，廠商根據用戶需求在平台之上，進行多場景、多領域的模型生産，從而實現具體行業模型的落地。

對一衆廠商而言，這也是一個新的方向。即 AI 廠商以 " 通用模型 + 産業模型 " 不斷賦能企業、産業，從而加速中國的産業數字化進程。更爲重要的是，這種模式一旦落地成功或将快速實現規模化效應，或将爲頭部 AI 廠商帶來高回報，擺脫當下 AI 技術落地難，盈利難的現狀。

那麽，AI 大模型現在在國内産業側的成長如何？

01 看見 AI 大模型

" 丫丫意識上傳 550W 後 1.7 秒月球危機就發生了。" 這是電影《流浪地球 2》中的一句台詞。

這個情節背後隐藏的是，超級 AI 大模型下的超級智能決策。

在電影的人物設定中，馬兆、圖恒宇都是 550 系列智能量子計算機的研究員。圖恒宇是爲了留住在車禍中去世的女兒圖丫丫，将其 " 意識 " 植入初代智能量子計算機 550A 升級版 550C 中，試圖叠代出 " 數字人丫丫 "，但由于算力問題，不能處理過多的數據，導緻 " 數字人丫丫 " 隻能叠代出 2 分鍾的生命。

月球危機下，圖恒宇看到了 550C 的升級版 550W，其超強算力可以讓丫丫 " 活得更久 "。于是圖恒宇偷偷将丫丫的意識植入 550W。

但在植入丫丫意識的 1.7 秒後，計算機開始超負荷運行，這意味着，無法啓動地球上的發動機，" 流浪地球 " 計劃失敗，地球毀滅。

一個決定性的轉機在電影結尾，圖恒宇在臨死前将自己的 " 意識 " 植入了 550W，使得其算力正常運行，點燃了發動機。

其實，在 550W 量子計算機的超強算力下，AI 大模型不斷的計算、學習、訓練，讓原本負責管理空間站的 AI 系統叠代出自主意識，并爲自己取名 MOSS。

由于其 AI 系統的設定便是堅定執行延續人類文明的使命，所以當丫丫的意識植入大模型時，在 550W 超強算力加持下，極端理性的人工智能遇到了感性的丫丫，MOSS 實現了新的進化，感受到了人性的惡，推算出毀滅即拯救，這也就導緻了 MOSS 制造出計算機負荷運載的假象，試圖毀滅地球。

但當圖恒宇的意識的植入大模型後，使得 MOSS 學習到圖恒宇與丫丫之間的愛與和平，訓練出新的意識形态，即拯救人類。

從某種意義上來說，MOSS 最後拯救人類，就是 " 理想 AI 大模型 " 下帶來的智能決策。

實現路徑可以概括爲，基于大量的數據集，進行學習、訓練之後，在空間站管理場景中，利用 550w 量子計算機的算力，将空間站場景數據植入，進行二次訓練，就可以滿足空間站的場景需求，MOSS 就是這種需求下的産物。

場景數據喂養後實現二次訓練的模型也可以稱之爲場景模型。而當丫丫、圖恒宇意識，即具體場景任務、行爲數據植入場景模型中時，便可以給出具體智能決策。

這也是 AI 大模型規模化落地的一種路徑。

" 中國科幻需要現實意義。" 在劉慈欣看來，流浪地球的故事設定與現實科技發展存在着許多共性。

事實上，ChatGPT 産業圖譜中，主要價值點有三層。一是開篇提到的 ChatGPT 應用程序，将 AI 模型集成進面向用戶的應用軟件，它們或運行着自己的模型（端到端應用），或依賴于三方模型的 API。目前來看，雖然這類應用公司的營收增長得非常快，但在留存率、産品差異化和毛利率上卻容易遇到瓶頸。

二是基礎設施提供商，如雲廠商或硬件制造商，它們負載着生成式 AI 模型的訓練和推理。這類廠商赢面較大，将賺取了流經技術棧的大部分資金。以生成式 AI 爲例，有業内人士預測，其總營收的 10%～20% 将流向雲服務提供商。但有這種能力的廠商屈指可數，門檻高，頭部效應明顯，競争空間極其有限。

三就是我們重點提到的模型提供商，緻力于打造驅動 AI 産品的底層大模型，它們要麽以專有 API 的形式提供，要麽開源提供。但絕大多數大模型廠商都還沒有實現大規模的商業化，屬于一片還未真正打開的戰場，彎道超車機會很大。

值得注意的是，在整個 AI 規模化落地流程中，最複雜的環節就是底層 AI 大模型的搭建。但這恰恰給 AI 大模型廠商帶來了新的機會。

換言之，想要 實現 AI 大模型規模化的産業落地，首先需要将整個落地路徑 " 簡化 "。讓 AI 變得 " 人人可用 "，同時也要滿足具體場景、領域的個性化需求。

02 通用大模型 + 産業模型

底層 AI 大模型的研發具有數據規模大、質量參差不齊、模型體積大、訓練難度高、算力規模大、性能要求高等挑戰。這樣的高研發門檻，不利于人工智能技術在千行百業的推廣。

而具有數據、算力、算法綜合優勢的企業可以将模型的複雜生産過程封裝起來，通過低門檻、高效率的生産平台，向千行百業提供大模型服務。

各個行業的企業隻需要通過生産平台提出在實際 AI 應用中的具體需求，生産大模型的少數企業就能夠根據應用場景進一步對大模型開發訓練，幫助應用方實現大模型的精調，以達到各行業對于 AI 模型的直接應用。

彼時，AI 大模型就會真正意義上實現産業化，成爲産業模型。

目前，國内布局 AI 大模型廠商百度、阿裏、騰訊、商湯、華爲等企業，正在不斷夯實通用大模型，打造産業模型，助力 AI 大模型産業化。

其中，百度以文心大模型 + 飛槳 PaddlePaddle 深度學習平台；騰訊以 hun yuan 大模型 + 太極機器學習平台；阿裏以通義大模型 +M6-OFA；華爲以盤古大模型 +ModelArts，都打造了（自然語言處理）大模型、（計算機視覺）大模型以及多模态大模型方面。

可以發現，主要參與者大多是雲廠商，正如上文所言，雲基礎設施很有可能是 AI 大模型這盤棋，最終的最大獲益者。所以，大模型也成了雲廠商 " 的必争之地 "

值得注意的是，各個廠商 AI 大模型的布局，有所差異。

百度由于多年在 AI 領域的深耕，其文心大模型涵蓋基礎大模型、任務大模型、行業大模型的三級體系，打造大模型總量約 40 個，産業應用也較爲廣泛，例如電力、燃氣、金融、航天等，構建了國内業界較大的産業大模型。

目前來看，屬于國内大模型廠商的第一梯隊中的佼佼者。

騰訊産業化應用方向則主要是騰訊自身生态的降本增效，其中廣告類應用表現出色。

阿裏更重技術，例如 M6 大模型基于阿裏雲、達摩院打造的硬件優勢，可将大模型所需算力壓縮到極緻；另外其底層技術優勢還有利于構建 AI 的統一底層。

目前，主要應用方向是爲下遊任務提質增效，例如在淘寶服飾類搜索場景中實現了以文搜圖的跨模态搜索。

華爲的優勢則在于其訓練出業界首個 2000 億參數以中文爲核心的預訓練生成語言模型。目前發布了盤古氣象大模型、盤古礦山大模型、盤古 OCR 大模型三項較爲重磅的行業大模型。

可以發現，在商業模式上各個廠商都是通用大模型路徑，在通用大模型架構之上，搭建具體行業模型。映射到産業層面，即 " 通用大模型 + 産業模型 " 的路徑。

但具體的産業化應用有着較爲明顯的差異。其實，這與各個廠商喂養的數據有着極大地關系。例如華爲的優勢在 G 端，相對應其在氣象、煤礦等央國企領域有大量服務經驗與數據，在數據的計算、學習、訓練下，更容易打造該産業的大模型。

然而，手握入場券，并不代表能跑到終點。

對于廠商而言，其可以搭建通用大模型，并不意味着其能把通用大模型搭建的好；其有能力打通大模型到産業模型到具體場景的應用，并不意味着其可以打造出有真正價值的智能決策。

AI 大模型産業化落地的瓶頸需要被正視。

03 " 智商 " 堪憂

如果将産業模型看成一個公式：2 ×π +N=？

其中，公式 "2 ×π =6.28318530718......" 就是底層通用大模型，"N" 則象征着具體場景的數據。公式 "2 ×π +N=？" 就是植入具體場景、領域數據後的産業模型。

在這個公式中，不難發現的是，π 小數點後的數字越精确，得出的結果就越精确，最後産業模型下的智能決策也就越精确，相對應的計算難度也就越大。另外 "N" 作爲一個變量，需要收集場景下大量有價值的數據。

顯然，計算能力和數據集成，是 AI 最終做出有價值的智能決策的關鍵，即 AI 大模型産業化落地的關鍵。

對于國内的 AI 大模型廠商而言，這不是一件容易的事情。

1、計算能力

在提升計算能力方面，首先比起一個人，100 個人計算的效率會更高，所以計算人力數量是關鍵，人力數量對應的則是芯片的數量；其次，計算器比紙算會更快，而 Excel 又比計算器效率更高，所以計算工具的性能改進也是關鍵，對應的則是芯片的性能。AI 大模型需要在大量、高性能的芯片加持下，不斷的進行模型訓練，才能更加精準。

目前，英偉達推出的 A100/H100 是目前性能最強的數據中心專用 GPU。且市面上幾乎沒有可規模替代的方案。包括特斯拉、Facebook 在内的企業，都利用 A100 芯片組建了 AI 計算集群。

根據市場研究顧問公司 Compass Intelligence 發布的 AI 芯片最新調研報告，全球前 5 大人工智能 ( AI ) 芯片企業排名依次爲 NVIDIA 英偉達、Intel 英特爾、IBM、Google、蘋果。

在性能方面，英偉達是 AI 大模型芯片選擇的第一順位。

值得注意的是，據國盛證券報告《ChatGPT 需要多少算力》估算，以 ChatGPT 在 1 月的獨立訪客平均數 1300 萬計算，其對應芯片需求爲 3 萬多片英偉達 A100 GPU。從全球 GPU 的飽有量來看，擁有一萬顆 GPU 儲備的企業屈指可數。

即使有貨，但受困于美國對英偉達 GPU 産品 A100 和 H100 出口限制，目前也很難買到。

針對這一問題，英偉達爲了留住難以割舍的中國市場，推出了 A100 的替代 A800。這是國内廠商目前能買到的替代品。

但根據芯片經銷商 OMNISKY 容天官網信息顯示，英偉達 A800GPU 數據傳輸速率爲每秒 400GB，傳輸速率有所下降。英偉達 A100GPU 傳輸速率爲每秒 600GB。A800 數據傳輸速度降低了 30%，性能明顯不高。

還有，訓練通用大模型十分燒錢。據國盛證券報告《ChatGPT 需要多少算力》估算，GPT-3 訓練一次的成本約爲 140 萬美元，對于一些更大的 LLM（大型語言模型），訓練成本介于 200 萬美元至 1200 萬美元之間。以 ChatGPT 3 萬多片 A100 的采購量來算，初始投入成本約爲 8 億美元，每日電費在 5 萬美元左右。

站在更大的層面看，如果要實現 AI 大模型最終的産業化落地，其成本将會高達幾十億甚至上百億。

根據 New Street Research 的一項估計發現，Bing 搜索中基于 OpenAI 的 ChatGPT 模型可能需要 8 個 GPU 才能在不到一秒的時間内響應問題。

按照這個速度，微軟将需要超過 20,000 台 8-GPU 服務器才能将 Bing 中的模型部署給每個人，這表明微軟的功能可能需要 40 億美元的基礎設施支出。

燒錢、買不到大量高性能的 AI 芯片，制約着國内 AI 大模型的計算能力。

2、數據集成管理

中外數據質量有着巨大差異性。

IDC 在一項有關 " 中國數據集成與數據質量市場 " 調查的白皮書中指出，大部分中國企業數據集成項目難以達到預期的原因在于數據質量問題。

從市場發展環境方面，可以看到的一些問題是。國内企業 IT 系統大量建設，數據環境較爲複雜，造成數據的重複、不一緻、格式混亂等問題。這些低質量的數據，即便在完成數據集成之後，得出的也可能是質量不高的信息。

一組數據是，72% 的接受調查的中國企業存在重複數據，60% 的企業存在不完整數據。

另外，國内企業普遍存在跨系統利用數據、系統間數據傳遞不及時、以及業務指标理解不一緻也使得數據質量出現問題。

" 如果是靜态數據，則要求完整、準确、一緻，格式規範；如果是動态數據，則要求能被及時調用，快速更新。" 在 IDC 中國高級分析師劉飛認爲，這是衡量數據質量好壞标準。

然而，在國内由于企業數字化程度較低，甚至許多企業停留在最原始的信息化階段，導緻标準化、規範化程度較低，集成管理困難。而在歐美，企業标準化程度高，相對應的數據也較爲标準化，數據質量高。

數據挖掘方面，挖掘程度不同，一般國外把數據挖掘技術應用于各個行業産業的過程中，建立不同的數據挖掘模型。國内主要應用于各個行業儲層評價、施工方式的選擇、生産指标的預測以及各個行業系統的診斷。另外，國内多專于橫截面式的數據分析。國外更注重同一批樣本量的縱向比較和追蹤研究。

在數據研究方面。由于國外注重數據研究的意識，國外數據治理研究主要集中在理論探索、模型框架以及實踐應用三個方面 ; 國内相比之下，技術研發的探索能力較弱一些，所以側重于理論分析尚且缺乏模型與框架等應用研究。

在數據共享方面。國外許多國家都有很多大型的科學數據共享平台，特别是英國、美國，并且許多平台都對自己的數據有一定的質量要求。且國外企業之間也有着良好的數據生态。

目前國内的數據共享平台發展還不夠成熟，國内主要的數據平台是中科院科學數據共享工程中開發的多個學科數據共享平台。且企業之間數據生态并沒有像國外那麽開放。

較爲混亂的數據環境、缺乏數據深度和整體性研究以及數據生态的不成熟等問題，使得國内産業數據在質量、數量上普遍存在一些問題，導緻場景無法真正實現數字化，且在短時間内，無法通過技術、管理手段迅速改善。比起歐美國家，仍有很長一段路要走。

總結來看，以目前國内 AI 大模型的計算能力以及數據集成管理能力，其最後産業化落地的智能預測很有可能價值點較低。即使做出語音交互機器人，可能也并不 " 聰明 "。

但即使是這樣，我們仍需看到 AI 大模型對中國産業發展的巨大意義。

04 在中國，談論 AI 模型的必要性

" 以數據爲關鍵要素，以價值釋放爲核心，以數據賦能爲主線，對産業鏈上下遊的全要素數字化升級、轉型和再造的過程 " 這是産業數字化的官方定義。

簡單來說，産業數字化的前提就是讓數據從資源化奔向資産化。

好比煤炭、石油、天然氣等，隻有少量存儲則不可能被稱做資源，隻有在規模足夠大，具有使用價值之後，才會被稱做資源。

後期則需要對其進行開采和加工，自然需要組織、制度、流程等來保證工作的有序運轉，并使資源轉化爲資産。這時，煤炭、石油、天然氣的價值才能釋放出來。

數據資源也是同樣的道理。當數據資源達到一定規模，就需要組織對其進行開發和利用，成爲數據資産，釋放其價值。

在當下的大數據時代，企業愈發重視數據的采集，這其中不乏一些企業擁有龐大且豐富的數據集。然而，國内企業大規模數據的開發和利用的鏈路十分複雜，普遍面臨數據 " 用不起來 " 和 " 用不好 " 的問題。

但 AI 大模型本身對應的就是數據的高度歸集和表達，其就像一條快速通道，高度歸集代表入口，表達則是出口，讓數據從生産到消費的路徑變得簡單，數據可以便捷、快速地進行開發和利用，釋放數據的價值。

加之，在 AI 大模型 + 産業模型下，大模型可以實現具體場景、領域數據的學習、訓練。所以在産業具體場景下的數據将更有價值，即更加貼合場景需求，可以直擊場景痛點。

可以預見，随着産業模型的落地，将使得企業數據價值得到最大釋放，實現企業數字化轉型、再造，加速産業數字化滲透，推動産業數字化曆程。

另外，AI 大模型的随着時間的推移，廠商的利潤将越來越高。

根據相關機構預測，至 2030 年爲止，AI 訓練成本将持續以每年 70% 的速度降低。

舉例來說，要将一款大型語言模型訓練至 GPT-3 （Generative Pre-trAIned Transformer 3，生成型預訓練變換模型 -3）等級，2020 年得花費近 460 萬美元，2022 年驟降至 45 萬美元，成本節約近 90%。

這對于以往落地難、盈利難的 AI 廠商而言，無疑是一塊巨大的蛋糕。可見，于經營者，于使用者，于産業發展，AI 大模型的布局極其重要。

除此之外，在國家層面，AI 大模型在今年兩會上亦被提上了新高度。

"ChatGPT 之所以引起關注，在于它是一個大模型，對應大數據、強計算、好算法。踢足球都是盤帶、射門，但要做到梅西那麽好也不容易 ...... 要達到 ChatGPT 的效果，可能還有工作要做。"

科技部部長王志剛希望國内的科研院所、企業、廣大科研人員能有進一步發展和進步。

而這是他第二次談及 AI 大模型。

總體來看，AI 大模型已然成爲各個國家、企業發展的戰略要地。已經到了不得不重視的地步。

寫在最後：

回歸技術本質來看，ChatGPT 不是一個新鮮的事物，AI 大模型更不是一個突破性的技術，但 ChatGPT 卻讓其實現了現象級的爆發，在當下 AI 大模型風口下，我們是否應該思考一些更加深刻的問題，除了軟硬件、技術，中國式 AI 到底缺少什麽？或許這才是問題的根源。

技術更叠，已不是壁壘，國産式 AI 需要的是産品的創新思維，以及對需求的産品變現能力。這種亟需具備的特質，适用于所有領域。

更多精彩内容，關注钛媒體微信号（ID：taimeiti），或者下載钛媒體 App