《科創闆日報》2 月 26 日訊(編輯 鄭遠方) 2007 年,喬布斯手中的一台初代 iPhone,改變了整個手機行業。多年後,人工智能行業迎來了獨屬于自己的 "iPhone 時刻 " —— ChatGPT 橫空出世。這一聊天機器人引發了普羅大衆對 AI 應用的熱情的同時,也引燃了 AI 大模型的戰火。
宛如當年争相入局手機的華爲、三星、小米等多家廠商一般,在如今的 AI 領域,中國電信、阿裏巴巴、百度、字節跳動、網易等公司也相繼發聲,或官宣入局,或透露最新進展。Meta 也緊随而至,宣布最新推出 Meta 人工智能大型語言模型(Large Language Model Meta AI),簡稱 LLaMA。
圖 | 國内外部分公司 AI 預訓練大模型梳理
北京市此前表态 " 支持頭部企業打造對标 ChatGPT 的大模型 ";上海市副市長李政也表示,将建設更具影響力的人工智能上海高地,加快多模态通用大模型研發攻關,積極培育智能内容生成、科學智能等新賽道,推動智能芯片核心技術攻關和應用适配。
可以預見的是,站在 AI 大模型的那座石門前,ChatGPT 喊出了那一聲 " 芝麻開門 "。
▌大模型是什麽?
大模型又稱爲預訓練模型、基礎模型,按照科技部部長王志剛的話來說,就是大數據、大算力、強算法。"(ChatGPT)确實在自然語言理解、自然語言處理等方面有進步的地方,同時,在算法、數據、算力上推進了有效結合 "。
在這場席卷全球的 "ChatGPT 熱潮 " 背後,中國國際經濟交流中心副理事長、國際貨币基金組織前副總裁朱民指出,人工智能發展的核心正向大模型轉移,行業未來所有的工作重點、趕超重點、研究重點都會放到大模型上,而不是 ChatGPT 産品本身。大模型将是影響今天和未來、中國和世界的最根本科技。
以 ChatGPT 爲首的 AI 應用已讓人們見識了 AI 模型的潛力,除此之外,在去年的美國科羅拉多州博覽會上,一幅名爲《太空歌劇院》的繪畫作品獲得數字類别一等獎,但不少人對于獎項歸屬并不服氣。争議主要來自作品的創作過程:作者 Jason Allen 通過 AI 繪圖工具 Midjourney 生成原畫、經過 Photoshop 潤色後完成作品。
" 機器的勝利其實是人類的勝利。當人類被自己創造的東西打敗之後,我們很容易忘記這一點。"第一個敗給計算機的國際象棋大師 Garry Kasparov 在 2017 年的一次演講中如是說。
▌大模型有何優勢?
那麽對于人類而言,AI 大模型能帶來什麽?
一方面,大模型在加速 AI 産業化進程的同時,也降低了 AI 應用的門檻。眼下,AI 正從 " 可以用 " 走向 " 好用 ",但仍處于商業化落地早起。而大模型可幫助提高模型通用性、降低訓練研發成本,從而降低 AI 落地應用的門檻。
谷歌 AI 負責人 Jeffrey Dean 也在 2022 年發布的《深度學習黃金十年》一文中感慨,随着計算機軟硬件改進,機器識别圖像、辨别語音、理解語言取得極大進步,且進展越來越快。研發門檻大幅降低,不再是年薪上百萬的計算機博士才有機會參與,一個程序員學幾個星期就能上陣。
另一方面,大模型也帶來更強大的智能能力。得益于大模型發展,AI 技術從 5 年前的 " 能聽、會看 ",走到今天的 " 能思考、會創作 ",未來更有望實現 " 會推理、能決策 " 的重大進步。
從技術原理來看,AI 大模型本質上是深度學習的 " 加強版 ",通過給模型不斷 " 填喂 " 數據,從而提高自學習能力,進而具有更強的智能程度。
▌大模型需要什麽?
與這些優勢相伴而生的,則是 AI 大模型 " 高聳入雲 " 的門檻——大模型需要巨量數據、巨量算法、巨量算力,要求的金錢、人力、時間投入同樣巨大。微軟甚至宣稱,使用了價值 10 億美元的超級計算機來訓練自家的 AI 大模型。
行業的重金砸入,換來了 AI 模型訓練算力的暴漲。OpenAI 數據顯示,自 2012 年以來,全球頭部 AI 模型訓練算力需求 3、4 個月翻一番,每年頭部訓練模型所需算力增長幅度高達 10 倍。而摩爾定律中,集成電路中的晶體管數量大約每兩年翻一番。有券商分析師指出,深度學習正在逼近現有芯片的算力極限。
以 ChatGPT 爲例,據分析人士估算,其制造商 OpenAI 的 GPT-3 模型訓練成本高達 1200 萬美元,單次訓練成本高達 460 萬美元。
另據海通證券測算數據顯示,ChatGPT 後續穩定運營時期,假設總訪問量維持在 2000 萬次左右,咨詢量以 8 個問題計算,總咨詢量在 1.6 億次,則對 GPU/CPU 單日同時運轉的耗用量分别爲 19444/4861 個。對應現有價格及替換周期假設,預計運營階段,ChatGPT 年 GPU/CPU 成本分别在 7000 萬美元及 778 萬美元。
浙商證券補充稱,采購一片英偉達頂級 GPU 成本爲 8 萬元,GPU 服務器成本通常超過 40 萬元。支撐 ChatGPT 的算力基礎設施至少需要上萬顆英偉達 GPUA100,高端芯片需求的快速增加會進一步拉高芯片均價。
無論如何,AI 大模型之戰的開場鑼鼓已經擂響,各家巨頭們手握重金換來的入場券,紛紛在牌桌前坐定。但躬身入局之後仍需要實力與運氣的加持,誰能笑到最後,誰又會黯然離場,還有待時間驗證。