本文來源:時代周報 作者:楊玲玲 鄭栩彤
AI 大模型熱潮持續,國内多家科技企業已走出不同路徑:百度集團(BIDU.NASDAQ,09888.HK)發布文心一言,成爲中國第一個類 ChatGPT 産品;阿裏巴巴(BABA.NYSE,09988.HK)的類 ChatGPT 産品通義千問,也在近日開啓外部測試。
而市場傳言,華爲亦将加入大模型競賽,發布 " 盤古系列 AI 大模型 ",但時代周報記者未在華爲雲官網找到相關信息,咨詢華爲雲相關人員 " 盤古系列 AI 大模型 " 上線時間也沒有得到明确答複。
4 月 8 日,華爲雲人工智能領域首席科學家田奇在人工智能大模型技術高峰論壇上發言。論壇上,田奇并未透露關于盤古大模型的最新變化和産品計劃,亦未透露更多 NLP 大模型的消息,而該模型是被認爲最接近人類中文理解能力的 AI 大模型。
但田奇表示,華爲雲盤古大模型推動人工智能開發從 " 作坊式 " 到 " 工業化 " 升級。目前,華爲已陸續發布礦山、氣象、海浪等系列盤古行業大模型,展望未來,AI for Industries 是人工智能新的爆發點。
圖源:田奇演講 PPT
當大廠們相繼湧入大模型賽道,各行各業紛紛接入大模型提供的 AI 能力,預示着一場聲勢浩大的技術革命悄然發生,新的産業風口正在形成。風口之下,華爲盤古大模型與其他 " 類 ChatGPT" 産品究竟有何不同?
拆解盤古大模型
田奇的演講内容并不新穎。在 3 月舉辦的博鳌亞洲論壇 2023 年年會上,田奇就稱 "AI for industries 将成爲人工智能新的爆發點 "。
對于廣受關注的盤古 NLP 大模型,田奇透露的細節不多,而這一大模型正是 ChatGPT、文心一言、通義千問等近期走紅的大模型所屬的技術領域。
會上,田奇隻簡單介紹稱,目前,在 NLP 大模型上,華爲盤古聚焦文本生成與内容理解,已進入智能文檔搜索、智能 ERP、小語種大模型領域,落地企業财務異常檢測、阿拉伯語大模型等場景。
市場對盤古新 NLP 模型的期待,來自于這一模型此前的突出表現。資料顯示,2019 年的權威中文語言理解測評基準 CLUE 榜單中,盤古 NLP 大模型在總排行榜及分類、閱讀理解單項的排名均爲第一,總排行榜得分 83.046,接近 85.61 的人類水平。
上海證券分析師陳宇哲在研報中稱,在早前的華爲開發者大會上,華爲曾宣布盤古大模型是業界首個千億級生成與理解中文的 NLP 大模型,其認爲未來有望成爲國内最強的 Chat GPT 應用。
演講的後半段,田奇重點介紹了盤古 CV 大模型和科學計算大模型,以及它們的應用場景。比如,CV 領域的礦山大模型、基于盤古 CV 大模型的鐵路巡檢方案等,以及科學領域的盤古氣象大模型、藥物分子大模型、海浪預測大模型。
其中,盤古礦山大模型通過 5G+AI 全景視頻拼接綜采畫面卷,傳輸到地面,地面工作人員将來可以實現地面控制機器進行采礦,實現礦下無人少人安全作業;華爲雲盤古氣象大模型,可實現 20 公裏範圍内、小時級、13 層最高精度氣象預報,如台風生成時間與移動矽基的預測準确率達 85% 以上;華爲雲盤古藥物分子大模型,讓先導藥的研發周期從數年縮短至 1 個月,同時降低 70% 的研發成本。
浙商證券分析師陳杭撰寫研報表示,在 ChatGPT 背後,不斷叠代的 GPT 系列使得大模型成爲當下科技企業核心競争力的重要體現,未來,大模型将成爲 AIGC 時代的核心支撐。華爲作爲國内科技龍頭,2021 年發布的盤古大模型有望在 AIGC 時代中引領潮流。
大模型洗牌提速
加入華爲之前,田奇已經是 AI 領域業界知名的學者。2020 年 3 月,田奇加入華爲雲後便開始組建團隊并進行方向梳理;9 月,團隊開始推動盤古大模型的立項,希望能夠在華爲雲的産業基座上,完成适配各個産業 AI 開發的大模型;11 月,盤古大模型在華爲雲内部立項成功,并完成與合作夥伴、高校的合作搭建。
據媒體報道,支撐盤古大模型不斷攻堅克難的團隊,起初僅有幾個人,他們是讓盤古大模型得以從實驗室走向産業的中堅力量。随後,團隊逐漸壯大起來,擁有 20 多名博士、30 多名工程師、3 名廣受關注的 " 華爲天才少年 ",還有 50 多名來自全國 C9 高校的專家。
要打造一個屬于中文世界,并且适配各種真實産業場景的 AI 預訓練大模型,擺在研發團隊面前的是兩大門檻。
圖源:圖蟲創意
一個是技術門檻,大模型需要卓越的并行優化來确保工作效率,這對網絡架構設計能力提出了更高的要求;第二是資源門檻,大模型訓練需要極大的算力,在訓練千億參數的盤古大模型時,團隊調用了超過 2000 塊的昇騰 910,進行了超過 2 個月的訓練。
2021 年 4 月,盤古大模型正式對外發布。盤古大模型發布以來,已經發展出 L0、L1、L2 三大階段的成熟體系持續進化。
所謂 L0,是指 NLP 大模型、CV 大模型等五大水平領域的基礎大模型;而 L1 指行業大模型,比如氣象、礦山、電力等行;L2 指面向各行業中細分場景的模型,比如電力行業的無人機巡檢。
去年 9 月,華爲輪值董事長胡厚崑在 2022 世界人工智能大會上表示,華爲雲盤古預訓練大模型已完成從學術大模型到産業大模型的轉變,形成 " 基礎大模型 - 行業大模型 - 細分場景大模型 " 的發展路徑,并且在醫療、互聯網、金融、煤礦、農業、氣象等領域中實現降本增效。
如今,随着華爲、百度、阿裏、騰訊(00700.HK)等科技企業陸續推出相應産品,以及商湯科技(00020.HK)、科大訊飛(002230.SZ)宣布發布計劃,大模型賽道将進一步擁擠,市場普遍認爲,未來大模型市場勢必将迎來新一輪的整合與洗牌。
田奇也在分享中提到,未來 " 大模型将成爲應對 AI 領域應用碎片化的一種方式,相較于此前不同場景對應不同小模型的狀況,未來大模型有可能收編高度定制化的小模型,導緻市場向大公司集中 "。