圖片來源:視覺中國
務實點看,大模型要先走向行業;再務實點,華爲雲直接将博士們推向了一線。
盤古大模型初見真章是在 2021 年 4 月,NLP 大模型與 CV 大模型正式發布;此後,科學計算大模型、藥物分子大模型、礦山大模型和萬衆矚目的氣象大模型等紛紛浮出水面;再到此前 7 月 7 日,華爲開發者大會發布盤古大模型 3.0,9 月 21 日華爲全聯接大會發布盤古汽車大模型和醫學大模型,華爲雲逐漸将盤古大模型在各行業的布局徐徐展開。
可是,做 B 端市場不是件容易的事情,貼近生活的大語言模型雖說能夠滿足豐富的日常交互,但其本身的語料内容缺乏不同行業的專業背景,在工作實用性上難以深入;金融、醫療、生物、氣象等垂直領域真正能觸發大模型潛力,需要大模型設計者了解特定的行業,而行業術語、行業邏輯、行業場景等,是大模型算力、算法技術之外的天地。
行先于言,過去幾年,華爲雲把一批又一批博士、專家、科學家派到客戶現場,走田頭、跑工地、下礦井、進車間,目前已幫助超過 1000 家企業落地智能化創新項目。今年,華爲雲還計劃将 200+ 博士送到一線。長遠來看,做出實用、好用的行業大模型,了解行業才是先見。
隔行如隔山
行業大模型是 " 行業 "+" 大模型 ",實爲兩個不同的專業與專業的結合碰撞。
好用的行業大模型首先是要懂行業,最終的産品需要運行在每個車間、礦井、田間地頭,使用者說好,才算實現大模型落地這一關。将博士送往一線,是華爲雲做出的最樸實的決定。
在所有前往一線的博士們印象中," 隔行如隔山 " 的感受在預想之内,但還是來得有些 " 生猛 "。華爲不缺擅長大模型的專業技術人才,也不缺來自各行業的一線經驗,但每個行業都有自己的專業術語和獨特業務,與博士們本職的技術研發工作相比,知識壁壘的确存在。尤其在行業體系更複雜的自動駕駛、金融、重工業等領域,這些阻隔更爲強烈。
先拿自動駕駛來說,華爲雲 EI 人工智能算法專家金博士對于下一線有着頗多感悟。
"初次進入自動駕駛行業,感受到的是其技術鏈條非常長,行業體系龐大。" 金博士直言。原來在縱深的自動駕駛行業技術鏈條中,隻硬件層面就包含了車輛硬件、視覺和雷達等多傳感器的選型、傳感器的布局安裝等細節;軟件層面則分類更多,圍繞數據與算法,包含了數據采集、數據清洗、數據标注、感知算法、定位算法、決策規劃和執行控制等等。而每一個模塊,都有各自對應的專業團隊。
所謂隔行如隔山,在衆多專業模塊中,找到華爲雲盤古大模型在自動駕駛行業的切入點,則是最難的業務問題。破題的火苗,出現在金博士與客戶共同的 " 封閉會戰 " 期間," 那段時間經常是 6 點多出發的高鐵去上海,有一次我坐在位置上閉上雙眼,腦海裏沖擊着完全不同的兩個畫面:早晨起床看窗外僅僅亮着那麽三四盞燈,和幾小時後淹沒在一杯一杯水中的密集交談、連帶着高速頭腦風暴,一根根頭發都立了起來。"
需要高強度溝通的客戶很多,傳統車企、造車新勢力、自動駕駛科技公司等不同類型行業客戶,都在落地大模型所要溝通了解的範圍之中,這些行業在一線的業務問題或多或少都有不同。不過,對金博士來說,行業多也好理解難也罷,想要創造出好用的東西,理解都是第一步,但總要走這第一步。
比對、總結、與思緒紛飛,溝通的成功讓大家落實了切入方向——對付影響高階自動駕駛落地的關鍵因素:各類不常見但不斷出現的 " 長尾問題 ",因爲如何加速長尾場景的數據閉環,是自動駕駛量産的關鍵。
大模型時代,自動駕駛行業的突破依賴高質量、高場景覆蓋度、精細标注的數據。而現在的問題恰恰是:當前路采數據采集效率低、成本高、corner case 數據難獲取,場景覆蓋率低。一個包含視覺、雷達等多傳感器的 10 秒 clip,采集标注等成本卻達幾百元,而自動駕駛需要的,是幾百萬小時的行駛數據。下到了一線後,金博士才如此真切地體會到了自動駕駛數據的價值。
科學家費曼說 " 隻要我不能創造的,我就還不理解 "。也正是在博士們一線的深入體會與理解中,盤古汽車大模型能夠生成多種 Corner case 場景,讓自動駕駛遍曆各種複雜場景變成可能。
通過應用盤古大模型,自動駕駛的 Corner Case 可以實現天級的閉環,顯著提高數據閉環效率。基于盤古大模型的場景生成能力,企業可以構造出雨天、下雪天的場景用于模型的訓練,不必等待特殊天氣才能進行數據采集。此外,20% 的路測工作也可以通過大模型的場景生成來實現,縮短了裏程積累的周期。大模型能夠快速地構建出場景豐富的樣本,而且對樣本的數量要求也隻有以前小模型的十分之一。
山外有山
隻是山外還有山,除了打破行業間專業壁壘的難題,橫亘在大模型設計者與使用者之間的,還有來自一線客戶的真實需求,這往往與預想中不一緻。做行業大模型,首先要尊重行業,其次要尊重來自一線的從業者的經驗。
參與盤古金融大模型研發的謝博士感受尤爲深刻:" 深入一線後,我們對金融行業客戶現場交付有了新的認知,客戶側存在不同的業務線、不同背景的人,因此他們對大模型的需求和偏好是多樣的,甚至有時,需求的特點是相對的。"
比如,宣傳部門希望大模型生成的内容要更發散,更有創意性,能夠幫助他們打開思路;但授信部門要撰寫授信報告,則要求大模型生成的内容更客觀、更精确、更尊重原文。" 引導客戶群說出他們在工作中遇到的難點與真實需求是必要的。" 謝博士說到。
在一線,謝博士收集了宣傳部門人員在撰寫宣傳文案會考慮宣傳的對象特點作爲人設,比如以年齡段來區分,針對老人、中年人、大學生等分别對應的寫作文案的特點,将這些信息加入到 prompt 中,就能很好提升大模型生成效果。針對授信部門的人群,發現他們在撰寫過程中經常引用财報等專業性較高的材料,那麽在大模型書寫過程中,就需要提示大模型參考特定材料,書寫與原文保持一緻。也正如此,不同場景的需求都在盤古金融大模型中有了精細劃分。
而深入溝通,除了能夠了解最真實的業務需求外,還聊出了更多業務之外的想法。祝博士主要負責了金融大模型的落地,更專注于盤古大模型的效果評測與效果提升。和銀行員工的交流,是他在一線活動中印象最深刻的事。
大模型成風的那段時間," 我會不會失業?"" 會不會有一天,我将被技術終結?" 這些飄零的話語深深叩問着職場打工人的心。是擁抱技術還是換個姿勢擁抱技術,大家深知,其實我們沒有選擇權。但當這看似遙遠的事被真正考慮在企業發展中,還是會有些不可思議。
針對人力密集型場景,也就是大模型提質增效最具想象的場景,有銀行表示并不希望員工被大模型取代,而應該讓大模型提升服務質量與服務效率,釋放員工做更多更高價值的事。基于此想法,華爲雲則聯合該銀行,梳理了大模型在企業應用的人員轉身實踐。
同樣在銀行一線駐紮的祝博士說到:"這次交流也驅動我們梳理了一整套企業落地方法論,我們想做到授人以漁,讓企業、企業員工深入擁抱新技術,主動應用大模型解決業務痛點。" 通過聯合實踐,他們形成了一系列培訓課程,從産品需求洞察、prompt 調優、微調、大模型運營等各個維度,并和遠程銀行、UX 設計、網點等部門合作,建立聯合項目組,目的是驅動企業人員能力提升。也或許,這才是一線工作人員的真實需求。
最終,付出得到的回報也讓祝博士十分開心。在當前已經上線的場景中,客戶把網點文檔問答包裝成了該銀行的 " 爆款 " 場景,10 月時計劃全行推廣,此外,因爲應用效果比較好,他們還計劃橫向推廣到信貸、金融、内審等場景。
見山
過去幾年,通過把一批又一批博士、專家、科學家派到客戶現場,直面難題、解決難題。除了上文提到的金博士、謝博士、祝博士的經曆,華爲做過的難事不算少數,也赢得了許多業内好評。
在礦山領域,有博士被送到了山東能源集團,下到礦井實地調研,目的是爲了解決提升精煤産率這一困擾業界多年的難題。精煤不僅低碳環保,而且經濟價值更高,廣泛應用于電力、鋼鐵、化工等領域。2022 年,我國原煤産量達到 45.6 億噸,但精煤産量僅爲 4.9 億噸。
隻是,洗選煤生産的工藝參數涉及 100 多種,傳統洗選密度控制依靠人工經驗确定,無法及時準确地通過數據分析對分選密度進行實時調整,容易導緻指标波動,造成精煤回收損失。
基于實地考察的結果,最終博士們提出通過盤古預測大模型能力,對不同煤層、不同季節、不同灰分(煤炭完全燃燒後餘下的殘渣)的原煤煤質數據和工藝參數智能分析,同時,基于華爲自研的圖網絡融合技術對多個最優算法進行堆疊、動态調優,能夠精準預測精煤産品的灰分值,從而實現重介選煤分選密度的精準控制與動态調整。在這一新方案下,山能濟二煤礦每年能多産出 8000 噸精煤。而如果能将這個能力推廣到全國,可以讓每個煤礦每年平均多産出 2000 噸精煤。
推動 " 數智山能 " 之外,華爲雲的博士們通過将大模型技術賦能藥物分子及醫療,也讓一線的醫療科研按下加速鍵。
西交大一附院劉冰教授團隊發現世界 40 年來首個抗生素,就是在盤古藥物分子大模型助力下實現的,目前該項目已進入臨床階段,價值達到了 1 億美元。據測算,通過盤古藥物分子大模型,可以将先導藥物研發周期縮短至 1 個月,研發成本降低 70%。
負責華爲科學計算與生物醫療領域産品的劉星星博士說到:" 我本身是生物醫療領域的博士,五年前畢業之後,看到華爲在生物醫療領域投入的決心,以及華爲在 AI、大模型的整體規劃吸引了我,因此我決定,那就加入到華爲。"
在自己的科研願景下,劉星星博士也收獲到了想要的東西:" 當時有個客戶反饋說,和其它大廠也聊了很多,但最終發現華爲最懂他們,我覺得這是最讓我感到自豪的事情。我們長期深入一線的功夫沒有白費。"
華爲雲對待科研的務實做法,對于一批真正想實現科研落地的人才來說,就是安撫躁動夢想的解藥。
一作發 Nature 的華爲工程師恺峰,是清華大學錢學森力學班 2016 級本科畢業生。7 月 6 日,恺峰和同事們的論文《三維神經網絡用于精準中期全球天氣預報》發表于 Nature 雜志,報告了業内 " 首個在中長期氣象預報上精度超過傳統數值預報方法的 AI 模型 "。這也是近年來中國科技公司首篇作爲唯一署名單位的 Nature 正刊論文。
回憶起盤古氣象大模型,時間穿回 2021 年底,恺峰在一次偶然的機會中發現中期氣象預報可能是 AI 很好的運用場景。當時,他半開玩笑半認真地和同事說:" 我準備做一個很大的項目,用 2000TB 的曆史氣象數據去構建一個 AI 模型,要是成功了那麽全世界氣象預報的範式都要被徹底改變。"
當時,擺在面前的有三個問題,第一個是天量的數據,第二個是不均勻的經緯度網格和扭曲的等壓面,第三個則是不斷累積的叠代誤差。但在解決問題的過程中,不斷出現了與業界既定看法相悖的想法。
如何處理歐洲已經開放的 2000TB 的全球氣象數據?恺峰首先選用了少量的數據作診斷性實驗,但與大部分氣象專家的看法相反,經過試驗,他發現僅使用位勢、溫度、濕度、風速四種狀态就可以很好地建模大氣的演變,同時垂直高度上的層數對精度的影響很小。
此外,爲了減少預測的系統誤差等大部分類似問題,之前都是用自回歸的方式來解決。但實踐表明,這一方式用來做氣象預測有巨大的弊端——自回歸學到的結果不可避免的平滑,所有的極端天氣都被忽略了。
" 我試了很多很多方法去解決這個問題,包括很多正則類方法,效果都不盡人意。最後解決這個問題的是一個非常簡單的小技巧:我把不同時間的預測模型分開了,用 24 小時的模型去做天級的預報,6 小時,3 小時,1 小時的模型去做更細緻的預報,這樣來盡可能地減少叠代次數。這也讓我們成爲了唯一可以預測逐小時天氣的 AI 模型。" 恺峰總結到。
此前的實習,恺峰做的是純粹的科研,但這是讓他覺得可惜的事情:" 兩篇神經網絡結構搜索相關的課題都離落地比較遠,所以比較缺乏成就感。記憶裏非常多種 idea,最終也沒有找到實際場景可以很好的運用。當時感覺‘人生中第一次做科研’,卻沒有很好的 feedback。"
而進入華爲之後的落地科研,讓恺峰懷抱着激情的同時,真正了解到 AI 落地與 AI 科研之間的區别——科研的時候隻需要在 "imagenet 數據集 " 上精度高一兩個點就可以了,但是落地的場景很碎片化,數據标注流程和質量要自己控制,算法調優周期要盡可能的短,樣本數目比較少但是場景特别多。不過," 落地場景一般做起來都比較快樂 ",恺峰說到:" 對我而言,更困難的地方是寫各種文字材料,還有就是場景很碎片化,我更想做一些‘價值更大’的問題。"
成爲山
華爲鼓勵博士、科研人員在一線做難事的同時,也在他們身後擔當起了靠山作用。對待科研,華爲确實是慷慨大方的。恺峰說到,在進行氣象大模型的訓練中,他申請了兩個月的 AI 算力。在順利的過程推進下,他們 AI 模型精度超過了全球最好的數值方法,例如,盤古對于台風路徑預測的準确度比之前最好的歐洲中心預報還要高 20%。
對内慷慨,對外,華爲希望共建一個大模型生态。其實,這也是在推進一線工作之後所要走完的最後一公裏,讓大模型繼續下沉。
以雲服務的方式提供昇騰 AI 算力,也解決了客戶自訓練大模型的難題。畢竟大模型訓練依賴極大算力消耗,由于高端 GPU 芯片出口限制等問題,大模型産業發展需要持續供應、自主創新的 AI 算力。而昇騰 AI 雲服務,可以實現從算力、芯片使能 ( CANN 算子庫 ) 、AI 框架 ( MindSpore AI 計算框架 ) 到 AI 平台 ( AI 開發生産線 ModelArts ) 的自主創新。
博士們沖在前線做難事、解難題,昇騰 AI 雲服務的澎湃算力做靠山,華爲遙遙領先的其實是走出科研,走回一線的實踐能力。
回頭看看,那些難以跨過的山巒,也在攀越起伏的決意中,漸行漸遠。