" 烏鎮的小橋流水,能照見全球科技的風起雲湧。"
多年以來,伴随着中國科技的騰飛,以及世界互聯網大會烏鎮峰會的連續成功舉辦,這句話已經成爲全球科技産業的共識。烏鎮是科技與互聯網的風向标、晴雨表,也是無數新故事開始的地方。
而今年的烏鎮,主題似乎隻有一個——人工智能。
11 月 8 日,2023 年世界互聯網大會烏鎮峰會正式開幕,而這一屆峰會的特點,就是無處不彌漫着 AI 的氣息。大模型的崛起與發展成爲最受關注的議題,各個論壇探索着大模型的種種未來,每位企業家都在擘畫着大模型時代的産業藍圖。
在這樣的盛大舞台上,誰才是最能代表中國 AI 科技實力的 " 大模型之光 "?伴随着 " 世界互聯網大會領先科技獎 " 的頒布,我們也看到了答案。
可以看到,在衆多參選技術成果中,百度知識增強大語言模型關鍵技術獲得了 " 世界互聯網大會領先科技獎 ",而這也是大模型領域唯一的獲獎成果。
百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰,在現場發布了文心大模型的關鍵技術成果。他表示," 人工智能正在引領新一輪科技革命和産業變革,大語言模型讓人們看到了通用人工智能的曙光。知識增強大語言模型關鍵技術,突破知識内化和外用技術,具備知識增強、檢索增強和對話增強的獨有技術優勢,并通過模型與框架聯合優化,突破了訓練規模,提高了訓練效率,提升了模型效果 "。
世界科技看烏鎮,烏鎮大模型看文心。
在文心大模型 4.0 成熟的技術路線與工程化能力受到廣泛認可背後,我們可以看到更廣闊的未來。比如大模型産業的發展方向,中國科技新十年的創新底座,以及新科技革命的光明前路。
烏鎮十年
故事新篇由文心領啓
從 2014 年到 2023 年,世界互聯網大會烏鎮峰會剛好走過了十年歲月。因此今年的烏鎮峰會有很多格外讓人感慨的地方。在十年之前,AI 技術還在烏鎮舞台上并沒有得到廣泛關注。而在今天,烏鎮已經呈現出了無處不講 AI,無人不說大模型的盛況。
很多人認爲,烏鎮十年剛好是一個分水嶺,它标志着移動互聯網爲主導的産業周期告一段落,以大模型爲主導的 AI 時代正式到來。
而這個十年變革最具代表性的一幕,就發生在領先科技獎的頒獎台上。
世界互聯網領先科技成果是由世界互聯網大會組織的評選活動。它面向全球廣泛征集前沿科技申報成果,通過評審評出具有國際代表性的年度領先科技成果。這一活動自 2016 年起連續舉辦,如今已經在全球科技與互聯網産業中發揮了舉足輕重的影響。
今年,活動全面升級爲世界互聯網大會領先科技獎,并首次分爲關鍵技術、基礎研究、工程研發三類,面向全球表彰年度領先互聯網科技成果。據了解,今年參選的科技成果多達 246 項,涵蓋 AI、大數據、5G、車聯網等領域。
而在今年大模型崛起,AI 時代到來的背景下,誰能摘得大模型領域的領先成果獎就變得意義非凡。經過 40 名海内外專家評審,百度知識增強大語言模型關鍵技術成爲唯一獲獎的大模型技術。可以說,文心大模型的獲獎,領啓了烏鎮新十年的 AI 故事,開啓了全球互聯網走向大模型時代的變革序曲。
文心大模型獲獎究竟爲什麽能奪得如此關鍵的獎項?其獲獎的宏觀意義究竟是什麽?
核心技術與工程化路徑
" 大模型之光 " 展現了什麽?
獲得了世界互聯網大會領先科技獎的文心大模型,毫無疑問可以被稱爲中國的 " 大模型之光 "。而在一系列産業界、學術界認可,以及開發者、用戶的廣泛支持中,文心究竟做對了什麽,是一個值得深入思考的問題。
從技術内核上看,文心大模型最爲關鍵的是知識增強、檢索增強和對話增強等獨有技術優勢。
在知識增強方面,文心大模型可以從數萬億數據和數千億知識中融合學習,把知識内化至模型參數中,同時靈活高效地運用外部知識,最終實現模型效果更好,效率更高。
在檢索增強方面,文心大模型采用了基于語義理解與匹配的新一代搜索架構,能夠爲用戶提供更精準的搜索結果,與生成模型聯合優化,最終讓輸出的内容準确率更高、時效性更強。
在對話增強方面,文心大模型基于領先的通用對話技術,提升大語言模型的上下文理解、對話規劃及記憶能力,使對話的連貫性和合理性更好。
在工程化領域,文心大模型展現出了業界矚目的極高叠代效率。并通過模型與框架聯合優化,突破了訓練規模,提高了訓練效率,提升了模型效果。目前,文心一言的基礎模型已叠代到文心大模型 4.0 版本。在文心大模型和飛槳深度學習平台聯合優化下,文心大模型 4.0 的訓練算法效率已經提升到 3 月發布時的 3.6 倍,推理能力提升了超過 50 倍。
在這些關鍵技術支撐下,文心大模型在全球多個公開測試中實現了技術效果領先。百度知識增強大語言模型相關技術先後獲得了國家技術發明二等獎、中國專利金獎、吳文俊人工智能科技進步特等獎、中國電子學會科技進步一等獎等。
核心技術有可持續發展的差異化優勢,工程化能力與模型叠代效率極強。這兩點構成了文心大模型的發展方案,也形成了中國大模型在全球 AI 競賽中的代表性能力。當文心大模型的技術底座,結合廣大開發者的應用創新能力,千行百業的智能化需求——大模型之光,最終會點亮中國 AI 的發展之光,世界互聯網科技的進步之光。
多年積累
終爲科技革命照見前路
托馬斯 · 庫恩在《科學革命的結構》中說,科學家由一個新範式指引,去采用新工具,注意新領域,最終在科技革命之後,我們會面對一個完全不同的世界。
在文心大模型獲獎背後,真正值得被看見的是百度在 AI 技術上的多年積累,不斷爲科學家、産業界提供新工具,打開新領域。最終,有望通過 AI 技術推動新一代科技革命到來,幫助互聯網産業,乃至整體社會經濟抵達一個新的世界。
事實上,在文心大模型獲獎之前,百度已經通過百度大腦、小度助手(DuerOS)、Apollo、飛槳,先後四次獲得世界互聯網大會領先科技成果。這些獎項展示了百度如何一步步探索 AI 技術的可能性,最終通過不斷的技術積累,去敲開新科技革命的大門。
在今天,大模型技術的發展與成型,進一步照亮了科技革命的前路。在百度看來,我們已經有了擁抱變革的清晰目标與實現方式。我們可以通過三個角度,來總結文心大模型背後,百度的 AI 技術思考。
首先,AI 工業大生産,是新科技革命的實現方式。
王海峰表示,人工智能是新一輪科技革命和産業變革的重要驅動力量,深度學習作爲人工智能的核心技術,具有很強的通用性,并具備标準化、自動化和模塊化的工業大生産特征,而大模型的興起,使得人工智能應用的深度和廣度進一步拓展。人工智能已進入工業大生産階段。
面向未來,大模型将從更多領域推動 AI 技術的标準化、自動化和模塊化,從而不斷降低 AI 技術的應用門檻,提升其場景化落地的便捷性。這些工業化大生産特征的積累和聚合,将推動新科技革命到來,加速産業智能化升級,最終創造社會生産力的巨大爆發。
其次," 芯片代工廠模式 ",是适配大模型發展的産業路徑。
大模型有着重投入、廣應用的産業特征,這就導緻其前期成本巨大,有着不小的産業挑戰。面對這一挑戰,王海峰表示大模型可以采用類似芯片代工廠的産業模式。通過 " 集約化生産,平台化應用 " 模式,讓具有算法、算力和數據綜合優勢的企業将模型生産的複雜過程封裝起來,通過低門檻、高效率的生産平台,爲千行百業提供大模型服務。
目前,這一産業化路徑已在文心大模型産業實踐中得到驗證,百度與合作夥伴共建了包括能源、金融、航天、制造、傳媒、城市、社科以及影視等 10 餘個行業大模型,加速大模型産業化落地。
此外,AI 加強理解、生成、邏輯、記憶四大能力,将帶領我們走向 AGI 的曙光。
王海峰認爲,人工智能具有多種典型能力,理解、生成、邏輯、記憶是其中的基礎能力,這四項能力越強,越接近通用人工智能。大語言模型具備了這四項能力,且越來越強,爲通用人工智能帶來了曙光。
在構建基礎底座、探索産業路徑、錨定未來方向等領域,百度對 AI 技術與大模型進行了廣泛且持續的投入。最終也收獲了來自産學各界、開發者、用戶的積極反饋。文心一言自 8 月 31 日面向全社會開放至今,用戶規模已經達到 7000 萬,構建場景超過 4300 個,助力開發應用 2492 個。飛槳和文心生态已凝聚 800 萬開發者,服務 22 萬家企事業單位,創建了 80 萬個模型。
文心閃耀烏鎮的最大價值,是百度持續的 AI 探索,正在成長爲業界共識,發展成社會底座,凝聚爲照亮新科技革命前路的燈塔。
而這些成果,将讓 AI 之花綻放在中國大地上,盛開出烏鎮故事新十年的智能花海。文心耀烏鎮,AI 綻神州,正在成爲目之所及的風景。