人工智能的技術創新和産業發展,進入" 深度學習 +"階段。
這是來自百度 CTO王海峰的最新判斷。
沒錯,不是很多人已熟知的 " 人工智能 +" 或是 " 智能 +"。
而是把範圍直接縮小到了它們的子集:深度學習。
有何區别?
類似于此前更早的 " 互聯網 + 交通 " 催生打車軟件、網上購票改變人們出行的方式,符号的前後二者絕不是簡單的求和關系,而是需要它們進行深度融合。
而人工智能技術,在當今被普遍視為第四次工業革命的核心驅動力;因此,作為人工智能關鍵核心的深度學習該如何做 "+" 法,我們不妨以史為鑒,通過前三次科技革命的發展進程來窺其一二。
衆所周知,每一次的科技革命都擁有一個核心驅動力般的技術存在,它們分别是機械技術、電氣技術和信息技術,而其共性便是都具有很強的通用性。
在三個科技革命步入到 " 大生産 " 階段之際,這些核心技術在紮根行業的同時,類似于作用力與反作用力,行業本身也在發生着質的變化。
一方面是在這些技術加持下的行業逐步成為社會基礎設施般的存在;另一方面,随着這些行業的不斷發展,還催生出了更多新技術和新行業。
再具體一些,以第二次科技革命的電氣技術為例,技術本身從發電機發展到大規模發電、架設電力網絡、研制各種輸變電設備等,于是乎,電力的産業鍊便形成了。
不止于自身的發展,在電氣技術與其他傳統科學做 "+" 法時,還衍生出了電化學、電物理、電生物學等新的研究領域。
由此更進一步地使後來的電子、通信等新型技術行業得以興起。
如此總結來看,每一次科技革命,都需要這樣一個驅動力般的核心技術做 "+" 法來徹底改變社會的發展。
而站在現今這一時間節點,王海峰則認為,當前規模化的 AI 大生産已然形成,深度學習從技術、生态、産業等多個維度逐漸成熟,人工智能的技術創新和産業發展,進入" 深度學習 +"階段,讓創新創造大有可為。
王海峰還給出了這樣的一個評價:
" 深度學習 +" 是創新發展新引擎,驅動技術發展和産業增長,讓創新創造大有可為。
那麼作為國内第一批且深耕深度學習十餘載的百度,到底對 " 深度學習 +" 擁有的是怎樣的一種思考和理解?
" 深度學習 +",要 "+" 什麼?
區别于前三次科技革命,第四次科技革命所涉及的驅動力技術還是有較大區别的。
因為人工智能本身就是一個具備交叉性的技術,所以它要從一個技術演進成為基礎設施,再去影響千行百業,"+" 法顯得更為重要。
而作為人工智能技術的核心,深度學習也是沿襲了上述特性。那麼 " 深度學習 +" 又該如何實現 "+" 法呢?我們逐層拆解來看。
首先是" 深度學習 + 知識 ",這是從技術角度出發所給出的一個 "+" 法。
這裡的知識,所指的是凝煉了人類認識和改造世界的智慧。
如此結合之後,機器便不再是像以往簡單地被投喂大量數據來訓練學習,而是要把大量知識也融入進來。
一個非常典型且符合這種 "+" 法的案例,便是百度自研的産業級知識增強大模型——文心。
如此做法之下結果,用王海峰的話來說就是:
知識增強的深度學習,效果更好,效率更高,有更好的可解釋性。
換言之,在第一層 "+" 法加持之下,人工智能技術不僅能夠憑借海量知識演繹 " 通才 " 般的角色,放之各行各業,也是具備 " 專才 " 的能力。
而 " 深度學習 +" 的第二個維度是從生态角度出發,所要連接的是" 上下遊生态夥伴 "。
這是因為深度學習要把它的實力發揮到極緻,光是靠模型算法層的單打獨鬥是遠遠不夠的。
放眼人工智能發展曆史,在提高效率這件事上也亦是如此,單憑算法的加成畢竟具備局限性。
因此," 深度學習 +" 的第二個 "+" 法,就是要把芯片、框架、模型及應用都融合進來,一起構成一個深度學習的良性生态。
例如芯片在這個 "+" 法中承擔提供強大算力的責任,以此來支持紛繁多樣的深度學習訓練、推理;框架則可以比作是操作系統,讓開發、訓練、推理、部署等工作的效率大幅提升。
多樣的模型和開發套件,則讓開發者如虎添翼,甚至可以把開發變得開箱即用那麼簡單;至于良好的應用,就可以讓深度學習技術與場景融合創新,加速傳統産業轉型升級,催生新業态新模式。
至于 "+" 法的最後一層維度,則是從産業角度出發所提出的" 深度學習 + 千行百業 "。
正所謂 " 實踐是檢驗真理的唯一标準 ",以交通領域裡的智能調度系統為例,便是 " 深度學習 + 交通 " 的一個實踐産物。
在這套系統的加持之下,現如今的北京、湖南的株洲、長沙,河北保定、重慶永川、廣州黃埔等城市,都在開始享受 " 綠燈自由 " 的暢快。
再如通過 " 深度學習 + 制造業 "、" 深度學習 + 服務業 "、" 深度學習 + 保險業 " 等精準的産業 "+" 法,更是讓千行百業真正地做到了深度學習所帶來的降本增效。
這便是 " 深度學習 +" 在做深入融合時所需聯結的三大維度。
但之所以說要聚焦這三大維度并非是空穴來風,實則從全球科技國際巨頭玩家的做法中也是有迹可循。
以 " 深度學習 + 知識 " 為例,如谷歌、Meta、微軟等,也正在遵循一條将深度學習技術和知識做融合的路徑,各自提出了更具通用性的大模型。
再到 "+ 上下遊生态夥伴 " 這層,在 TensorFlow、PyTorch 等框架的基礎之上,互聯網起家的科技公司們,不僅上探做應用,也在不斷往底層尋求硬件的适配,以構建全要素深度學習技術基礎設施的方式,讓深度學習技術的開發變得更加絲滑,也更加低門檻。
而後它們将這些技術輸送到了千行百業,造就了大火的 ChatGPT、基于 diffusion 模型的各種繪畫 AI 等。
如此情形,也就是王海峰所說:
深度學習平台的标準化、自動化和模塊化特征越來越顯著,不斷降低人工智能的應用門檻,高效便捷地把人工智能技術輸送給千行百業,規模化的 AI 大生産已然形成。
這也正是人工智能的技術創新和産業發展,進入 " 深度學習 +" 階段背後的原因了。
" 深度學習 +" 背後:百度已蓄勢十餘載
不難看出," 深度學習 +" 實際上是行業所向,技術所趨。但為什麼是百度,率先提出了這一觀點?
一方面,百度作為中國 AI 的頭号玩家,有着充足的技術積累:
自研深度學習框架平台和大模型貫通了硬件适配、模型訓練、推理部署,到場景應用的全産業鍊,已經為人工智能技術創新和産業增長夯實了智能化基座。
具體來說,基于多年以上的深度學習技術研究和産業時間,百度打造了集核心框架、産業級模型庫、開發套件、工具組件和服務平台于一體的飛槳深度學習平台。
目前,飛槳平台已經凝聚 535 萬開發者,服務 20 萬家企事業單位,創建了 67 萬個模型。
在此基礎之上,百度文心大模型不僅能解決 NLP、CV、語音等多模态問題,還能與産業知識深度結合,調優為行業大模型,進一步打通深度學習産業化的路徑。
另一方面,百度在技術上的前瞻性判斷,在某種程度上已經形成 " 傳統 ",并已被多次驗證。
比如,在深度學習領域,百度就是最早躬身入局的中國科技公司之一。
2012 年,在深度學習方興未艾之時,百度便已經開始着手探索深度學習技術,并于次年在全球首個成立專注深度學習研究的深度學習研究院(IDL)。
在框架與平台方面,2020 年,國内興起自研深度學習框架熱潮。但早在熱度爆發的 4 年前,即 2016 年,百度就對外開源了 PaddlePaddle(百度飛槳)。
根據 IDC 報告,截至 2021 年上半年,TensorFLow、PyTorch 以及百度飛槳成為國内最高頻使用的開源框架。
2017 年,國家發改委還正式批複,由百度牽頭籌建深度學習技術及應用國家工程實驗室。
這也是業内首個、目前唯一的深度學習領域國家工程實驗室(現在已經升級為國家工程研究中心)。
用 " 深度學習國家隊 " 來形容百度也并不為過。
值得一提的是,在技術上甘坐冷闆凳堅持投入的同時,百度還不斷嘗試着技術與産業更深度的結合。
這也為 " 深度學習 +" 階段到來之際,引領技術創新和産業增長奠定了豐富的産業實踐基礎。
比如,在交通領域,百度就幫助程度國鐵電氣設備有限公司,基于飛槳研發了一套 " 軌道在線智能巡檢系統 ",實現了對軌道巡檢圖片的實時檢測。
該系統可同時安裝到工程作業車和運營電客車上,能夠在不影響電客車正常行駛的情況下,全天候對軌道缺陷實施智能判斷,目前已在深圳地鐵的相關線路上試運行。
闆凳甘坐十年冷,也正是多年的技術蓄勢,使得百度在規模化的 AI 大生産時代,在 " 深度學習 +" 來臨之際,敢于率先做出判斷,并堅定不移地朝向這個方向,做技術創新、打通産業路徑的先鋒。
而從更深遠的影響來看,這種技術自立自強的底色,亦将成為我國經濟社會高質量增長的助力。
後續如何,且待時間檢驗。
— 完 —
點這裡關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~