1111111
2022年1月4日,海内外9位院士及12位專家在Science《科學》合作期刊Intelligent Computing發表長篇綜述論文《智能計算的最新進展、挑戰和未來》。文章全面闡述了智能計算的理論基礎、智能與計算的技術融合、重要應用、重大挑戰和未來前景,将為學術界和工業界的相關研究人員提供全方位的參考和對智能計算領域的指引性見解。
論文地址:https://spj.science.org/doi/10.34133/icomputing.0006
簡介
人類社會正從信息社會進入智能社會,計算已成為推動社會發展的關鍵要素。在萬物互聯的數字文明新時代,傳統的基于數據的計算已經遠遠不能滿足人類對更高智能水平的追求。
近年來,計算和信息技術飛速發展,深度學習的空前普及和成功将人工智能(AI)确立為人類探索機器智能的前沿領域。自此産生了一系列突破性的研究成果,包括Yann LeCun提出的卷積神經網絡和Yoshua Bengio在深度學習因果推理領域的成果。
2016年3月,DeepMind推出的AI圍棋程序AlphaGo與世界頂尖圍棋高手李世石對戰,在世界範圍内引起了前所未有的關注。這場劃時代的人機大戰以AI的壓倒性勝利而告終,成為将AI浪潮推向全新高度的催化劑。
AI的另一個重要推動者是大型預訓練模型的出現,這些模型已經開始廣泛應用于自然語言和圖像處理,以在遷移學習的幫助下處理各種各樣的應用。其中最具代表性的是自然語言處理模型GPT-3,已經證明具有高度結構複雜性和大量參數的大模型可以提高深度學習的性能。
計算能力是支撐智能計算的重要因素之一。面對信息社會中龐大的數據源、異構的硬件配置和不斷變化的計算需求,智能計算主要通過垂直和水平架構來滿足智能任務的計算能力要求。
垂直架構的特點是同質化的計算基礎設施,主要通過應用智能方法提高資源利用效率來提升計算能力。
相比之下,水平架構對異構和廣域計算資源進行協調和調度,使協作計算的效果最大化。例如,2020年4月,針對全球COVID-19研究的計算需求,Folding@home在三周内聯合40萬名計算志願者,實現了2.5Exaflops的計算量,超過了世界上任何一台超級計算機。
盡管在智能和計算方面取得了巨大成功,但我們在這兩個領域仍然面臨着一些重大挑戰:
智能方面的挑戰。
使用深度學習的AI目前在可解釋性、通用性、可進化性和自主性方面面臨着重大挑戰。與人類智能相比,當前大多數AI技術的作用都很弱,而且隻能在特定領域或任務中發揮良好作用。從基于數據的智能升級到更多樣化的智能,包括感知智能、認知智能、自主智能和人機融合智能等,也面臨着重大的理論和技術挑戰。
計算方面的挑戰。
數字化浪潮帶來了應用、連接、終端、用戶以及數據量前所未有的增長,所有這些都需要巨大的計算能力。滿足如此快速增長的計算能力需求變得越來越具有挑戰性。智能社會中的巨型任務依賴于各種特定計算資源的高效組合。此外,傳統的硬件模式不能很好地适應智能算法,制約了軟件的發展。
迄今為止,智能計算還沒有一個被普遍接受的定義。考慮到世界的三個基本空間,即人類社會空間、物理空間和信息空間日益緊密融合,我們從解決複雜的科學和社會問題的角度提出了智能計算的新定義:
智能計算是支撐萬物互聯的數字文明時代新的計算理論方法、架構體系和技術能力的總稱。智能計算根據具體的實際需求,以最小的代價完成計算任務,匹配足夠的計算能力,調用最好的算法,獲得最優的結果。
智能計算的新定義是為響應人類社會、物理世界和信息空間三元融合快速增長的計算需求而提出的。智能計算以人為本,追求高計算能力、高能效、智能和安全。其目标是提供通用、高效、安全、自主、可靠、透明的計算服務,以支持大規模、複雜的計算任務。圖1為智能計算的整體理論框架,它體現了支持人類社會—物理世界—信息空間集成的多種計算範式。
△圖1:基于人類社會空間、物理空間和信息空間融合的智能計算總覽
智能計算基礎
智能計算是數字文明時代支撐萬物互聯的新型計算理論方法、架構體系和技術能力的總稱。利用智能計算可以實現許多經典和前沿研究領域的創新,以解決複雜的科學和社會問題。智能計算的基本要素包括人的智能、機器的能力以及由萬物組成的物理世界。
在理論框架中,人是智能計算的核心和智慧的源泉,代表着原始的、與生俱來的智能,稱為元智能。
元智能包括理解、表達、抽象、推理、創造和反思等人類高級能力,其中包含人類積累的知識。元智能以碳基生命為載體,是由個體和生物群體經過百萬年的進化産生的,它包括生物具身智能、腦智能(尤其是人腦)和群體智能。所有的智能系統都是由人類設計和建造的。
因此,在智能計算的理論體系中,人類的智慧是智能的源泉,計算機是人類智能的賦能。我們稱計算機的智能為通用智能。
通用智能代表計算機解決具有廣泛外延的複雜問題的能力,以矽基設施為載體,由個體和群體計算設備産生。生物智能可以在以下四個層次上移植到計算機上:數據智能、感知智能、認知智能和自主智能。元智能和通用智能如圖2所示。
△圖2:元智能和通用智能
智能計算面臨大場景、大數據、大問題、泛在需求的挑戰。算法模型變得越來越複雜,需要超級計算能力來支持越來越大的模型訓練。目前,計算資源已經成為提高計算機智能研究水平的障礙。随着智能算法的發展,擁有豐富計算資源的機構可能形成系統的技術壟斷。經典的超級計算機已經難以滿足AI對計算能力的需求。
雖然通過算法優化可以在一定程度上降低算力需求,但并不能從根本上解決這個問題。需要從架構、加速模塊、集成模式、軟件棧等多個維度進行全面優化,如圖3所示。
△圖3:智能計算的計算能力
智能計算在理論技術上具有以下特點(圖4):理論技術上的自學習和可進化性,架構上的高計算能力和高能效,系統方法上的安全性和可靠性,運行機制上的自動化和精确性,以及服務性上的協作和泛在性。智能計算包括兩個本質方面:智能和計算,兩者相輔相成。
智能促進了計算技術的發展,計算是智能的基礎。提高計算系統性能和效率的高級智能技術範式是"智能驅動的計算"。支持計算機智能發展的高效、強大的計算技術範式是"面向智能的計算"。
兩種基本範式從五個方面進行創新,提升計算能力、能源效率、數據使用、知識表達和算法能力,實現泛在、透明、可靠、實時、自動化的服務。
△圖4:智能計算的特征
智能驅動的計算
提高計算的普适性對智能計算至關重要。現實場景中的問題,例如模拟、圖(gragh)(圖5)等,需要進行各種計算。智能計算的另一個關鍵點是如何提高計算的智能化水平。從經驗上來說,我們常常需要向自然界的智能生物學習,計算也不例外,例如三大經典智能方法:人工神經網絡(圖6)、模糊系統和進化計算,都是受生物智能啟發提出的算法。智能計算理論包括但不限于以上幾種計算,以實現高度的泛在化和智能化。
△圖5:圖計算的技術架構
△圖6:典型神經元的結構和人工神經元的結構
智能系統在開始工作之前,首先要進行智能感知。因此,感知智能在所有智能系統中都起着至關重要的作用。感知智能的重點是多模态感知、數據融合、智能信号提取和處理。
典型的例子包括智慧城市管理、自動潛水系統、智能防禦系統和自主機器人。感知智能研究中最熱門的領域是模拟人類的五種感覺能力,視覺、聽覺、嗅覺、味覺和觸覺。
此外,智能傳感還包括溫度、壓力、濕度、高度、速度、重力等,需要大量的計算或數據訓練來提高其性能。
近年來,随着模式識别和深度學習技術的全面應用,機器的感知智能已經超過人類,在語音、視覺和觸覺識别方面取得了重大進展。由于其日益增長的重要性和日益拓寬的應用領域,智能傳感器受到了廣泛關注。如圖7所示,智能傳感器具有各種形式以滿足不同應用的需求,并且更新更好的型号正在被不斷的開發出來。
△圖7:工業中需要連接到物聯網的的各種傳感器類型
認知智能是指機器具有像人一樣的邏輯理解和認知能力,特别是思考、理解、總結和主動應用知識的能力。它描述了智能體在真實環境中處理複雜事實和情況的能力。
數據識别是感知智能的核心功能,需要對圖像、視頻、聲音等各類數據進行大規模的數據采集和特征提取,完成結構化處理。相比之下,認知智能需要理解數據元素之間的關系,分析結構化數據中的邏輯,并根據提煉出的知識做出響應。
認知智能計算主要研究機器的自然語言處理、因果推理和知識推理(圖8)等領域。通過對人腦的神經生物學過程和認知機制的啟發式研究,可以提高機器的認知水平,以使其獲得幫助、理解、決策、洞察和發現的能力。
△圖8:知識推理概述
驅動機器從被動輸出到主動創造有兩個關鍵要素:強泛化模型和與外部環境的持續交互。自主智能的發展路徑從學習單一任務開始,舉一反三,逐步達到與環境動态交互的主動學習,最終實現自我進化的高級智能。當前可以通過遷移學習、元學習和自主學習等技術尋找生成自主智能的可行路徑。
盡管在智能的四個層面上(數據智能,感知智能,認知智能,自主智能)取得了重大進展,但目前僅通過計算/統計模型還難以從極其複雜的場景中實現完全的智能。
在這些場景中,人類應該繼續在解決問題和決策中發揮不可或缺的作用,來探索人類認知過程中涉及的要素,并将其與機器智能相結合。下一步,将聚焦于人機交互、人機融合和腦機接口等技術。
面向智能的計算
AI的發現不斷湧現,這在很大程度上歸功于不斷增長的計算能力。AI的快速變化是由新思想或革命性理論推動的。通常,最新的先進模型僅依賴于更大的神經網絡和更強大的處理系統。
Open AI研究人員在2018年進行了一項研究,追蹤基于計算能力的最大模型的增長情況。利用AI研究史上訓練的一些最著名的AI模型所需的計算量,他們發現了計算資源快速增長的兩個趨勢。
開發突破性模型所需的計算能力的增長速度與摩爾定律大緻相同,即在2012年之前,單個微芯片的計算能力往往每兩年翻一番。但圖像識别系統AlexNet在2012年發布時引起了人們的新興趣。AlexNet的引入刺激了頂級模型的計算需求急劇增加,從2012年到2018年,這種需求每3到4個月翻一番,如圖9所示。
△圖9:過去十年計算能力需求的增長大大超過宏觀趨勢
當摩爾定律失效時,超大算力主要依賴于海量計算、内存和存儲資源的并行疊加。
例如,"高性能計算"是指将大量計算機快速聯網成一個"集群"以進行密集計算的做法,使用戶能夠比傳統計算機更快地處理大量數據,從而獲得更深入的洞察力和競争優勢。
此外,得益于雲計算(圖10),用戶現在可以選擇增加其高性能計算程序的容量,從而繼續提高算力。
△圖10:雲、霧和邊緣計算的表示
推進智能計算架構創新的目标包括更高效的能源管理、更低的功耗、更便宜的總芯片成本以及更快速的錯誤檢測和糾正。當涉及某些無法在CPU上執行的AI操作時,AI加速器可能會大大減少訓練和執行時間。
在短期内,所使用加速器的架構專業化将是保持計算能力增長的最佳方式,如圖11所示為已公開發布的AI加速器和處理器的峰值性能與功耗。
另外,内存計算(圖12)是一個非常有效的方案,它能夠使内存單元執行原始邏輯操作,因此它們可以在不需要與處理器交互的情況下進行計算,這是内存和處理器之間不斷擴大速度差距的主要原因。
△圖11:公開發布的 AI 加速器和處理器的峰值性能與功耗散點圖
△圖12:計算的三種概念方法:(a)傳統數字計算,(b)近内存陣列計算(NMAC)和(c)内存陣列計算(IMAC)
複雜性是傳統計算機進一步突破的瓶頸。當今高度複雜的AI模型(例如深度神經網絡)在邊緣設備中仍然難以實現普遍使用。這是由于運行這些模型的高級GPU和加速器存在功率和帶寬緊縮的缺陷,導緻處理時間長并且架構設計繁瑣。
由于這些問題,研究人員開始創造新的計算模式,主要包括:
量子計算(圖13),因為其具有糾纏或其他非經典相關性帶來的量子優勢,可以在許多複雜的計算問題中實現指數速度;
神經形态計算(圖14)的構造和操作受到大腦中神經元和突觸的啟發,因其能源效率高而非常适合計算,神經形态計算是事件驅動和高度并行化的,這意味着隻有小部分系統同時工作,所以消耗的功率非常小;
光子計算(圖15)與電神經網絡相比具有許多優勢,包括超高帶寬、快速計算速度和高并行性,所有這些都是通過使用光子硬件加速來計算複雜的矩陣向量乘法來實現的;
生物計算(圖16)是利用生物系統固有的信息處理機制發展起來的一種新的計算模型,主要包括蛋白質計算機、RNA計算機和DNA計算機,具有并行和分布式計算能力強、功耗低的優勢。
△圖13:顯示複雜性等級之間關系的圖表(a)以及用于識别和評估可能的量子優勢的流程圖(b)
△圖14:傳統計算系統和類腦計算系統的結構
△圖15:深度神經網絡,包括傳統網絡和電子光子網絡
△圖16:生物計算可能提供優于傳統計算機的性能
智能計算的應用
如果要跟上當前科學的快速發展,就必須不斷的進行革新。現在正在進行的計算機革命的融合将以前所未有的方式極大地推動科學發現的進步。
幾十年來,計算材料(圖17)已成為研究材料特性和設計新材料的有力手段。然而,由于材料和材料行為的複雜性,它們的應用面臨許多挑戰,包括缺乏許多原子、離子以及原子和離子相互作用的力場和電位,分子動力學模拟中的不同熱力學相,以及優化材料成分和工藝參數的巨大搜索空間。作為一種新的研究範式,AI集成到計算材料中是對傳統計算材料的革命,并且已經在多長度、多時間尺度、多物理場耦合計算方面取得了巨大成功。
△圖17:材料/分子科學範式的比較
作為最古老的觀測科學之一,天文學在曆史上收集了大量數據。由于望遠鏡技術的突破,收集到的數據爆炸性增長。天文學和天體物理學領域的特點是擁有豐富的數據和各種大口徑的地面望遠鏡,例如即将推出的大型巡天望遠鏡和天基望遠鏡。使用高分辨率相機和相關工具,數據收集現在更加高效,并且在很大程度上實現了自動化,必須進行更高效的數據分析。因此,需要智能計算技術來解釋和評估數據集。
藥物設計同樣受益于AI(圖18),AI可以幫助科學家建立蛋白質的3D結構、模拟藥物和蛋白質之間的化學反應以及預測藥物的功效。在藥理學中,AI可以用于創建靶向化合物和多靶點藥物。利用AI還可以設計合成路線、預測反應産率并了解化學合成背後的機制。AI讓重新利用現有藥物來治療新的治療目标變得更加容易。此外,AI對于識别不良反應、測定生物活性和獲得藥物篩選結果至關重要。
△圖18:不同的基于深度學習的藥物-靶點相互作用預測算法對應不同的輸入特征。(a)基于配體的方法,(b)基于結構的方法,和(c)基于關系的方法
随着大數據和AI技術使用的增長,作物育種開始進行融合與突破(圖19)。AI技術可以支持服務的創建、模型的識别以及農業食品應用和供應鍊階段的決策過程。AI在農業中的主要目标是準确預測結果并提高産量,同時最大限度地減少資源使用。因此,AI工具提供的算法可以評估産量,預測難以預見的問題或事件以及發生趨勢。從種植到收獲再到銷售,AI促進了整個農業價值鍊。
△圖19:大數據與AI在植物育種中的結合
智能計算加速轉型變革,導緻經濟和社會秩序的轉變。由于技術進步,商品和勞動力市場正在發生巨大變化,數字社會正在逐漸形成(圖20)。AI應該成為數字經濟中每一個數據驅動戰略的核心,包括工業4.0。例如,人工智能可以應用于預測性維護。預測性維護包括涉及通用設備或生産機械的維護,并使用來自生産線或運營線的傳感器數據幫助降低運營費用或停機時間。
另外。AI可以應用于城市治理,通過開發新的策略和方法,使城市更智能。智慧城市治理旨在利用最先進的信息技術同步數據、程序、權限等,造福城市居民,主要包含四個方面:
智慧決策、智慧城市治理、智慧行政和智慧城市合作。
△圖20:數字社會的組成部分
展望
從新興産業生态的角度來看,智能計算産業仍面臨着一系列挑戰,決定着其未來發展。
第一,與傳統計算理論相比,智能計算是語言和生物學驅動的計算範式的應用和發展。
這意味着機器可以根據不同的場景模仿人腦解決問題和決策的能力。然而,矽基和碳基運算的底層邏輯存在根本差異,大腦智能的機制仍有待進一步探索。智能計算的下一步是通過深入探索類人智能的基本要素,其在宏觀層面的相互作用機制以及在微觀層面上支持不确定性生成的計算理論,進行徹底的改革。
第二,探索人類如何學習并将其應用到AI的研究中具有重要意義。
知識驅動的機器智能可以從人類活動中學習,模仿人腦的決策能力,使機器能夠像人一樣感知、識别、思考、學習和協作。需要探索多知識驅動的知識推理和持續學習的理論和關鍵技術,使智能系統具有類人的學習、感知、表示和決策能力,促進智能計算從數據驅動向知識驅動演進。
第三,軟硬件适配面臨着巨大的挑戰,如精度損失、調用困難、協作效率低下等。
未來,計算機必須突破馮·諾依曼體系結構下固定的輸入和處理範式,大力發展交叉學科的智能計算和仿生學。在算法層面進行設計,突破現有架構的局限,以更低的計算和硬件設計成本嘗試更靈活、更人性化的數據處理方式。此外,開發高性能、低能耗的新型組件設計方案,提高軟件和硬件的計算能力和效率,以滿足快速增長的需求和智能計算應用也很重要。
第四,智能計算的理論技術架構是一個複雜的系統,具有多個與其他學科相互作用的子系統。
系統中的各種硬件需要更複雜的系統設計,更好的優化技術,以及系統調優的更大成本。高維計算理論複雜性的缺乏是大規模計算系統面臨的主要挑戰。
結論
當前,我們正迎來人類發展的第四次浪潮,正處于從信息社會向人類社會-物理世界-信息空間融合的智能社會的關鍵轉型期。在這種轉變中,計算技術正在經曆變革,甚至是颠覆性的變化。
智能計算被認為是未來計算的發展方向,不僅是面向智能的計算,而且是智能賦能的計算。它将提供通用、高效、安全、自主、可靠和透明的計算服務,以支持當今智能社會中大規模和複雜的計算任務。
本文全面回顧了智能計算的理論基礎、智能與計算的技術融合、重要應用、挑戰和未來方向。
我們希望這篇綜述能為研究人員和從業者提供一個很好的參考,并促進未來智能計算領域的理論和技術創新。
關于Intelligent Computing
Intelligent Computing是由之江實驗室和美國科學促進會(AAAS)共同創辦,是《科學》合作期刊框架中智能計算領域的第一本開放獲取(Open Access)國際期刊。之江實驗室主任朱世強教授和中國工程院院士、中國科學院計算技術研究所學術所長孫凝晖教授共同擔任期刊主編。期刊以"面向智能的計算、智能驅動的計算"以及"智能、數據與計算驅動的科學發現"為主題,主要刊載原創研究論文、綜述論文和觀點論文。
投稿: www.editorialmanager.com/icomputing
官網: https://spj.science.org/journal/icomputing
*本文系量子位獲授權刊載,觀點僅為作者所有。
— 完 —
量子位 QbitAI
վ'ᴗ' ի 追蹤AI技術和産品新動态
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~