過去一年來,消費電子領域最火爆的關鍵詞,就是端側 AI。
大模型,具有強大的理解、生成能力;終端設備,是人與 AI 的首選交互入口。二者碰撞之下,讓端側成爲大模型落地的最佳途徑,甚至沒有之一。越來越多的手機、PC、汽車等消費電子終端廠商,将 AI 技術應用到自己的産品和服務中,而端側 AI 的繁榮景象離不開一個核心支撐點——計算平台(芯片)。
端側算力,從芯而來。所以高性能芯片,是端側 AI 持續繁榮的源頭力量,也是高通希望借助技術創新、生态合作所推動的方向。
前不久恰逢骁龍峰會舉辦,我們看到高通公司繼續強化終端側 AI 産品布局和對國内大模型的支持。不僅宣布了與智譜、騰訊混元等大模型廠商的合作,共同推動端側 AI 模型部署和落地。此外,還推出了面向 AI 手機的骁龍 8 至尊版移動平台和面向智能汽車的骁龍至尊版汽車平台。
高通公司總裁兼 CEO 安蒙表示,AI,尤其是生成式 AI,是移動計算領域最大的變革之一;高通關注生成式 AI,尤其關注 AI 如何改變計算體驗,邊緣側将如何發展,及其如何帶來颠覆性的創新周期,緻力于将 AI 爲先的體驗帶入每一個計算空間。
端側 AI 的時代風口,源于高通爲代表的移動計算,與 AI 深深地擁抱。我們不妨就從高通打造 AI 爲先的體驗這一方向入手,去尋找端側 AI 向前一步的源頭力量。
2024 年伊始,PC、手機、汽車等消費電子品類都開始積極與大模型相結合,打造全新的 AI XX 硬件,端側 AI 由此進入集中爆發階段。
可以說,大模型打開了一個消費電子領域的全新風口,而深入風眼中心,我們會看到一支推動端側 AI 醞釀并成熟的關鍵力量——移動計算。
端側 AI 之于雲側 AI 的不可替代性,是大模型在本地進行計算,避免數據上雲,解決用戶數據和隐私安全的顧慮;實時性更強,遊戲、攝影、AIGC 等應用在端側處理的時延更低、反饋更快、體驗更好。
進入 2024,OpenAI、智譜、騰訊混元等第一梯隊的模型廠商都認識到了大模型落地端側的價值與桎梏,紛紛推出更小規模、更高性能的模型版本。雖然大模型在積極小型化,但受到端側計算能力、内存空間等限制,模型的減配、壓縮也會折損标準通用基礎大模型的性能表現。
大模型的端側部署,十分依賴于端側計算平台提供強大性能,支撐超大規模的數據運算量,并在性能與功耗之間實現平衡。
讓大模型更好地适配端側,成了移動計算領域的首要任務,高通正在積極地解決中。
在前不久的骁龍峰會上,高通宣布和智譜、騰訊混元合作,共同推動端側 AI 模型部署和落地。我們能從高通的全新動作中,看到移動計算 + 大模型的三個變化:
變化一:更豐富的端側 AI 能力。骁龍 8 至尊版的 NPU 性能比上一代提升了 45%,強大的性能可以同時運行多個 AI 工作負載,這意味着更多基于大模型的 AI 應用能夠在端側部署。
變化二:更優質的端側智慧體驗。高通爲骁龍 8 至尊版配備目前最高速的 LPDDR5x 内存,解決了内存顧慮。目前,騰訊混元正通過和高通合作,推動 7B 和 3B 的混元大模型在終端部署。
變化三:更健壯的端側 AI 生态。AI 開發者是端側 AI 持續繁榮不可或缺的角色,高通爲開發者準備了基于自身硬件的高效開發工具,包括高通 AI 軟件棧(AI Stack)和 AI Hub,與騰訊混元和智譜 AI 達成合作,幫助模型廠商在高通硬件上更好地釋放平台算力,支持 AI 開發者輕松地将 AI 模型集成到應用程序中。
根據骁龍峰會高通公布的數據,充分利用骁龍 8 至尊版的強大終端側 AI 性能和高通 AI 軟件棧爲模型帶來的性能優化,智譜 GLM-4V 端側視覺大模型能夠以超過 70 tokens/ 秒的速度在終端側高速運行。大模型的端側性能表現優化,不僅會降低開發者的使用成本,提升開發者的産品效果,也有助于基礎通用大模型的商業化。
大模型,是端側 AI 這一時代風口的起點;移動計算,則從更多應用、更優體驗、更強生态等方面,爲大模型在端側提供動力保障。
高通對大模型的有力支撐,從源頭支持端側 AI 的産業繁榮,正是推動 AI 爲先體驗的體現之一。
大模型要在終端設備上被用戶用起來,才能從一種技術趨勢,轉變爲端側 AI 的産業繁榮與商業價值。AI 大模型入端,硬件性能是基礎。
我們采訪過一位 AI 手機品牌的負責人就表示:AI 在手機行業剛剛開始,未來的一年,AI 體驗會超出你的想象,而端側模型對性能要求很高,所以性能永遠不會過剩。
性能從哪裏來?答案就是計算平台。針對目前端側 AI 集中的兩大品類:一個是個人移動終端,比如 AI 手機、AI PC;另一個是智能網聯汽車,智能座艙、輔助駕駛、自動駕駛等 AI 應用都在加速上車。高通在前不久的骁龍峰會上帶來了兩大平台的最新技術和産品。
移動平台方面:
骁龍 8 至尊版芯片,憑借技術方面的性能突破和創新能力,帶來了 AI 手機智能化的重大飛躍。
骁龍 8 至尊版在終端側生成式 AI、多模态處理和影像處理等方面的突破,可以爲 AI 手機的大量 AI 用例提供支持。比如 AI-ISP 技術的革命性突破,與 NPU 緊密結合,使得高分辨率影像數據的實時處理成爲可能,手機廠商可以在攝影功能中引入更多 AI 應用,如自動場景識别、實時美顔和自動對焦等,這是當下年輕消費群體格外看重的産品力之一。
此外,骁龍平台還積極支持 PC 領域的 AI 應用。
在剛剛舉辦的 2024 年世界互聯網大會上,高通憑借其專爲 Windows 11 AI+ PC 設計的骁龍 X Elite 平台榮獲 " 世界互聯網大會領先科技獎 "。骁龍 X Elite 的核心優勢之一是采用了定制化的 Oryon CPU,具備極緻快速的響應速度,可以爲 AI PC 提供強勁的性能表現。比如榮耀最新推出的 AI PC,就在骁龍 X Elite 的算力支持下,實現了 AI 紀要、AI 雙向降噪等 AI 功能,極大地提升了用戶的會議和溝通效率。目前,骁龍 X 系列已支持 58 款已發布或正在開發中的 PC 産品,有力支撐了 AI PC 這一新品類的成長。
汽車平台方面:
汽車智能化成爲大勢所趨,其中智能座艙、智能駕駛,成爲車企的核心賽點。爲智能汽車提供底層源動力,高通分别推出了全新的骁龍座艙至尊版平台和 Snapdragon Ride 至尊版平台。
其中,骁龍座艙至尊版平台也采用了專爲汽車打造的高通自研 Oryon CPU,性能大幅提升,可以助力車企實現大模型和 AIGC 等能力與座艙相結合,打造 AI 語音助手、AIGC 應用、複雜情境感知、自然語言交互等新體驗。
Snapdragon Ride 至尊版平台也基于高通最先進的 NPU 及 Oryon CPU,将更好的智能駕駛帶到汽車上,實現了高精度定位、環境感知、決策規劃以及車輛控制等一系列智能駕駛功能。
此外值得一提的是,增強 AI 手機、AI PC、智能汽車的産品力,更強大的移動計算硬件隻是必要條件。除此之外,廠商和開發者還需要一系列開發工作來釋放硬件性能、優化端側 AI 表現。
目前,手機、PC、汽車等采用的骁龍硬件平台,均已集成高通自研 Oryon CPU,加之高通 AI 軟件棧的賦能,有望實現終端側 AI 應用在各平台高效開發。
硬件(移動平台、PC 平台和汽車平台)與軟件(AI Stack、AI Hub)相協同,高通正在拆除端側 AI 的性能桎梏,帶動手機、汽車等各類消費電子産品加速進化,抓住大模型的技術紅利。
總結一下,大模型是這一輪端側 AI 浪潮的起點,計算硬件是 AI 終端這一新概念得以落地的性能源泉。支撐大模型和 AI 終端的持續發展,高通也在源頭爲端側 AI 繁榮貢獻了力量。
之所以要在今天找尋端側 AI 發展的源頭力量,是因爲這與國内消費電子廠商抓緊時代機遇和技術趨勢的需求一緻,與源頭緊密合作、齊頭并進,有利于獲取向未來生長的動能。
目前來看,高通就是與國内廠商合作緊密的重要 AI 力量之一。
一方面,高通和骁龍平台是國内安卓手機廠商全球化、高端化的助力。國内頭部品牌正在高端市場與蘋果展開正面競争。高通和骁龍與國内廠商的緊密合作,成爲國内智能手機品牌在全球的競争力保障,可以讓領先的 AI 應用、AI 手機、AI PC 硬件,爲全球樹立标杆。目前,首批搭載骁龍 8 至尊版的旗艦手機,如小米、榮耀、iQOO 等,已經在性價比、影像能力、遊戲性能等方面,建立了鮮明的市場認知度。
此外,新能源汽車增長也有望更進一步。
目前,國内新能源汽車已經在全球市場建立了較強的競争力,抓住智能化機遇,獲得更大的發展,可以進一步夯實優勢地位。骁龍汽車平台就相當于基石,支撐基于大模型的智能駕駛、智能座艙上車,讓新能源汽車保持競争優勢,在全球市場走得更穩更遠。
對于端側 AI 來說,大模型就是新一代的操作系統,而用好這一新型操作系統,需要生态、工具、資源的充分支持。通過骁龍的軟硬件生态體系,高通可以爲端側 AI 的發展提供生态助力,幫助更多開發者用好大模型技術,促進 AI 産品與應用程序的整體繁榮。
總結一下,終端消費電子的市場廣闊,智能化升級才剛剛開始。AI 将席卷我們熟悉的各個終端品類,站在時代風口,高通和骁龍作爲源頭動力的身影,也漸漸明晰起來。
高通和骁龍與 AI 的緊密擁抱,帶來的是移動計算與端側 AI 的長相厮守。狂奔一年的端側 AI 故事,會繼續講述下去。