如果您希望可以時常見面,歡迎标星收藏哦 ~
亞馬遜已達成協議,以 8000 萬美元現金收購芯片制造商和 AI 模型壓縮公司 Perceive ,後者是上市公司 Xperi 位于加州聖何塞的子公司。Perceive 是一家開發突破性神經網絡推理解決方案的公司,專注于在邊緣設備上提供大型人工智能模型的技術。
亞馬遜并未透露對這項技術的具體想法。亞馬遜發言人表示:" 我們很高興簽署了收購 Perceive 的協議,并引入其才華橫溢的團隊,加入我們的努力,爲能夠在邊緣運行的設備帶來大型語言模型和多模式體驗。"
Xperi 自今年初以來一直在爲 Perceive 尋找買家。交易完成後,Perceive 的 44 名員工中的大部分預計将加入亞馬遜。亞馬遜表示,預計該交易不需要監管部門批準,并稱這是一次常規收購。
Perceive 的芯片介紹
資料顯示,Perceive 由聯合首席執行官 Murali Dharan 和 Steve Teig 領導。該公司的員工遍布全球。該公司将在愛達荷州運營一個實驗室。Teig 在擔任 Xperi 首席技術官期間推動了 Perceive 的創建,他負責監督技術開發,包括核心音頻和成像創新,同時還領導公司的機器學習團隊。Dharan 之前負責 Xperi 授權業務的戰略方向、管理和增長,現在負責領導 Perceive 的業務運營,包括銷售、營銷、客戶成功和運營。
Perceive 提供在邊緣設備上服務大型 AI 模型的産品,窮旗艦産品是 Ergo AI 處理器,它可以在各種環境中運行數據中心級神經網絡,即使在電力受限的情況下。
據介紹,這是一款爲邊緣設備帶來突破性性能和能效的 AI 處理器。能夠以全幀速率運行大型神經網絡,并支持各種網絡架構和類型,包括标準 CNN、RNN、LSTM 等。Ergo 足夠靈活和強大,可以處理大量機器學習任務,從對象分類和檢測,到圖像分割和姿勢,再到音頻信号處理和語言。你甚至可以要求它執行多任務,因爲 Ergo 可以一次運行多個網絡。
盡管 Ergo 處理能力強大,但它不需要外部 DRAM,其 7 毫米 x 7 毫米的小封裝使其非常适合用于相機、筆記本電腦或 AR/VR 眼鏡等緊湊型設備。
Perceive 表示,Ergo 的能效是其他産品的 20 到 100 倍,僅需 9 mW 的計算能力即可對 30 fps 的視頻進行推理。這意味着您的設備可以提供無與倫比的電池壽命,并産生更少的熱量,從而實現更小、更多功能的封裝。
在 2023 年初,Perceive 推出了新款 Ergo 2 AI 處理器。據介紹,該芯片可提供更複雜用例所需的性能,包括需要變壓器模型、更大的神經網絡、同時運行的多個網絡和多模态輸入的用例,同時保持行業領先的功率效率。
Perceive 創始人兼首席執行官史蒂夫 · 泰格 ( Steve Teig ) 在闡述了最新 Ergo 芯片的市場機會的時候表示:" 借助新的 Ergo 2 處理器,我們擴展了爲設備制造商提供打造其最雄心勃勃的産品的途徑的能力,"" 這些産品包括用于語言或視覺處理的變換模型、更高幀速率的視頻處理,甚至在單個應用程序中組合多個大型神經網絡。"
Ergo 2 的運行速度比 Perceive 的第一代 Ergo 芯片快四倍,處理能力也遠超爲微型 ML 設計的典型芯片。現在,産品開發人員可以利用 YOLOv5、RoBERTa、GAN 和 U-Nets 等先進神經網絡快速提供準确結果。所有 Ergo 2 處理均在芯片上完成,無需外部存儲器,從而提高能效、隐私性和安全性。Ergo 2 芯片可實現:
運行 MobileNet V2 每秒進行 1,106 次推理
運行 ResNet-50 時每秒進行 979 次推理
運行 YoloV5-S 每秒進行 115 次推理
爲了提供運行這些大型網絡所需的性能增強,Ergo 2 芯片采用流水線架構和統一内存設計,從而提高了其靈活性和整體運行效率。因此,Ergo 2 可以支持更高分辨率的傳感器和更廣泛的應用,包括:
語言處理應用,例如語音轉文本和句子完成
音頻應用,例如聲學回聲消除和更豐富的音頻事件檢測
要求苛刻的視頻處理任務,例如視頻超分辨率和姿勢檢測。
Ergo 2 處理器尺寸爲 7 毫米 x 7 毫米,由 GlobalFoundries 使用 22FDX 平台制造,無需外部 DRAM 即可運行。其低功耗也意味着它不需要冷卻。該芯片可以同時運行多個異構網絡,爲用于安全、訪問控制、熱成像或零售視頻分析的企業級攝像機等設備提供智能視頻和音頻功能;适用于包括視覺檢查在内的工業用例;或集成到筆記本電腦、平闆電腦和高級可穿戴設備等消費産品中。
AWS 的自研芯片曆程
多年來, AWS 一直在爲 AI 工作負載和雲優化構建自己的内部定制矽片,這主要得益于公司在十多年前收購了 Annapurna Labs。這讓 AWS 在過去多年裏構建了自己的 Graviton 處理器、Inferentia 芯片和 Trainium 機器學習處理器,用于在雲端訓練 AI 模型。
今年,亞馬遜在推動人工智能 ( AI ) 技術發展方面邁出了重要一步。
在其年度 AWS re:Invent 大會上,AWS 發布了兩款新型定制芯片:AWS Trainium2 和 Graviton4。這兩款芯片代表了亞馬遜網絡服務 ( AWS ) 爲滿足日益增長的 AI 功能需求而做出的大膽努力,尤其是在市場面臨主要由 Nvidia 生産的高性能圖形處理單元 ( GPU ) 嚴重短缺的情況下。
對增強計算能力的需求源于生成式人工智能的日益普及,這需要強大的基礎設施來訓練和部署模型。據報道,Nvidia 的 GPU 直到 2024 年都已售罄,包括台積電首席執行官在内的業内消息人士預測,這種供應危機可能會持續到 2025 年。考慮到這一點,亞馬遜的新芯片旨在通過提供專門針對人工智能工作負載量身定制的替代方案來減輕對 Nvidia 的依賴。
Trainium2 芯片專爲訓練大規模 AI 模型而設計,性能比上一代芯片高出四倍,能效比上一代芯片高出兩倍。據亞馬遜稱,這款芯片在多達 10 萬個單元的雲集群中使用時,可處理 65 百億億次浮點運算。這一功能可将訓練複雜模型(例如具有數千億個參數的模型)的時間從數月縮短至數周。這些進步使 Trainium2 成爲 AI 訓練基礎設施領域的領跑者。
Trainium2 芯片因其潛力而受到認可,已經引起了多家行業參與者的興趣,其中包括專注于構建友好型 AI 模型的公司 Anthropic。聯合創始人 Tom Brown 強調,Trainium2 将使他們能夠快速擴展,處理速度比之前的模型提高四倍。AWS 與 Anthropic 等公司之間的合作表明,利用專有雲技術簡化 AI 操作的趨勢日益增長。
另一方面,Graviton4 芯片是亞馬遜迄今爲止最強大、最高效的處理器,專爲各種雲工作負載量身定制。與上一代 Graviton3 相比,這款第四代芯片的性能有望提高 30%,内核數量增加 50%,内存帶寬增加 75%。這些改進使用戶能夠降低運營成本并提高數據處理速度,使其成爲運行高性能數據庫和密集分析應用程序的企業的理想選擇。
Graviton4 的早期采用者包括 Datadog、Epic Games 和 SAP 等公司。例如,Epic 的首席雲工程師 Roman Visintine 就指出,該芯片在延遲敏感型工作負載方面表現出色,尤其有利于在線遊戲體驗。在競争激烈的環境中,快速的數據訪問和處理對于成功至關重要,這種雲服務優化趨勢至關重要。
亞馬遜的聲明也凸顯了科技行業更大的趨勢,即公司越來越多地投資定制芯片解決方案,以滿足特定的計算需求,尤其是人工智能和機器學習任務。通過開發專有硬件,亞馬遜希望脫穎而出,減少對 Nvidia 和 AMD 等老牌芯片制造商的依賴。
随着人工智能技術在各個領域(從醫療保健到娛樂)不斷發展和普及,對高效、高性能芯片的需求隻會越來越大。技術分析師預計,這些新的亞馬遜芯片的推出不僅将立即滿足當前的需求,還将爲未來的人工智能發展奠定基礎。
令人驚訝的是,這些芯片的推出正值戰略時刻,因爲微軟也宣布了自己針對人工智能和雲服務的芯片開發。這在人工智能硬件領域引發了激烈的競争,促使企業迅速創新和突破界限。
AWS Trainium2 和 Graviton4 芯片預計将在不久的将來向客戶提供,其中 Trainium2 将于明年某個時候推出,而 Graviton4 已處于預覽階段。随着科技行業繼續轉向雲計算和人工智能驅動的解決方案,亞馬遜有望在這場數字化轉型中發揮重要作用。
AI 芯片大有可爲
AWS 頻頻發力芯片,除了滿足公司業務需求以外,也再次證明了 AI 芯片大有可爲,這不但體現在雲端,還體現在端側。
根據 Futurum Intelligence 的數據,到 2023 年,Nvidia 将占據 AI GPU 市場 92% 的份額,并占據整個數據中心 AI 半導體市場 75% 的份額。在這個已經非常龐大的市場中,這種主導地位仍将繼續,預計到 2024 年市場規模将增長近一半。
該分析公司估計,數據中心人工智能應用的處理器和加速器的總市場價值将達到 563 億美元,與 2023 年的 377 億美元的年度市場價值相比增長 49.3%。市場分析師預測,未來五年,該市場的複合年增長率将達到 29.7%,使市場規模在 2026 年達到 984 億美元,在 2028 年達到 1383 億美元。
Futurum 将 AI 數據中心處理器市場分爲四類:CPU、GPU、專用加速器(稱爲 XPU)以及谷歌、AWS 和微軟等公司生産的專有雲加速器。
2023 年,CPU 占據 20.5% 的市場,GPU 占據 73.5% 的市場,XPU 和雲專有産品各占 3%。
1、2023 年,CPU 占數據中心 AI 處理的 20%,并将繼續發揮重要作用。Futurum 估計,它們的五年複合年增長率将達到 28%,從 2023 年的 77 億美元增長到 2028 年的 260 億美元。Futurum 估計,2023 年,Nvidia 的市場份額爲 37%,其次是英特爾,占 23%。
2、到 2023 年,GPU 占數據中心 AI 應用中使用的芯片組的 74%,并将經曆 30% 的五年複合年增長率,從 2023 年的 280 億美元增長到 2028 年的 1020 億美元。Futurum 估計 Nvidia 占據了 AI GPU 市場的 92% 份額。
3、XPU 将經曆 31% 的五年複合年增長率,從 2023 年的 10 億美元增長到 2028 年的 37 億美元。
4、公共雲 AI 加速器将經曆 35% 的五年複合年增長率,從 2023 年的 13 億美元增長到 2028 年的 60 億美元。
如果 AI 處理器和加速器不能在數據中心供公衆使用,Futurum 會将其排除在本研究之外,因此不包括爲 Meta、特斯拉和蘋果設計并使用的 AI 芯片組。
從地域上看,北美占據市場主導地位,到 2023 年将占據 55% 的市場份額。歐洲、中東和非洲 ( EMEA ) 和亞太地區 ( APAC ) 緊随其後,成爲重要市場,而拉丁美洲 ( LATAM ) 則代表具有巨大增長潛力的發展中地區。
視覺和音頻分析是 2023 年最大的用例。Futurum 預測 2028 年的前三大用例将是視覺和音頻分析、模拟和建模以及文本生成、分析和摘要。
具體到邊緣 AI 方面,據 Omdia 的新研究預測,到 2028 年,邊緣 AI 處理器市場将創造 602 億美元的收入,複合年增長率爲 11%。
Omdia 最新的邊緣處理器預測指出,随着各行各業和設備采用人工智能,對硬件的需求增加推動了收入的增長。推動市場增長的領域之一是個人電腦領域,英特爾、AMD 和蘋果等主要供應商的産品供應量不斷增加。據報道,PC 供應商正試圖将其設備中加入 AI 處理器作爲 " 獨特的賣點 " 進行營銷。
除個人電腦領域外,該報告還強調了人工智能處理器在汽車、無人機、安全攝像頭和機器人等領域的快速應用。
由此我們可以看到 AWS 收購背後的用心。