12 月初,亞馬遜雲科技一年一度的 re:Invent 大會在美國拉斯維加斯大會召開,來自世界各地的超 6 萬名參會者,他們脖子上佩戴着不同顔色的牌子,穿梭于各個會場之間。
re:Invent 大會一直就以務實著稱,但這一屆發布的産品之多,連很多連續參會的資深專家都感覺到信息過載——僅僅在三天時間裏,亞馬遜雲科技 CEO Matt Garman 與高級副總裁 Peter DeSantis、AI 和數據副總裁 Swami 博士就發布了超過 30+ 新品,涵蓋推理芯片、AI 服務器、大語言模型、生成式 AI 開發工具等等。
在親身感受這些密集的産品發布過程,可以清晰地提煉出亞馬遜雲科技開會和演講的套路,那就是——在服務客戶過程中我們發現了 XX 問題,于是我們就推出了 XX 工具,非常簡單直給。
作爲亞馬遜雲科技最早、也是應用最深入的客戶,亞馬遜 CEO Andy Jassy 時隔多年再次亮相 re:Invent,這次他不僅一口氣發布了 6 款 Amazon Nova 模型(包括 4 款基礎模型,1 款圖像生成模型和 1 款視頻生成模型),更是作爲亞馬遜雲科技最早、也是應用最深入的客戶(據他透露,亞馬遜内部已構建或正在構建近 1000 個生成式 AI 應用程序),他分享的關于亞馬遜應用 AI 的三個核心問題——選擇、成本和需求,完全可以作爲理解本次大會的基本邏輯。搞懂了這三個問題,再看這 30 多個産品發布的背後思路就很清晰了。
更自由的選擇
" 當你嘗試構建某些東西或者做決策時,常常需要在 A 和 B 之間做選擇嗎?這種選擇其實限制了你的思路。在亞馬遜雲科技,我們不這麽思考問題。" 亞馬遜雲科技一年一度的 re:Invent 大會上,亞馬遜雲科技 CEO Matt Garman 在主題演講時,這樣表達了對技術應用的理解。
Matt 認爲," 做選擇 " 實際上制造了虛假邊界," 讓你馬上開始想自己必須選 A 或者選 B,但我們推動團隊去思考如何同時達成 A 和 B,就可以讓大家換一種方式思考 "。
在 Matt 眼中,開發者與客戶永遠有選擇最優産品的權利。這是亞馬遜雲科技成立時秉承的理念,無論是一兩百款 EC2,還是上百款數據庫——亞馬遜雲科技一直都認爲,客戶的需求大于一切,那麽需求的多樣性就決定了選項的多樣性。
亞馬遜雲科技願景文件撰寫于 2003 年。彼時,衆多科技公司紛紛構建捆綁式的解決方案,試圖大包大攬。最終形成的是龐大而單一的解決方案,雖功能全面卻僅達合格水準。但合格不應是追求的終點,人們真正渴望的是最優組件。若能将所有頂尖元素整合一體,那才堪稱完美。" 基于此念,亞馬遜雲科技應運而生。"Matt 說。過去 18 年,靈活的技術構建模塊,也成爲亞馬遜雲科技服務逐漸向上的執念。
這一理念也表現在時下熱議的大模型服務上。" 在亞馬遜内部構建項目中所使用模型的多樣性令人驚訝。給予了開發者自主選擇的權利,原本以爲大家都會選用 Anthropic 的 Claude 模型,畢竟過去一年多它在全球屬于性能頂尖的模型,确實有很多内部開發者在使用 Claude 模型,但他們也會采用 Llama 模型、Mistral 模型,甚至會使用自行研發的模型。"Andy Jassy 演講時談及亞馬遜落地生成式 AI 的經驗," 因爲一直都在汲取同一個教訓,那就是永遠不會出現一種工具能在某個領域一統天下的情況。就像數據庫領域,探讨了 10 年,大家會使用各種各樣的關系型數據庫或者非關系型數據庫;就像大數據領域讨論了很久是不是 TensorFlow 會一統天下,結果 PyTorch 更受歡迎。"
Amazon Bedrock Marketplace 是 Swami 博士在現場發布的其中一款新品。這是一個擁有 100 多個領先大模型的 " 市場 ",Amazon Bedrock 中的統一體驗極大簡化模型開發工作流程,給用戶帶來了前所未有的靈活度,将讓模型推理從 " 非 A 即 B" 的選擇達到成本與延遲的 " 微妙平衡 "。
" 對一個因素的優化通常需要對另一個因素進行妥協,這是因爲成本和響應延遲與道德準确性呈反比關系,因爲功能更強大、高度智能的模型會消耗更多的資源。"Swami 博士講述從客戶了解到的需求。而在更新的 Bedrock 上,新模型蒸餾功能,使得用戶可以将特定知識從更大、更準确的模型轉移到更小、更高效的專業模型,使其速度提高 500%,成本降低 75%。
但是多元化的選擇,也難免面臨一些天然存在的競合關系,比如亞馬遜雲科技在向客戶提供模型市場、模型開發平台的同時,也推出了自己的基礎模型。不過,亞馬遜雲科技一直以來都是開放性的看待這種競合關系。
對于亞馬遜雲科技的模型策略,Andy Jassy 做了這樣的回答:" 我們一直以來的目标就是爲大家提供選擇,現實情況是,大家在不同的時間、出于不同的原因,都會使用不同的模型。
這其實反映了現實世界的運行規律。就好比人類不會隻找一個人去獲取各個領域的專業知識一樣,不同的人在不同的方面各有所長。有時候大家會側重于優化編碼,有時候關注數學,有時候看重與檢索增強生成(RAG)的集成,有時候聚焦智能需求,還有時候在意更低的延遲或成本問題。大多數情況下,是各種因素的組合決定的。
在亞馬遜雲科技,我們會爲大家提供這些因素組合之後,滿足需求的選擇。我們認爲,最近又爲這個組合增添了一些非常有趣的模型。好消息是,所有這些模型都能在 Amazon Bedrock 中使用,大家可以按照自己期望的任何組合去使用它們,進行試驗,并根據情況做出相應的調整。"
可接受的成本
雲計算的成本問題,一直是 Matt 最爲關心的問題。
2018 年,亞馬遜雲科技曾經做過一個瘋狂且頗具争議的決定:開發自己的芯片。即 Amazon Graviton,以期在 ARM 内核變得越來越快、越來越強大的背景下提供差異化價值。現在,Amazon Graviton 被幾乎每個亞馬遜雲科技客戶廣泛使用。Amazon Graviton 提供比 x86 高 40% 的性價比、減少 60% 的能源消耗,也極大縮減了雲計算成本。
以圖片分享網站 Pinterest 爲例。在轉向 Amazon Graviton 之前,Pinterest 運行着數千個 x86 實例來運營他們的業務。轉向 Amazon Graviton 之後,Pinterest 将計算成本降低了 47%,碳排放減少了 62%。" 他們并不孤單,90% 的前 1000 個 Amazon EC2 客戶都開始使用 Amazon Graviton。"Matt 說。
現在,生成式 AI 時代來了,當下最大的計算問題都與 AI 相關。雖然與 NVIDIA 有着長達 14 年的合作關系(搭載 NVIDIA 新 Blackwell 芯片的 Amazon EC2 P6 服務器将于明年年初推出),也是 NVIDIA 的大型生成式 AI 集群場所,但 GPU 依然成了亞馬遜雲科技爲計算降本的新目标:推出一款專爲尖端生成式 AI 訓練和推理這類高要求工作負載而設計的 GPU。
會上,亞馬遜雲科技最強 Amazon EC2 Trn2 計算實例發布。配備 16 個 Trainium2 芯片,一個 Amazon EC2 Trn2 實例可在單個計算節點提供 20.8 petaflops 的計算能力,Amazon EC2 Trn2 實例提供比當前 GPU 服務器高出 30% 到 40% 的性價比,這些芯片通過一種稱爲 NeuronLink 的高帶寬、低延遲互連連接在一起。
AI 大模型公司 Anthropic 聯合創始人兼首席計算官 Tom Brown12 月 2 日在 re:Invent 演講時當場宣布,下一代的 Claude 模型将在 Project Rainier 上進行訓練,他表示這将是一個新的計算集群,擁有數十萬個 Amazon Tranium2 芯片。優化完成後,該集群預計将成爲迄今爲止世界上最大的 AI 計算集群,可供 Anthropic 構建和部署其未來模型。
" 數十萬個芯片意味着數百個密集的億次浮點運算,比我們曾經使用過的任何集群都多五倍以上。這意味着客戶将可以更低的價格、更快的速度獲得更多的智能。有了 Amazon Tranium2 和 Project Rainier,我們不僅僅是在構建更快的人工智能,還在構建可擴展的、值得信賴的人工智能。"Tom Brown 表示。
Andy Jassy 在演講時也多次談及 " 成本 ",他認爲當生成式 AI 應用程序達到一定規模時,計算成本的重要性就凸顯出來了,大家都迫切希望獲得更高的性價比,即既能控制好延遲,也要具備合理的成本結構。據他觀察,從全球範圍來看,那些應用 AI 最爲成功的公司,主要體現在成本規避和生産力提升方面,而且很多公司在這兩方面都取得了進展。但值得一提的是,亞馬遜雲科技的成本控制,是體現在整場的産品創新上,而非簡單的價格。
需求導向,實用 AI
如果一定要給亞馬遜雲科技的 AI 戰略做一個定義,需求導向的實用 AI 或許更爲精确。
" 很多時候,人們用上不錯的模型做了些工作,就以爲打造出很棒的生成式 AI 應用程序了,但實際上可能隻完成了大概 70% 的工作,而客戶不會喜歡存在那 30% 問題的應用程序。"Andy Jassy 表示。以亞馬遜自己爲例,加入生成式 AI 這個 " 智慧大腦 " 之後,亞馬遜聊天機器人客戶滿意度提升了 500 個基點," 這就是實用 AI 的體現。"Andy Jassy 說。
客戶至尚和逆向工作法,是亞馬遜雲科技 DNA 的一部分。亞馬遜雲科技創業初期,由于合規性、審計、監管、安全、加密等考量,大部分的銀行客戶表示願意采用雲計算,但稱可能永遠不會上雲。亞馬遜雲科技沒有放棄這些金融客戶,而是接下來花了十年來解決銀行客戶清單上的每一個問題。" 今天,我很自豪地說,許多大型金融公司都是我們的客戶。因此,當你在創新時,重要的是要記住,你真的要從客戶開始。你要問他們什麽對他們重要,但你不僅僅是交付客戶要求的東西。你要爲他們發明。"Matt 說。
AI 時代也是同理:要爲客戶發明好用的 AI 工具。
會上,Swami 博士發布了新一代 Amazon SageMaker。從功能上看,SageMaker AI 與客戶的數據強相關,是一個集合了數據調用、數據分析、大模型訓練的一站式平台,定位上發生了重大的變化。
" 許多客戶向我們反饋,他們的分析和 AI 工作負載越來越多地圍繞相同的數據和相同的工作流程進行融合。這正在改變其對分析服務的看法,因爲事實證明,他們不再僅僅孤立地使用分析和 AI 工具,他們正在使用曆史分析數據來訓練機器學習模型,并且越來越多地将相同的數據納入其生成式 AI 應用程序中。"Matt 談及從一個客戶案例中獲得的啓發。這也不難理解,因爲數據才是企業的核心資産,才是差異化的競争力,而非模型,将企業絕對優勢的數據和大模型整合在一個平台上,才會有優勢。
綜合來看,對客戶來說,AI 落地的工具越來越多;對亞馬遜雲科技來說,他們又用一年的時間把 AI 生态這個木桶所有的木闆都加長了一大截;對行業來說,這個市場又被卷緊了好幾圈,競争的焦點也逐漸從大模型本身轉移到了工具和落地上。
附:亞馬遜雲科技 re:Invent2024 産品發布全景(筆者現場整理)
(本文首發于钛媒體 APP,作者 | 秦聰慧,編輯 | 劉湘明)