生成式 AI 在提升生産力效率方面展現出巨大的潛力,這也使得企業生産力場景成爲過去兩年生成式 AI 落地速度最快的應用領域之一。然而,企業在初步體驗了這一技術的「嘗鮮」之後,如何确保員工在工作中持續使用生成式 AI,而不是将其擱置一旁,已成爲所有競争 AI 基礎設施的雲計算巨頭們必須思考的重要問題。
這就需要回答一個核心問題:「今天企業在運用生成式 AI 時面臨哪些挑戰?」而在這一話題中,亞馬遜雲科技無疑是最有發言權的企業之一。
在正在進行的 re:Invent 大會上,亞馬遜雲科技推出了數十項生成式 AI 相關的新産品,涵蓋了從最底層的 AI 算力芯片、模型訓練和基礎模型,到中間層的智能體開發,再到最上層的 AI 應用,技術棧涉及各個領域。
這些新産品和工具并不是技術團隊随意定義的,而是源自過去一年中數萬客戶提出的各種需求。通過這些反饋,亞馬遜雲科技能夠精準識别出客戶面臨的挑戰,并據此推出符合需求的創新産品。今天企業引入生成式 AI 的主要挑戰可以歸納爲五點,按重要性排序如下:
豐富的選擇權
更低的部署成本
訓練更敏捷、更專業的小模型
消除幻覺
解決更複雜的任務
極客公園總結了爲什麽這五大需求成爲今天企業引入生成式 AI 的關鍵挑戰,并梳理了亞馬遜雲科技在本屆大會上發布的生成式 AI 新産品和服務,是如何幫助企業應對這些關鍵問題。
01 選擇權大于一切
在當地時間周二上午的 Keynote 環節中,無論是馬特 · 加曼還是安迪 · 賈西,在談及企業部署生成式 AI 時,都着重強調了「豐富的選擇(Choice Matters)」對于客戶的重要性。
這點在亞馬遜雲科技的大模型策略中表現得尤爲突出。與微軟雲和谷歌雲等廠商更傾向于依賴自家大模型或頂尖合作夥伴的策略不同,亞馬遜雲科技雖然自主研發了 Titan 和 Nova 系列大模型,并重金投資了 Anthropic 這樣的頂尖大模型開發商,但其整體策略更注重爲開發者提供一個多樣化的大模型選擇平台,用以構建 AI 應用。
亞馬遜 CEO 安迪 · 賈西宣布 Amazon Nova 系列大模型 丨來自:極客公園
加曼指出,豐富的大模型選擇是 Amazon Bedrock 吸引客戶的關鍵因素之一。他表示:「我們發現,并非所有客戶都希望使用單一模型。他們更傾向于根據需求選擇多種不同的模型。有些客戶偏好使用開源模型,比如 Llama 或 Mistral,這使他們能夠自行進行微調;有些客戶的應用程序需要圖像處理模型,例如 Stability 或 Titan 提供的模型;還有許多客戶尤其鍾愛最新的 Anthropic 模型,因爲不少人認爲這些模型在通用智能和推理能力方面的表現堪稱市場最佳。」
而作爲亞馬遜雲科技最重要的「客戶」,亞馬遜對此深有體會。過去在亞馬遜内部構建項目中所使用模型的多樣性令人驚訝。亞馬遜給了開發人員自主選擇的權利,原本以爲大家都會選擇 Claude 這樣的頂尖模型——雖然确實内部也有很多開發人員選擇了 Claude,但他們也會采用 Llama、Mistral,以及一些自己開發的模型。
這其實并不奇怪。因爲一直以來,很難出現一種工具能在某個領域一統天下。就像數據庫領域探讨了 10 年,大家依然會使用各種各樣的關系型數據庫或者非關系型數據庫。
而在今年的 re:Invent 上,亞馬遜雲科技進一步擴展了其大模型供應庫。
一方面,亞馬遜雲科技發布了自研大模型 Amazon Nova,并宣布與擅長視頻生成模型的 Luma AI 以及擅長代碼生成的 poolside 等大模型開發商達成合作,繼續豐富模型庫的供應商合作夥伴。
另一方面,亞馬遜雲科技宣布推出 Amazon Bedrock Marketplace,裏面提供了超過 100 個來自全球供應商的基礎模型産品,現在用戶可以在 Amazon Bedrock 上選擇和測試這些新模型,并結合 Bedrock 上的知識庫、FT、Guardrails 等功能,将其部署到 AI 應用。
02 更低的部署成本
對于企業部署生成式 AI 應用而言,計算成本一直是一個繞不開的問題。雖然今天鮮少有傳統行業的公司投入數千萬乃至數億美元預訓練基礎模型,但當生成式 AI 應用達到一定規模,推理成本就成爲企業必須衡量的投入。
今年早些時候,亞馬遜雲科技劇透了第二代自研 AI 計算芯片 Trainium 2。而在 re: Invent 大會期間,亞馬遜雲科技正式推出 Amazon EC2 Trn2 實例,相較 GPU 實例,性價比提升 30%-40%,這個計算實例包含 16 個 Trainium 2 芯片,每組應用實例可以達到 20.8 PFlops 的算力;此外還有包含 4 組實例即包含 64 個 Trainium 2 芯片的 Trainium 2 超級服務器(UltraService),浮點運算能力可以達到最高 84.2 PFlops。
更重要的是,Trn 2 芯片有着更低的單位算力成本。在生成式 AI 計算領域,英偉達的 GPU 可以占到全球 95% 以上的市場份額。當全球範圍内所有的生成式 AI 應用程序基本都是基于一種芯片構建起來的,大家都迫切希望獲得更高的性價比,這就是行業對 Trainium 2 興奮的原因。
亞馬遜雲科技 CEO 馬特 · 加曼宣布 Trainiums 3 丨來自:亞馬遜雲科技
此外,亞馬遜雲科技還在會上劇透了下一代算力芯片 Trainium 3。據悉,該芯片将采用 3nm 先進制程工藝,提供兩倍于 Trainium 2 的算力,以及 40% 的單位能效提升。
除了更高性價比的算力供給,亞馬遜雲科技還在緻力于利用工具和架構層面的優化,降低企業開發的 AI 應用在調用大模型的過程中消耗的算力資源。
除此之外,亞馬遜雲科技還在會上發布了 Prompt Caching,這是一種在大語言模型中存儲和複用提示詞的技術。也就是當用戶提出相當的問題時,Agent 可以直接調用此前存儲的結果,進而減少計算開銷、延遲和成本,特别是在那些需要頻繁使用相同提示的應用程序中。Prompt Caching 可以節省 AI 應用近 90% 的推理成本。
03 訓練更敏捷、更專業的小模型
盡管生成式 AI 是一個創新速度極快的領域,但對企業而言,想要在成本、功能上找到完美契合自身用例的模型依然十分困難。
AI 應用開發者希望找到的是一個延遲低、成本低,但又能滿足專業要求的模型,但要實現起來并不容易。有時候,開發者找到了一個專業知識匹配度很高的模型,它很聰明也很不錯,可就是價格偏高,并且運營速度較慢;又有的時候,開發者找到了一個速度更快、成本更低的模型,但它在功能上又達不到今天的需求。
人們解決這一問題的其中一種方法叫做模型蒸餾。具體做法簡單來說,就是将一個特定的問題集發給能力更強的大型模型(比如 Llama 405B 模型),然後把所有的數據、答案與問題一起用來訓練一個較小的模型(比如 Llama 8B 模型),使其成爲某一特定領域的專家,如此一來,就能得到一個規模更小、運行速度更快且知道如何準确回答特定問題集的專業模型。
這種方法在生成專家模型方面效果确實不錯,但需要機器學習專家來操作,實際操作起來難度頗高,得管理所有的數據工作流,要處理訓練數據、調整模型參數,還要考慮模型權重等,挑戰不小,而亞馬遜雲科技希望能讓這一過程變得更簡單易行。
模型蒸餾功能丨來自:極客公園
爲此,亞馬遜雲科技在會上宣布在 Amazon Bedrock 中推出模型蒸餾功能。相比于被蒸餾的模型,新模型的運行速度能夠提升 500%,成本還能降低 75%,并且用戶隻需要将應用的示例發給 Amazon Bedrock,後者會幫用戶完成所有的剩餘工作。
不過,獲取合适的模型隻是第一步,用戶最終的目的不是爲了獲取一個好的模型,而是要讓 AI 應用能夠輸出足夠有價值的結果。完成這一步不僅需要好的模型,也需要讓企業過去積累的數據發揮作用,這也才能真正讓企業構建未來的差異化競争優勢。
Amazon Bedrock 此前已經上線了相關的 RAG(檢索增強生成)功能,最新發布了更進一步的 GraphRAG(圖像檢索增強生成)。
但要真正實現這一目标,企業首先需要做好數據治理。這是一個先決條件,隻有在确保數據質量和管理完善的基礎上,各類數據才能在增強大模型能力的過程中發揮最佳效果。
爲此,亞馬遜雲科技今年在數據治理領域推出了衆多新産品,包括新型數據管理工具 Amazon S3 Tables 和便于數據查找的元數據工具 Amazon S3 MetaData。此外,亞馬遜雲科技還進一步加強了數據系統與 Amazon Bedrock 和 Amazon SageMaker 等開發系統的整合,使開發者僅需在一個系統内進行簡單的拖放操作,就能輕松實現 RAG(檢索增強生成)等功能。
04 無幻覺,1% 都不行
第四是大模型老生常談的問題——幻覺。實際上今天阻礙人們将生成式 AI 引入真正的生産環境(尤其是關鍵任務相關的應用場景)的,還有一個很多人都擔心的問題,那就是模型的幻覺現象。
盡管如今的模型已經表現得很不錯了,但有時還是會出錯。當你在去年或者前年進行概念驗證時,90% 的準确率或許還能接受,但當涉及到生産應用程序,深入到具體細節時,這樣的準确率就不行了。
以保險行業爲例,假設你早上走進浴室,發現漏水了,地上全是水,然後你去保險網站查詢這是否在保險賠付範圍内,作爲保險公司,如果客戶詢問這類事件是否能理賠,你必須給出準确無誤的回答,這是絕對不能出錯的情況。
所以亞馬遜雲科技召集了一組專業人員,思考是否有可以運用的技術,通過新的方式來幫助他們解決這個問題。這組人員研究了各種不同的技術,其中一種就是自動推理。
自動推理實際上是一種能夠從數學角度證明某事正确的 AI 形式,通常被用于驗證系統是否按照既定要求運行,當面對的系統覆蓋面非常大,大到無法人工逐一查看,且有關于系統運行方式的知識庫時,自動推理就能發揮很大的作用,在必須确保答案準确無誤的情況下,它顯得尤爲重要。
自動推理檢查功能丨來自:極客公園
會上,亞馬遜雲科技宣布推出自動推理檢查功能(Automated Reasoning checks),它能夠防止因模型幻覺而導緻的事實性錯誤。當你啓用這些自動化推理檢查功能時,Amazon Bedrock 可以對模型所做出的事實陳述進行準确性檢查,這一切都是基于可靠的數學驗證,并且會向永不展示得出結論的依據。
例如一家保險公司,決定啓用自動化推理檢查功能,要做的就是上傳所有的保單,然後 Amazon Bedrock 内部的自動化推理系統會自動生成相應規則,接着會經曆一系列大概需要 20 到 30 分鍾的叠代過程,來調整并确定正确的回應方式,它會通過向開發者提問等方式,真正搞清楚保單的具體運作機制。
回到之前浴室漏水的例子,自動化推理系統會查看反饋結果,如果模型對答案不确定,它會将相關情況返回,并給出其他提示建議,或者告訴客戶可以怎樣向模型補充信息,隻有當自動化推理檢查确保答案準确無誤後,才會将結果發送給客戶,這樣就能百分之百确定發給客戶的結果是準确的,這是在其他地方無法獲取的功能,這将切實幫助企業用戶在把推理功能融入關鍵任務應用程序時避免出現問題。
05 能解決複雜任務
企業部署生成式 AI 應用的最後一道門檻,在于能否開發出能夠解決複雜任務的應用。
這點在過去幾個月裏逐漸成爲全行業的共識。智能體 Agent 的出現,讓企業用戶可以非常簡單的構建 AI 應用,這也是亞馬遜雲科技推出 Amazon Bedrock Agents 的原因。
Amazon Bedrock 讓構建智能體以及創建能夠在公司所有系統和數據中執行任務的智能體變得十分容易,通過使用 Amazon Bedrock,企業用戶隻需用自然語言描述想要智能體完成的任務,它就能快速構建出來,然後智能體便可以處理諸如處理銷售訂單、編制财務報告或者分析客戶留存情況等任務。
目前這些智能體在處理簡單任務(單個獨立任務)時表現得很不錯,客戶也已經從 Amazon Bedrock 智能體中獲得了不少收益。但亞馬遜雲科技團隊收到的反饋顯示,客戶期望更多,他們希望能夠跨多個智能體執行複雜任務,可能涉及數百個智能體并行操作,但在當下,要協調這麽多智能體幾乎是不可能的事。
舉個例子,假如你經營着一家全球咖啡連鎖店,想要創建一些智能體來幫助分析開設新店的風險,那你可能會創建一系列智能體,比如創建一個分析全球經濟因素的智能體,一個查看相關市場動态的智能體,甚至還可以創建一個爲獨立門店做财務預測的智能體。
總的來說,你或許會創建十幾個智能體來針對一個地點進行分析并返回相應信息,這本身是很有價值的。但當這些智能體返回信息後,你還需要将它們整合起來,分析它們之間的相互關系,然後再與不同地區的情況進行對比。
一般情況下,這樣的操作還算可控,但經營者可能不會隻考察一個地點,也許是想對數百個潛在的開店地點進行分析,而且這些地點還分布在不同的地理區域。當這樣做的時候,你會發現這些智能體可能并非獨立工作,智能體 A 所掌握的信息或許對智能體 B 是有價值的,所以你其實希望它們能夠相互交互、共享信息。可一旦涉及到數百個智能體都要進行交互、返回數據、共享信息、再返回操作時,整個管理系統的複雜程度就會急劇上升,變得完全難以掌控。
馬特 · 加曼宣布多智能體協作功能丨來自:極客公園
但實現這樣的功能,有巨大的商業價值,所以亞馬遜雲科技推出了多智能體協作功能 multi-agent collaboration,後者能夠處理更複雜的工作流程。就像前面舉的例子一樣,經營者可以創建一系列專爲特定個性化任務設計的智能體,然後再創建一個監督智能體,負責管理智能體訪問信息的權限、确定任務是按照順序啓動還是并行進行,并協調處理各個智能體返回的信息,确保智能體之間能夠有效協作。
金融數據分析公司穆迪評級與亞馬遜雲雲科技展開了合作,并對這個早期版本進行了試用,開發了一個可以讓客戶生成全面的财務風險報告的應用程序。從結果而言,過去完成這樣的工作需要花費一名員工大約一周時間,而使用了多智能體協作以後,僅用一個小時就能完成同樣的任務,效率得到了極大的提升。
06 結語
今年的 re:Invent 無疑是一場令人震撼的盛會。不少已連續參與多屆的企業客戶、技術人員和工程師都用「震撼」來形容。甚至連已經離開亞馬遜雲科技數年的傳奇 CEO 安迪 · 賈西——曾帶領亞馬遜走出困境的關鍵人物,也時隔多年再次登上了 re:Invent 的舞台。
前三天的活動裏,亞馬遜雲科技發布了數十個生成式 AI 領域和雲基礎設施相關的新産品和技術,這些新産品中,單獨拿出一兩項往往便足以成爲一場雲服務公司大型發布會的核心内容。亞馬遜雲科技之所以選擇在一場發布會上集中推出如此多的新功能,主要有兩方面原因:一是當前 AI 應用企業面臨的問題異常複雜,需要多維度、多場景的解決方案來應對;二是亞馬遜雲科技長期以來秉承的「客戶至尚」文化,驅動其以全面的創新滿足客戶需求。
而這種高密度的發布也從側面展現了亞馬遜雲科技在生成式 AI 領域的巨大資源投入和堅定的戰略意圖,表明其在這個迅速發展的領域中占據領先地位的決心。
即将到來的 2025 年,無疑将成爲生成式 AI 在企業級市場大規模部署的關鍵節點。從今年 re:Invent 發布的衆多應用和新功能可以看出,經過幾年的嘗試與探索,生成式 AI 的發展已經邁出了從早期試驗階段向産業落地的轉變。這一階段不再僅僅關注技術的可行性,而是開始聚焦于如何解決企業具體的業務需求和實際問題。
這些問題正被快速解決,标志着生成式 AI 不僅作爲生産力工具的潛力被驗證,更逐漸具備作爲核心生産力的能力。換句話說,生成式 AI 已經逼近了「真正可用」的臨界點,即從概念驗證走向大規模應用的邊緣。