由 AIGC 趨勢掀起的新一輪 AI 競賽,已經到了白熱化階段。
就在人人争相發大模型 " 秀肌肉 " 時,也有人不按套路出牌。
在亞馬遜雲科技的最新發布上,雖然也首發了自研基礎大模型 Titan,不過仔細琢磨就發現,這是 " 醉翁之意不在酒 ",真正的主角是一個名叫Bedrock的 AI 平台。
在這裏可以直接通過 API 調用多個熱門生成式 AI 大模型,包括 Stable Diffusion、Claude 等。
有聲音評價說,這一波操作是把生成式 AI 上雲了,并且爲自家大模型 " 打開格局 "。
這既讓人意外,但也不意外。
畢竟是全球雲計算行業的 " 頭号玩家 ",一定會在 AIGC 這波趨勢中留下名字。
但從實際動向來看,不是盲從趨勢,而是基于自身定位和特長,找到适合的身位。
由此不禁好奇,亞馬遜雲科技究竟如何靠 Bedrock 殺入 AIGC 戰局?這背後有哪些趨勢?AIGC 産業如今發展地到底怎樣了?
亞馬遜雲科技的 AIGC 打開方式
想要理解巨頭最新發布背後的動因,還要先了解下發布的核心内容。
簡單理解,Bedrock 就是一個集成了多種生成式 AI 模型的平台。
在這裏可以通過API 訪問的方式,快速調用業内領先的大模型。如 Stability AI、Anthropic、AI21 Labs 和亞馬遜雲科技自家的大模型。
即 Stable Diffusion、Claude 等,都是大家耳熟能詳的生成式 AI 了。
除了這些 " 熟面孔 " 外,亞馬遜雲科技首次推出了自研大語言模型 Titan:
據介紹,目前 Titan 包括了兩個全新的大語言模型:
Titan text:專注于生成式 NLP 任務,比如寫總結、創作博客、文字分類、對話和信息提取等;
Titan Embeddings:用于搜索和個性化等,可将文本輸入翻譯成包含語義的嵌入編碼能夠讓搜索結果更相關和符合上下文語境,目前自家産品搜索中已經用上了類似模型。
這些模型都會在 Bedrock 上托管,可以按需調用或進行定制,無需管理任何基礎設施。
舉例來說,用戶可以将基礎模型與 Amazon SageMaker 機器學習功能集成,使用 Experiments 測試不同模型和使用 Pipelines 大規模管理基礎模型等。
其中定制化是 Bedrock 比較重要的一個功能,它支持少樣本定制和微調大模型,最少僅需20 個示例即可。
而且亞馬遜雲科技強調,在訓練底層模型的過程中不會使用任何用戶數據。并對所有數據都進行加密,不會離開用戶的虛拟私有網絡(VPC)。
平台層向下,就是硬件基礎設施。
作爲雲廠商,自然洞察到了這波最新 AI 趨勢下,對算力的巨大需求。
由此亞馬遜雲科技也一并宣布了兩款自研芯片實例正式可用,一款針對訓練,一款針對推理。
首先是基于訓練芯片 Trainium 的 Amazon EC2 Trn1n。
與其他同類實例相比,此前的 Trn1 節省的訓練成本已達 50%。而通過在超大規模集群(UltraClusters)中進行部署,還可以實現超過 6 exaflops 的計算能力,數據傳輸規模達到 PB 級。
這讓内部搜索團隊等用戶訓練大模型的時間從從幾個月縮短到了幾周甚至幾天。
專爲網絡密集型大模型設計的 Trn1n 實例,直接可提供高達 1600Gbps 的網絡帶寬,總體性能比 Trn1 還要高出 20%。
其次是用于推理的 Amazon EC2 Inf2 實例。
亞馬遜雲科技認爲,随着基礎模型進入大規模部署的階段,主要成本将轉移到模型微調和推理。
Inf2 實例由自研的推理專用芯片 Inferentia2 提供支持,後者在亞馬遜雲科技去年的開發者大會上首次亮相(Inferentia 一代則問世于 2018 年)。
它專門針對千億參數的生成式大模型進行了優化:
與上一代相比,吞吐量提高了 4 倍,延遲降低了 10 倍,并可支持大規模分布式推理;與同類實例相比,每瓦性能比提高了 50%。
除此之外,亞馬遜雲科技還爲普通開發者推出了完全免費的輔助代碼編寫工具CodeWhisperer。
無論是面向行業用戶、還是 C 端用戶,亞馬遜雲科技似乎都在想辦法讓最新的 AI 趨勢離大家更近一點。
實際上,這也是目前很多 AI 大廠、科技巨頭正在推進的事,隻不過各家的方法不盡相同。
那麽,爲什麽需要搭建 Bedrock 這樣的 AI 平台?它們會給行業帶來哪些影響?
爲什麽需要大模型底座?
由表及裏,大概有兩層原因驅動。
首先是直接原因,行業需求。
生成式 AI 将會形成一個新市場,如今已是行業公認的趨勢。
據 Grand View Research 估計,到 2030 年,生成式 AI 的市場規模可能接近1100 億美元。
這意味着在未來一段時間内,全球将會有大量的行業和企業,尋求将生成式 AI 接入到自家業務中。并且速度要快,否則一不小心就會被彎道超車。
比如亞馬遜雲科技就提到過,過去一段時間裏他們的客戶來問得最多的問題便是:
我怎麽能快速上車将它們用到自己的業務中,但又不用耗費太多精力和 money?
畢竟對于絕大部分企業來說,煉出一個自家大模型并不劃算,背後要投入的人力、物力、時間,都太多了;更何況開發難度也很高。
實際上,很多廠商已經提供了 API 接口供行業用戶直接調用,但這種方法還是要求用戶自己管理基礎設施;如果想要構建深入場景的定制化模型,也還是需要自己做開發,整個流程不夠高效便捷。
由此雲服務就被推到了台前。
這種基于互聯網給企業提供基礎架構、平台或軟件的服務,本身在靈活性、易用性和能力上都得到了行業驗證,尤其大模型本身對雲計算就有着天然的依賴性。
在生成式 AI 席卷而來時,不少聲音認爲這也會爲整個雲計算行業帶來根本性的改變,雲計算的主流商業模式會從傳統的 IaaS 變成 MaaS。
而近期,越來越多 AIGC 玩家也在順勢推出自己雲服務,兜售大模型能力。
那麽亞馬遜雲科技的動作,則是給出了一種新範式,将多種大模型囊括在一起,放在一個大平台底座上,讓用戶的可選擇性提升,同時發揮他們雲廠商本身的優勢,讓用戶的調用和定制化過程門檻更低、效率更高,并在安全性做出保障。
更深層次的原因在于,給大模型加底座,能夠更進一步降本增效,這本身就符合市場和行業的發展要求。
參考數字化轉型浪潮的演進過程,從最初的無紙化,到雲計算的使用,本質上都是降本增效的過程,讓企業可以在生産制造、推進業務的過程中更高效利用資源,降低生産運營成本。
最新一輪的生成式 AI 浪潮,亦會如此。
隻是這一輪的主角不再是計算機、雲計算,而是 AI 大模型。
未來一段時間内,Bedrock 這類 AI 平台或許還會出現新玩家,并進一步形成一個賽道、成爲 AIGC 産業中的一層結構。
亞馬遜雲科技的做法,正是給大家示範了一下,科技巨頭在面對最新趨勢時,如何結合自身優勢找到合适身位。
而除了大模型底座,在近期或許還會衍生出一大批 " 新興物種 "。比如當下軟件應用在争先恐後接入 Chatbot,就有企業推出相應服務幫軟件應用接入大模型能力。
可見在當下這個時刻,怎麽把握機遇非常關鍵。
該怎麽做?
AIGC 玩家種類豐富,不一定都要 " 卷 " 大模型本身
前面提到,到 2030 年,全球生成式 AI 市場規模可能接近 1100 億美元這一巨大數字。
此等規模下,自然會湧現種類空前豐富的玩家。
根據量子位智庫 3 月發布的《AIGC 産業全景報告》,無論玩家屬于初創公司還是互聯網巨頭、專門的 AI 廠商 / 科研機構還是生态鏈場景公司,我們都可按基礎設施層、模型層和應用層将它們分爲三大類。
具體而言,基礎設施層主要包含爲行業提供數據、算力、計算平台、模型開發訓練平台以及其他配套設施的企業。
其中,比如光數據這一環就分爲數據提供商和數據服務商,光數據提供商就包括提供通用數據、垂直數據、特定業務下的标注數據、符合法規的審核數據等等。
對于算力平台來說,智算中心這類算力集群、雲服務商和硬件領域的芯片商也都是不可或缺的角色。
模型層則主要分爲專供底層通用大模型和中間層模型這兩類。
前者由于建設和提升迫切性最強,目前最受關注,吸引了一大批 " 火力 "。
不過,它也相對最容易形成壁壘,因爲人才、時間、數據和資金等多個方面都會形成制約。
值得注意的是,如 Hugging Face、魔搭 ModelScope 這樣的模型站玩家,也可以歸于這一類。
至于中間層模型,則主打垂直化、行業化和細分化,可分爲:
(1)中間集成商,主要組合多個接口,形成新的大模型;
(2)行業大模型商,由底層模型持有者進行端到端提供;
(3)以及二次開發商,主要增加行業特色數據和行業認知。
這類玩家比較适合具有特定行業積累以及技術積累的企業快速進入。
最後,應用層。如果按照底層邏輯來看,可以分爲生産可直接消費内容、結合底層系統生産含有附加價值内容、提供内容生産輔助工具、用于提供打包内容或解決方案這四類。
如果基于模态分,則包括文本生成、圖像生成、音頻 / 視頻 / 跨模态、策略生成等等,其中文本生成又包括應用型、創作型、交互型和輔助生成。
這是創業最爲友好的一層,當然,關鍵卡口還是模型層玩家。
具體分類暫且不表。
重點是,從以上這些内容我們可以看到,整個 AIGC 市場的玩家方向确實多如牛毛,而由于行業整體還處于培育摸索期,不管哪個位置都還遠談不上飽和,可謂機會多多。
那麽,如何找到合适的位置就成了關鍵。
如亞馬遜雲科技,作爲一家雲廠商,偏就盯準應用層,提供打包内容或解決方案,做上了各類大模型的接入和改造平台。
這也傳遞了一個聲音,行業巨頭不一定非要都往大模型方向 " 卷 ",根據市場需求和自身實力出發,即使入局較慢幾步,也能 get 恰到好處的落腳點。
據可靠消息:5 月 25 日将舉辦亞馬遜雲科技大模型及生成式 AI 發布深度解讀大會,敬請期待。