好消息,搞生成式 AI 應用的門檻,被狠狠地打下去了!
就在剛剛,亞馬遜雲科技在年度盛會 re:Invent 中正式宣布:
在我這搞生成式 AI 應用,主流、最新大模型随便用 ~
例如 Meta 家的 Llama 2 70B、Antropic 家的 Claude 2.1 等等:
能夠将如此衆多大模型 " 打包 " 起來的集大成者,便是亞馬遜雲科技的 AI 大模型服務Amazon Bedrock。
當然,其中也包含了自家最新升級的大模型Titan:
Titan Text Embeddings:将文本轉變爲數字表征;
Titan Text Lite:可執行對文本的總結、文案生成和微調;
Titan Text Express:開放式文本生成、會話聊天,并支持 RAG;
Titan Multimodel Embeddings:支持搜索、推薦和個性化定制;
Titan Image Generator:可生成超現實、影棚級質量的圖片。
亞馬遜雲科技 AI 副總裁 Swami Sivasubramanian,還在現場演示了 Titan Iamge Generator 的能力。
例如隻需一句話就可以将一隻綠色蜥蜴,毫無 PS 痕迹地變成橘色:
再如把圖片掉轉個方向,也是隻是一句話的事兒了:
方便,着實是方便。
不過縱觀整場發布會,這些個功能和升級也還僅是亞馬遜雲科技把門檻打下去的動作一隅。
還有更多新功能的發布,讓搞生成式 AI 應用變得簡單了不少。
SageMaker 上新
SageMaker 是亞馬遜雲科技長期押注的一個項目,它的主要作用便是構建、訓練和部署機器學習模型。
Swami 在今天的大會中宣布了它的諸多新功能,讓客戶可以更輕松地去構建、訓練和部署生成式 AI 模型。
首先,便是SageMaker HyperPod功能。
我們都知道,以往基礎模型通常過于複雜,無法使用單個 AI 芯片進行訓練;因此,它們必須拆分到多個處理器上,這是一項技術上複雜的工作。
而 SageMaker HyperPod 可以提供對按需 AI 訓練集群的訪問,開發人員可以通過點擊式命令和相對簡單的腳本組合來配置集群,這比手動配置基礎架構要快得多。
Swami 在現場表示:
SageMaker HyperPod 将訓練基礎模型所需的時間減少了 40%。
SageMaker HyperPod 不僅可以自動執行設置 AI 訓練集群的過程,它還可以自動執行其維護。
當客戶集群中的某個實例脫機時,内置的自動化軟件會自動嘗試修複它;如果故障排除嘗試不成功,SageMaker HyperPod 會将出現故障的節點換成新節點。
在某些情況下,基礎模型需要數周或數月的時間來訓練。如果中斷使底層 AI 基礎設施脫機,開發人員必須從頭開始重新開始訓練,這可能會導緻嚴重的項目延遲。
爲避免此類情況,SageMaker HyperPod 會在訓練期間定期保存 AI 模型,并提供從最新快照恢複訓練的功能。
不僅如此,每個 SageMaker HyperPod 集群都預配置了一組亞馬遜雲科技開發的分布式訓練庫。
這些庫會自動将開發人員的模型分散到集群中的芯片上,而且還可以将訓練該模型的數據拆分爲更小,更易于管理的部分。
其次,在推理方面,亞馬遜雲科技推出了SageMaker Inference功能。
它的出現将有助于降低模型的部署成本和延遲;新的推理功能可以讓客戶單個端點上部署一個或多個基礎模型,并控制分配給它們的内存和加速器數量。
具體降本增效的成果,亞馬遜雲科技在現場也有介紹:
這項新功能可以幫助将部署成本降低 50%,并将延遲減少 20%。
在構建機器學習模型的無代碼界面上的SageMaker Canvas也有所更新。
我們現在可以直接用自然語言去處理了!
在聊天界面中,SageMaker Canvas 提供了許多與您正在使用的數據庫相關的引導提示,或者你可以提出自己的提示。
例如,你可以通過說 " 準備數據質量報告 "、" 根據特定條件删除行 " 等等,讓它來執行你的需求。
……
總而言之,SageMaker 今天的衆多能力更新,着實是讓模型的構建、訓練和部署簡單了不少。
對數據也 " 下手 " 了
擁有強大的數據基礎,對于充分利用生成式 AI 可以說是至關重要。
Swami 在現場表示,強大的數據基礎需要滿足三點:全面(comprehensive)、集成(integrated)和治理(governed)。
圍繞這些特性,亞馬遜雲科技在今天的大會中也做了相應新功能的發布。
首先便是針對向量引擎的OpenSearch Serverless,它能夠帶來更高效的搜索和流程。。
其次,DocumentDB和DynamoDB也加入到了向量功能,可以允許用戶将多種數據存儲在一起。
除此之外,MemoryDB for Redis也有了相應更新,它也可以支持向量搜索,響應時間變得更快,每秒可以處理數萬個查詢。
在分析數據庫方面,亞馬遜雲科技則是推出了Amazon Neptune Analytics,可以讓開發人員在幾秒鍾内檢查海量的圖形數據,也支持更快的向量搜索。
在數據的 " 集成 " 特性方面,亞馬遜雲科技依舊堅持的是 "zero-ETL" 之道—— Amazon S3 加持下的 OpenSearch Service zero-ETL integration,僅使用一個工具,便可以分析 S3 中的所有操作數據。
最後,在 " 治理 " 方面,亞馬遜雲科技上新的功能便是Clean Rooms ML。
它可以允許用戶在不共享底層數據的情況下與客戶應用機器學習模型。
One More Thing
在推動大模型發展的這件事上,亞馬遜雲科技可以說是有着自己獨到的 " 玩法 " ——
不僅發展自家的大模型,更是給其它大模型提供 AI 基礎設施和 AI 工具,讓它們也能更好地發展。
那麽二者之間是否會存在沖突和競争呢?
在量子位與亞馬遜雲科技數據庫和遷移服務副總裁 Jeff Carter 的交流過程中,他發表了如下看法:
我希望我們生活在一個合作的世界裏,每個 LLM 都擅長于不同的方面,我認爲這種情況會持續下去,這種專業化水平也會持續一段時間。
我喜歡 Bedrock 的一個原因是它可以無縫地從一個 LLM 轉換到另一個 LLM。很明顯,亞馬遜将持續在 LLM 方面推進最先進的技術。
但對于每個 LLM,或許下個月所呈現出來的能力會截然不同,這也就是爲什麽我們認爲給客戶提供選擇的能力和同時使用多個功能的能力是如此重要的原因之一。
參考鏈接:
[ 1 ] https://press.aboutamazon.com/2023/11/aws-announces-more-model-choice-and-powerful-new-capabilities-in-amazon-bedrock-to-securely-build-and-scale-generative-ai-applications
[ 2 ] https://www.techradar.com/news/live/aws-reinvent-2023-all-the-news-updates-and-more