IT 之家 2 月 26 日消息,2024 年世界移動通信大會已經拉開序幕,今年的 MWC,5G 和 AI 仍然是最受關注的話題。比如高通就在今天的 MWC 發布活動中正式推出了全新的高通 AI Hub,爲開發者打造獲取開發資源的中心,從而可以基于骁龍或高通平台打造 AI 應用。
具體來說,高通 AI Hub 可以爲開發者提供全面優化的 AI 模型庫,包括傳統 AI 模型和生成式 AI 模型,能夠支持在骁龍和高通平台上進行部署。開發者隻需選擇應用所需的模型以及其開發應用所使用的框架,然後确定目标平台,例如一款特定型号的手機、或者一款特定型号的高通平台,完成這些後,高通 AI Hub 就可以爲開發者提供面向其指定應用、指定平台進行優化的模型,開發者隻需要幾行代碼就可以獲取模型,并将模型集成進應用程序。
高通 AI Hub 将支持超過 75 個 AI 模型,包括傳統 AI 模型和生成式 AI 模型。通過對這些模型進行優化,開發者運行 AI 推理的速度将提升高達 4 倍。
不僅是速度提升,優化後的模型占用的内存帶寬和存儲空間也将減少,從而實現更高的能效和更持久的電池續航。
這些優化模型将在高通 AI Hub、以及 HuggingFace 和 GitHub 上提供,讓開發者能夠将 AI 模型便捷地集成到工作流中。
除了全新的 AI Hub,高通還在活動中展示了全球首個在搭載第三代骁龍 8 的安卓手機上運行的多模态大模型(LMM)。在這一演示中,高通展示了一個超過 70 億參數的 LMM,其支持文本、語音和圖像輸入,并能夠基于輸入的内容進行多輪對話。
同時高通還在搭載全新骁龍 X Elite 平台的 Windows PC 上,帶來了另一個多模态 AI 的演示。這是全球首個在 Windows PC 上運行的音頻推理多模态大模型,它能理解鳥鳴、音樂或家中的不同聲音,并且能夠基于這些信息進行對話,爲用戶提供幫助。
例如,多模态大語言模型能夠理解用戶輸入的音樂類型和風格,爲用戶提供音樂的曆史以及相似的音樂推薦,或通過對話的方式爲用戶調節周圍的音樂。
這些模型都經過優化,能夠實現出色的性能和能效,并完全在終端側運行,增強隐私性、可靠性、個性化以及成本優勢。
還有就是,高通還展示了他們首個在安卓手機上運行的 LoRA 模型。LoRA 能夠在不改變底層模型的前提之下,調整或定制模型的生成内容。通過使用很小的适配器(大小僅爲模型的 2%,便于下載),就能夠個性化定制整個生成式 AI 模型的行爲。
例如在演示中,模型能夠根據不同個人或藝術偏好創建高質量自定義圖像。高通表示這一技術不僅能夠運用于圖像生成,也可以應用于大語言模型等多種生成式 AI 模型,是實現個性化生成式 AI 的高效方式。