高通推出全新 AI Hub，助力 AI 推理速度最高提升 4 倍

IT 之家 2 月 26 日消息，2024 年世界移動通信大會已經拉開序幕，今年的 MWC，5G 和 AI 仍然是最受關注的話題。比如高通就在今天的 MWC 發布活動中正式推出了全新的高通 AI Hub，爲開發者打造獲取開發資源的中心，從而可以基于骁龍或高通平台打造 AI 應用。

具體來說，高通 AI Hub 可以爲開發者提供全面優化的 AI 模型庫，包括傳統 AI 模型和生成式 AI 模型，能夠支持在骁龍和高通平台上進行部署。開發者隻需選擇應用所需的模型以及其開發應用所使用的框架，然後确定目标平台，例如一款特定型号的手機、或者一款特定型号的高通平台，完成這些後，高通 AI Hub 就可以爲開發者提供面向其指定應用、指定平台進行優化的模型，開發者隻需要幾行代碼就可以獲取模型，并将模型集成進應用程序。

高通 AI Hub 将支持超過 75 個 AI 模型，包括傳統 AI 模型和生成式 AI 模型。通過對這些模型進行優化，開發者運行 AI 推理的速度将提升高達 4 倍。

不僅是速度提升，優化後的模型占用的内存帶寬和存儲空間也将減少，從而實現更高的能效和更持久的電池續航。

這些優化模型将在高通 AI Hub、以及 HuggingFace 和 GitHub 上提供，讓開發者能夠将 AI 模型便捷地集成到工作流中。

除了全新的 AI Hub，高通還在活動中展示了全球首個在搭載第三代骁龍 8 的安卓手機上運行的多模态大模型（LMM）。在這一演示中，高通展示了一個超過 70 億參數的 LMM，其支持文本、語音和圖像輸入，并能夠基于輸入的内容進行多輪對話。

同時高通還在搭載全新骁龍 X Elite 平台的 Windows PC 上，帶來了另一個多模态 AI 的演示。這是全球首個在 Windows PC 上運行的音頻推理多模态大模型，它能理解鳥鳴、音樂或家中的不同聲音，并且能夠基于這些信息進行對話，爲用戶提供幫助。

例如，多模态大語言模型能夠理解用戶輸入的音樂類型和風格，爲用戶提供音樂的曆史以及相似的音樂推薦，或通過對話的方式爲用戶調節周圍的音樂。

這些模型都經過優化，能夠實現出色的性能和能效，并完全在終端側運行，增強隐私性、可靠性、個性化以及成本優勢。

還有就是，高通還展示了他們首個在安卓手機上運行的 LoRA 模型。LoRA 能夠在不改變底層模型的前提之下，調整或定制模型的生成内容。通過使用很小的适配器（大小僅爲模型的 2%，便于下載），就能夠個性化定制整個生成式 AI 模型的行爲。

例如在演示中，模型能夠根據不同個人或藝術偏好創建高質量自定義圖像。高通表示這一技術不僅能夠運用于圖像生成，也可以應用于大語言模型等多種生成式 AI 模型，是實現個性化生成式 AI 的高效方式。