圖片來源 @視覺中國
文 | AI 商業評論
2023 年 3 月 21 日,在英偉達的年度重磅科技會議 GTC 上,英偉達 CEO 黃仁勳面向整個科技行業發出了宣告:伴随着大語言模型 ChatGPT 的火遍全球,一個新的計算平台已經被發明出來,AI 的 iPhone 時刻已經開始(The iPhone Moment of AI has started)。
由此,「AI 的 iPhone 時刻」在成爲一個行業熱門詞彙的同時,也在無意之中預示了由大語言模型(後來又稱爲「大模型」)引發的這一輪 AI 變革與以 iPhone 爲代表的智能手機行業的密切關聯。
實際上,智能手機行業對大模型的擁抱和應用速度,快得讓人目不暇接。
近一年來,包括華爲、小米、OPPO、vivo、榮耀在内的中國智能手機行業參與者,都已經相繼高調入局大模型——蘋果雖然還沒有官宣入局,但業内也有不少關于蘋果布局「Apple GPT」和大模型的消息。
那麽問題來了:手機廠商布局大模型,到底是不是噱頭?
華爲搶先一步,爲什麽?
大模型與智能手機首次發生應用層面的關聯,其實是在 2023 年 3 月的華爲春季旗艦新品發布會上。
在這次發布會上,華爲常務董事、消費者業務 CEO 餘承東面向用戶發布了全新的「智慧搜圖」功能,該功能是基于多模态大模型技術,在雲端進行訓練,然後在手機端側對模型進行小型化處理,在業界率先實現了首創的、精準的自然語言手機圖庫搜索體驗。
簡單來說,用戶可以像與人對話一樣,通過語音喚醒小藝,使用自然語言在手機圖庫中搜索出匹配如「山頂看日出、「圍爐煮茶」、「藍色珊瑚中的小醜魚」等描述的照片。
相較于傳統圖庫使用标簽進行照片搜索,存在準确率低、響應速度慢等問題,智慧搜圖更加「聰明」。結合多模态大模型,智慧搜圖對億級的圖文數據進行預訓練,增加了對泛化通用語義的理解,支持包含顔色、形狀、物體、行爲、時間和地點等多信息組合的自然語言搜索,同時還實現了端側輕量化應用。
值得一提的是,在用戶使用「智慧搜圖」的過程中,相關數據均于端側處理,進一步保護了消費者隐私安全。
那麽,爲什麽華爲能夠率先利用多模态大模型技術爲智能手機賦能?
答案很簡單:布局很早。
實際上,早在 2021 年 4 月下旬,在 HDC.Cloud 2021 華爲開發者大會上,當時擔任華爲雲 CEO 的餘承東就發布了一款重磅産品——華爲雲盤古大模型,它基于預訓練和少量行業适配和微調的開發模式,讓全球領先的 AI 真正地進入到千行百業。
具體來看,這次發布的盤古大模型,包括盤古 NLP 大模型、CV 大模型、多模态大模型和科學計算大模型。其中,盤古 NLP 大模型是業界首個千億級生成與理解中文 NLP 大模型,盤古 CV 大模型也是業内最大的計算機視覺大模型,支持 30 億個參數;而多模态大模型則包括跨模态搜索、擴模态生成和看圖說話等功能。
所以,自 2020 年開始,華爲在大模型領域已經進行了數年的布局,并且在不斷進化;而到了 2023 年,随着 ChatGPT 的爆發,智能手機也成爲了華爲大模型能力面向端側進行部署的一個應用場景罷了。
在 2023 年 8 月初的 HDC 2023 華爲開發者大會上,餘承東在講到鴻蒙 4.0 時的升級表示,在 AI 的大模型時代,盤古大模型将助力鴻蒙生态。
具體來說,在盤古自然語言大模型、盤古視覺大模型和盤古多模态大模型的助力下,鴻蒙 4.0 系統會迎來一個全新的「小藝」,其中包括知識獲取、邏輯推理、任務規劃、記憶擴展、工具調用和制作輔助等方面,推動智能終端的交互變革、生産力效率變革和個性化服務變革。
需要說明的是,鴻蒙 OS 4.0 在正式發布後不久,依舊已經推送到用戶手中——不僅如此,在 9 月 25 日舉行的華爲秋季全場景新品發布會上,根據餘承東在現場公布的消息,擁有大模型加持的鴻蒙 4.0 在發布一個多月後,升級用戶已經超過 6000 萬。
也就是說,目前來看,在大模型面向智能手機終端的部署進程中,華爲是真正的搶先者。
小米 OV 榮耀也入局,靠譜嗎?
在華爲之外,小米、OPPO、vivo 和榮耀等國産手機廠商,也都瞄準了大模型。
今年 6 月底,在 2023 MWC 上海移動通信大會上,榮耀 CEO 趙明表示将會率先将 AI 大模型引入端側,打造隻屬于用戶的個人 AI。他還強調,「大模型打破了我們很多的思考邊界,是我們迄今爲止看到 AI 的最佳诠釋」。
當時,榮耀旗下的旗艦手機 Magic V2 即将發布,因此有外界聲音稱它将會是「全球首款 AI 大模型國産手機」,引發外界關注——但是,從後來的情況來看,榮耀 Magic V2 與尚未與大模型建立關聯,不過它已經在 8 月底申請了「MagicGPT」商标。
與榮耀相比,小米在大模型領域的部署,與普通用戶的距離已經不遠。
今年 8 月份,在雷軍的 2023 年度演講中,雷軍表示,小米全面擁抱大模型,并且在今年 4 月已經組建小米 AI 大模型團隊——據了解,該團隊的負責人是小米技術委員會 AI 實驗室大模型團隊負責人栾劍。
在演講中,雷軍表示,小米大模型技術的主力突破方向是「輕量化」和「本地部署」,目前小米自研的 13 億參數端側模型已經在手機端跑通了 Demo,而且部分場景效果可以媲美 60 億模型在雲端的運算效果。
有意思的是,雷軍強調,在布局大模型的過程中,數據層面,小米自己挖掘整理的訓練數據占比達到了 80%,其中小米自有的産品和業務數據量達到 3TB。
另外,爲了保護用戶隐私,小米還模型部署到端側後,信息不用上傳到雲端,所有計算都在本地進行,可以從根本上保證用戶隐私不被洩露。即使在端雲結合的服務框架下,隐私信息會存儲在端側,涉及它們的計算也盡可能在端側完成;即使偶爾需要使用雲端的能力,信息也會經過處理和加密。
從結果上來看,小米大模型的落地載體爲「小愛同學」。在擁有大模型的賦能之後,小愛同學的人機交互形态将進行升級改造,增加一系列通識能力,其中包括深度理解上下文、翻譯能力、超級問答、生成式結果、完成複雜任務等。
從 8 月起,小米已經開啓了「小愛同學大模型」的内測,其落地也是指日可待。
在榮耀和小米之外,OPPO 和 vivo 在大模型方面的動作也沒有落下。
具體來看,10 月 11 日,OPPO 宣布,與聯發科技合作共建輕量化大模型端側部署方案,通過采用 4 位量化技術,實現精度不掉點效果下端側化性能更優,共同推動其自研的 AndesGPT 大語言模型和多模态大模型在端側逐步落地。
目前基于其自主訓練的安第斯大模型(AndesGPT)打造的新小布助手 1.0 Beta 版嘗鮮體驗正式開啓,升級後的小布助手将具備 AI 大模型能力。
除此之外,10 月 16 日,vivo 也宣布将于 11 月 1 日舉辦的 2023 vivo 開發者大會上發布全新手機操作系統 OriginOS 4,首發搭載 vivo 自研 AI 大模型—— vivo 方面還表示,自研 AI 大模型将以更智慧的助手形象釋放服務能力,賦能其小 V 助手獲得更廣闊的智慧服務能力,從而在學習、生活、工作等場景帶來颠覆性創新。
總體來看,幾乎所有的主流手機玩家,都已經在搶灘大模型的主戰場,下一步就是亮劍厮殺了。
大模型,究竟該如何落地?
在手機廠商紛紛擁抱大模型的情況下,一個真正思考的問題是:大模型該如何落地?
畢竟,從誕生之初,大模型就于雲端的大算力、大數據、大參數密不可分;實際上,大模型出生于雲端,這也是華爲這樣同時布局了雲計算的巨頭級廠商能夠在大模型業務布局中能夠搶先一步的核心要素。
所以,手機廠商擁抱大模型,從一開始就面臨一個技術層面的悖論:到底該怎麽落地?
目前來看,小米和 OV 都選擇了一個共同的路徑:輕量化。
比如,小米強調,與早些時候市場上放出的手機端大模型的方案相比,小米會調整模型結構和參數大小,适配各種芯片在内存和算力上的特點,緻力于達到功耗、推理速度和生成效果的最佳平衡。
同時,OPPO、vivo 都強調,它們都将推出不同參數量級的大模型,從 10 億至千億多種不同參數規模的模型規格——很明顯,這背後也是充分考慮到了不同部署端所帶來的成本、性能、功耗等問題。
除了輕量化之外,手機廠商入局大模型,還需要考慮大模型如何進行實際部署的産品化問題,這是一個涉及到用戶體驗、用戶隐私等多方面的關鍵話題。
目前來看,「端雲一體」應該是一個比較明顯的趨勢。
比如說,小米雖然在大模型方面強調本地部署,并且它自研的 13 億參數的端側模型已經在手機端跑通——但是根據小米技術委員會 AI 實驗室大模型團隊負責人栾劍的說法,在具體的實現過程中,手機端并不能解決所有問題,小米還是會堅持一體化的道路;但如果是能夠在端側模型解決的部分能力或者部分功能,就沒有必要上升到雲端去。
他強調,如果用戶在調用大模型的過程中需要用到一些實時更新的信息,就需要結合雲端的一些能力。
除了小米之外,OPPO 也在大模型方面強調「端雲協同」,它表示 AndesGPT 本質上是以「端雲協同」爲基礎架構設計思路,實現在本地與雲端協同運作的效果——很明顯,本地部署與雲端協同,很難完全分開。
當然,基于「端雲一體」的趨勢,實際上也要考慮大模型下的隐私問題——目前來看,華爲和小米都格外重視隐私問題,而各家的思路基本上也都是在強調:與大模型相關的計算盡量在本地完成,減少對信息傳輸和雲端的依賴。
那麽,最後一直值得關心的問題來了:對于普通用戶來說,大模型究竟意味着什麽?
對此,一位資深行業從業者表示,其實從用戶角度來看,可能一開始在功能上不會對大模型那麽強烈的感知,但是未來可能會發現在很多場景中自己的隐私得到了保護,這是一個從量變到質變的長期過程——但是從手機廠商的角度,沒有任何一家會放棄對大模型的探索,否則很有可能在這個領域落後。
那麽,向來高冷的蘋果呢?
目前來看,Tim Cook 在公開采訪中對于大模型的态度是「謹慎」,他認爲與大模型密切相關的生成式 AI 技術在未來的發展中有着巨大的潛力,但同時需要謹慎運用,以确保不會對人類社會帶來負面影響。但另一方面,在被問到是否在使用 ChatGPT 時,庫克的回答是正在使用,并且「對它很興奮」,而且蘋果在對它密切關注。
然而,根據知名爆料網站 The Information 的消息,蘋果實際上已經集合了一個強大的 AI 大模型開發團隊,其中包括其機器學習和 AI 戰略高級副總裁 John Giannandre 等人。不僅如此,蘋果公司在 AI 大模型方面的預算已經提高到每天數百萬美元。另外有消息稱,蘋果也幾乎将其大模型融入到 Siri 中,并且探讨過在 iPhone 端運行大語言模型的可能性。
所以,該來的還是會來——畢竟,技術發展的大勢是難以阻擋的。