圖片來源 @視覺中國
文|财經故事荟,作者|深海,編輯|紀英
OpenAI 可能要造手機了,而且可能是專爲 ChatGPT 設計的 AI 手機。
最近,據 The Information 報道,OpenAI CEO Sam Altman 一直在與 iPhone 著名設計師 Jony Ive 聯系,讨論開發一種新的 AI 硬件設備。
軟銀 CEO 孫正義也對此興趣盎然,并 " 與兩人交談過這一想法 "。
三方合作雖然尚無定論,但以孫正義一向标榜的 ChatGPT" 重度用戶 " 身份來看,這事兒有戲。
一面是 AI 公司準備挺進硬件領域;另一面,手機廠商也在加緊擁抱 AI 大模型。
美東時間 10 月 4 日,谷歌發布了搭載谷歌 AI 基礎模型、" 以人工智能爲中心 " 的 Google Pixel 8 系列手機——考慮到谷歌當初發布的安卓系統,曾一舉帶動功能手機跨躍性進入智能手機時代,谷歌此番入場,可能拉開了 AI 手機的序幕。
國内手機廠商,也紛至沓來。
10 月 11 日,OPPO 宣布,基于其自主訓練的安第斯大模型(AndesGPT)打造的新小布助手 1.0 Beta 版嘗鮮體驗正式開啓,升級後的小布助手将具備 AI 大模型能力。
這是繼小米宣布内置 AI 大模型的小愛内測之後,又一啓動内置 AI 大模型手機智能助手實測的手機廠商。
步子邁得更大的是華爲,從宣布手機系統接入盤古大模型,到開啓内置大模型的語音助手小藝的衆測、發布内置 AI 大模型的新機華爲 Mate60 系列,一個多月就一氣呵成。
vivo 雖然在大模型落地應用上沒有實際進展,但其自研的 70 億參數大模型 vivo_Agent_LM_7B,已在 8 月份現身 C-Eval 等榜單;且官方也在 9 月的博鳌亞洲論壇國際科技與創新論壇上,預告了自研大模型發布的消息。
榮耀更爲火急火燎,7 月初早早發布了号稱 " 全球首款原生集成 AI 大模型的國産手機 "Magic V2,賺足噱頭;但其自研大模型的進展卻沒露半點風聲,反而表态 " 在網絡大模型方面跟互聯網公司進行合作 " 。
……
國内外手機巨頭大幹快幹 AI 大模型的急切心情 ,是顯而易見的。這主要是因爲,手機市場創新乏力,實在卷不動了;而 " 把大模型裝進手機 ",很可能實現手機功能和體驗的革命性突破,有望引發新一輪換機潮。
AI 手機有望治愈市場内卷?
爲何國内手機廠商,都對 AI 大模型趨之若鹜?
最直接的價值,當屬手機性能和體驗的提升。
當 AI 大模型融入手機系統,一方面能增強手機處理圖像、語音、自然語言處理等任務的能力,顯著增強手機性能;另一方面能更靈活響應用戶需求,提升用戶體驗,且随着 AI 算法的進化,加載在端側的大模型對用戶了解的加深,手機可以預測用戶的行爲并提前進行優化,變得更聰明智能,從 " 千人一機 " 變成 " 千人千機 "。
部署在手機本地的 AI 大模型,不僅可以實現 AI 對各類 APP 的優化賦能,甚至可以作爲通用接口,打破壁壘,讓 APP 能力實現自由組合,進而提升用戶體驗和産品競争力。
國内外分别率先落地 AI 大模型的華爲 Mate60 系列機型及 Google Pixel 8 系列手機,就是例證。
華爲手機很早就将 AI 能力應用于增強手機圖像處理方面,這次 AI 大模型内置到系統後,體驗改善最明顯的是其手機語音助手小藝。
與 OpenAI 的 ChatGPT、谷歌 Bard 這些生成式 AI 聊天機器人有所不同,華爲的小藝在 HarmonyOS 操作系統底層進行了重構。
即前兩者隻是加載在手機上的 AI 應用,小藝則是将大模型作爲智慧系統的大腦,借助大模型的高階能力,對系統能力進行全面增強。
而有盤古大模型做底層支持的小藝,不僅自然語言理解能力實現跨越式叠代,還能利用生成式 AI 多爲用戶做很多事情,比如資訊摘要、寫文章、回複郵件、撰寫備忘錄、圖片二創等。
不止滿足生活需求,甚至還能輔助工作。比如邀約合作夥伴開會,直接跟小藝口述會議的時間、邀請人員以及讨論内容,小藝就能寫出一封會議邀請郵件。
更值得一提的是,小藝确實做到了打破 APP 之間的壁壘,應對更複雜的用戶需求場景。
比如針對一張海報圖片,詢問小藝相關的地址信息并要求導航到目标地點,小藝就可以準确識别海報中的地址信息并打開導航 App 進行導航。
又如,想找一家牛排餐廳,小藝可以準确理解意圖,并直接調用美團服務找到相關餐廳。
而 Google Pixel 8 系列手機對圖像處理能力的增強,也令人驚豔。
通過生成式 AI,Google Photos 中的 Magic Editor(魔法編輯器) 可以利用已經拍攝的照片,手動從其他照片中選擇另一個表情,生成一張新的照片,且可以保證 " 每個人都睜着眼睛 "。
此外,這一功能還能抹去照片中不必要的背景和雜物,讓空有高配手機卻拍不出合格照片的 " 手殘黨 ",也能成爲出片大師。
AI 大模型對手機功能體驗的改善是顯而易見,并能切中用戶需求的,或将刺激大批打算嘗鮮的用戶換機,打破手機行業創新乏力的同質化内卷困境。
根據市場研究機構 Canalys 發布的最新報告,截至 2023 年第二季度,中國智能手機市場出貨量約爲 6430 萬台,較去年同期下降 5%;全球智能手機市場同樣動力不足,今年二季度出貨量同比下降 10%。
而在下滑的大盤中,高端市場則相對走俏。Canalys 分析師 Amber Liu 指出," 消費者越來越願意爲高品質産品買單。自去年以來,中國智能手機市場的平均價格已超過 450 美元,預計未來幾個季度将繼續攀升。"
如果 AI 手機可以大幅提升體驗,國内外手機市場再次被激活或成爲可能。
華泰證券在其題爲《AI 會推動新一輪換機潮嗎?》的專題研究中指出,随着 AI 大模型時代到來,AI 有望成爲驅動下一輪換機潮的重要因素,預計 2023 下半年首批 "AI 手機 " 将陸續面世,目前 AI 手機主要應用 NLP(自然語言處理)和 CV(計算機視覺)技術,預計 2024-2025 年将有更多創新 AI 應用在手機落地。
在 2023 年第二季度業績會上,聯發科也表達了類似觀點,認爲 "AI 落地手機将加速換機周期 "。
" 搶灘 " 大模型,廠商進展不一
其實,手機行業争相搶灘 AI 大模型,并非僅僅是跟風熱點,頭部廠商布局 AI 已有時日,且在步步遞進,早期更多是從功能改善層面出發,如今逐漸深入到系統層面。
雖然直到今年 8 月份發布鴻蒙 4 系統時,華爲才宣布将大模型接入手機系統,但盤古大模型早在 2020 年 9 月就已經啓動研發,至今已經叠代至 3.0 版本并已商用。
同樣較早布局 AI 大模型的還有 OPPO。
自 2020 年起,OPPO 小布助手團隊就開始探索和應用大語言模型。
早在其大模型 AndesGPT 項目開展以前,OPPO 就已經展開了大量的 AI 投入,對預訓練語言模型進行開發和探索,自主研發了曾在中文語言理解測評基準 CLUE1.1 總榜中排名第五、大規模知識圖譜問答 KgCLUE1.0,以及排行榜排名第一的大模型 OBERT。
vivo 發力 AI 大模型的時間雖尚不可考,但從其 2018 年成立 AI 全球研究院,今年 8 月份在權威測評網站提交了 70 億參數大模型 vivo_Agent_LM_7B 看,投入相關領域研發時間不會短。
小米下場也不晚,早在 2016 年 7 月就已經布局 AI,到了今年 4 月,又順勢正式組建了 AI 實驗室大模型團隊。
正如小米技術委員會 AI 實驗室大模型團隊負責人栾劍所說," 手機和 AI 的結合其實很早就有了,比如在拍照中對照片的調整——快速對焦,超分辨率等。現在把大模型加入手機,是一個升級,它提高的是自然語言的交互,包括文字處理的能力、多模态的處理能力等。"
國内手機廠商之所以急着在近三四個月将自身的 AI 大模型推到台前,甚至整合應用到手機,或是想先發制人,抓住 AI 手機可能帶來的換機潮的窗口期。
手機廠商加速落地 AI 大模型,一定程度上也是一次針對消費需求疲軟局面的 " 自救 "。
根據前述内容,除了自研大模型進展一直沒消息的榮耀,國内大部分手機巨頭,基本都選擇了自研 AI 大模型,但因爲各自條件限制和啓動時間有先有後,落地進展不盡相同。
自建一套生态的華爲,目前算是第一家将手機 AI 大模型落地新機的國内手機廠商。
其次要屬 OPPO 和小米。二者雖然未正式發布内置 AI 大模型的新機型,但已經将旗下内置 AI 大模型的新手機助手分别啓動公測和内測,邁出将 AI 大模型和手機系統融合的步伐。
OPPO 整體考慮更周全,提前做好和上遊廠商的磨合。在自主訓練 AndesGPT 大語言模型的同時,OPPO 也和聯發科合作,希望借用其 4 位量化技術,實現精度不掉點效果下端側性能更優,盡快推動 AndesGPT 在端側輕量化落地。
vivio 雖然自研大模型已上權威排行榜,但至今未見具體落地行爲。
網傳 vivio 在今年 10 月左右會推出内置 AI 大模型的新 OriginOS 4.0 系統,如果屆時一并推出内置 AI 大模型新系統的新機,vivo 有望成爲繼華爲之後,國内第二個将 AI 大模型落地新機的手機廠商。
與華爲軟、硬件自成一體不同,其他手機廠商在自研大模型的同時,未來還是免不了和上遊硬件廠商合作,借助其芯片及輕量化技術,更好推進自研 AI 大模型在手機端的落地,變量更多。
從某種程度而言,誰能更快和硬件廠商磨合好,将自研的大模型加速輕量化落地,誰就能更快搶得先機。
自研大模型:終将走向端雲一體化?
另一個問題來了:目前市場 " 百模大戰 " 火熱,手機廠商爲什麽不采取拿來主義,直接調用成熟雲端大模型的開源接口,非要親自下場自研端側大模型?
原因可用兩個關鍵詞概括:帶不好、帶不動。
一方面,像 ChatGPT 這類部署在雲端的大模型的具體應用,一直以來都伴随着強烈的隐私安全争議。
而本地化部署的手機 AI 大模型,數據不會離開端側,在用戶數據的隐私和安全性方面更有保障。
因爲參數量較爲輕量化,手機大模型的加載運行速度也會更快,不受網絡環境限制。
此外,布局在手機端的輕量化大模型訓練周期短,能根據用戶需求進行快速的叠代更新,在響應用戶需求方面更靈活。
華泰證券也在前述研報中斷言,不同于訓練環節的高計算性能要求,推理環節主要根據用戶需求,利用訓練好的模型進行推理預測,對峰值計算性能要求較低,更注重單位能耗算力、時延、成本等綜合指标。
由于雲端算力與終端設備間需通過網絡信道傳輸,僅将推理算力分布于雲端,受限于網絡帶寬和傳輸距離,将無法滿足部分場景低時延、高可靠性等要求。
另一方面,對雲端大模型來說,随着接入的需求增多及使用頻率的增加,雲端算力、網絡帶寬、存儲及硬件等資源的消耗負擔越重。
手機廠商如果把手機性能革命的驅動力中樞搭載在這些 " 笨重 " 的雲端大模型上,手機性能體驗很容易不穩定,乃至被拖入泥潭。
對于自研端側大模型的問題,小米技術委員會 AI 實驗室大模型團隊負責人栾劍在接受騰訊科技采訪時的回答,讓我們從手機廠商視角看清了它們的考量。
關于自研,栾劍認爲,在各種設備終端上,使用的芯片不盡相同,它們在内存大小、算力強弱、平台支持的算子集上都會有差别。這就要求模型必須能根據硬件條件做出動态調整以達到最佳性能。
而一個開源模型,結構上就是固定的,無法再調整,使用起來非常受限。如果希望具備定制模型結構和從頭開始訓練的能力,就必須自研。
這也解釋了,爲什麽手機廠商一方面要自研大模型,另一方面又得加強和硬件廠商的磨合。
栾劍同時指出,端側大模型能更好保護用戶隐私,同時讓用戶可以用更低成本去獲取更多的功能,但這絕不意味着用手機端就能解決所有問題。
雖然高通、聯發科等硬件廠商通過持續提升量化算法,可保證在輕量化落地端側大模型的同時,帶來手機能效和性能的提升;但無法否認,AI 大模型再怎麽壓縮,參數體量擺在那兒,對手機硬件、性能的要求隻會越來越高。
前述華泰證券研報也指出,AI 模型大量的計算,将對總線帶寬提出更高要求;不斷運行的推理任務将使得設備耗電加快,拉動電池容量以及相應的電源管理芯片升級需求。
随着大模型預測越來越準确,這些問題會愈發明顯,或将帶動上下遊産業鏈的升級。
那麽,除了不斷優化量化等技術、提升手機配置,手機廠商還有哪些方案,能有效應對端側大模型進化帶來的更高要求?
對此,小米提出的 " 端雲一體化 " 概念或許是現實選擇,即未來 AI 手機一部分能力或功能,端側模型可以解決的,就在端側解決;端側無法解決的,則調用雲端能力。這樣既能确保隐私安全性和對用戶需求的精準理解和靈活響應,又能保證實現更複雜高階的操作,優化用戶體驗。
高通也提出和小米類似的思路。
在技術白皮書《混合 AI 是 AI 的未來》中,高通指出,随着生成式 AI 以前所未有的速度發展以及計算需求的日益增長,AI 處理必須分别在雲端和終端進行,才能實現 AI 的規模化擴展并發揮其最大潛能。
而華爲目前的解決方案,也是和前兩者高度接近的。
據了解,針對消費者在不同設備不同場景下的需求,華爲小藝背後的大模型擁有端側和雲側等形态。在小藝與大模型的結合中,端側大模型會先對用戶請求和上下文信息做一層預處理,再将預處理後的需求發送到雲側,從而最大化地發揮 " 端側模型快 " 和 " 雲側模型強 " 的優勢。
AI 大勢已至,作爲用戶量最廣、用戶粘性最高的智能終端,手機,或許會成爲 AI 大爆炸大普及的第一載體。