作者 | 雲鵬
編輯 | 心緣
就在智能手機出貨量跌入十年最低谷之際,AI大模型直接給所有人送來了新的機遇。
最近摩根斯坦利的一份深度研究報告指出,邊緣AI技術的發展會給智能手機和PC産業注入新的活力,他們預計,智能手機産業會在2024年止跌企穩,并逐漸迎來複蘇,出貨量将迎來4%的同比增長。
4%,對于銷量頻頻跌至新低的智能手機行業來說,實屬來之不易。
▲2011年到2022年全球智能手機年度出貨量統計,來源:Counterpoint
正如摩根斯坦利報告所指出的,今天AI大模型帶來的AIGC浪潮,正深度洗禮着智能手機産業。最近短短一個月内,小米、vivo、OPPO、三星接連亮出了十個以上的AI大模型,從十億級、百億級到1300億。
值得一提的是,這些大模型幾乎都打着"自研"的旗号,似乎并非此前被行業議論多時的"開源版換皮"。
從ChatGPT火爆至今不過一年左右,國内頭部手機廠商中除了榮耀均已将AI大模型技術落地在自家手機中,這動作不可謂不快。
毫無疑問,手機AI大模型之戰,已經開始了。
▲近期手機廠商AI大模型相關發布梳理
AI大模型對各類智能設備的交互範式、服務提供形式或許都會有颠覆性影響,智能手機行業也将深度卷入這場大模型之戰,對于各家廠商來說,這似乎是一場不能輸的仗。
面對這樣的行業劇變,廠商們都是如何布局大模型技術的,又是如何實現的?廠商們爲何選在相近時間點發布,各家大模型又有何異同?智能手機用上AI大模型,真的是一次"智能進化",還是一個"噱頭"?我們将深入各家大模型産品,對話廠商相關負責人,嘗試找到答案。
一、手機用上AI大模型,還真不是個噱頭
在ChatGPT誕生之初,人們就在想象其在各行各業中應用的樣子,因爲ChatGPT最初的形式就是與人用自然語言對話,因此将其與智能手機結合,我們不難會想到智能語音助手,當時也有不少關于手機智能語音助手是否會被取代的讨論。
但技術發展之快甚至沒有給我們思考的時間,在我們給出答案之前,事實就已經呈現在我們面前了,"智能語音助手"這個詞,的确已經成爲過去時。
在AI大模型落地手機的今天,智能語音助手們并沒有消失,而是從底層完成了一次"質變",成爲了用戶接觸AI的核心入口之一,它們的名字中也去掉了"語音"兩個字。
無獨有偶,今天各家手機廠商在發布會上都将其稱之爲"智能助手"、"智慧助手"或"智能助理",在AI大模型帶來的"多模态"能力之下,我們跟AI的交互不再停留于語音,甚至不再停留于文字,交互的形式變得更加多樣,AI輸出給我們的信息也變得形式更加豐富。
隻不過我們與AI交互的過程總需要一個"界面"或"入口",各類智能助手就成爲了信息輸入輸出的平台,而背後真正的"大腦"正是AI大模型。
說了這麽多,AI大模型加持下,手機體驗到底有什麽改變?
從華爲、小米、vivo、OPPO發布的一系列AI大模型以及其落地手機對應的産品和應用服務來看,最直觀的一個改變,就跟我們當初第一次接觸ChatGPT十分類似,這個手機上的AI,終于變"聰明"了。
這個聰明,可以簡單分爲兩方面來看,第一是能聽懂了,第二就是能做好了。
聽懂這塊,形象地來說,AI大模型加入前,AI的語言理解能力,讓我們不得不把自己想象成一個AI,以AI的口吻去說話或者輸入文字,語言需要表達的非常清晰準确,不能有錯字或者省略的字。
而AI大模型加入後,我們不但可以像正常人一樣直接跟AI對話交流,即使我們輸入的信息不完整,甚至有錯别字,AI都可以很好地理解我們到底要什麽。
手機上的AI真的變聰明了,能跟人一樣正常交流了,能夠懂我們了。
▲華爲小藝通過自然語言對話設置手機天氣壁紙
但僅僅是聽懂隻是第一步,真正能幹什麽才是核心差異所在。
說到能做什麽,這裏有一個核心問題就出現了——手機用上AI大模型,跟我們直接在手機上下載ChatGPT App以及各類基于AI大模型的App有什麽區别?
這裏,我們不妨通過幾個例子來直觀感受一下兩者之間的區别。
對于應用了AI大模型的手機智能助手,我們可以直接讓它幫我們設置各種手機功能,比如換個跟今天天氣相符合的動态壁紙,比如編排一個專屬于我們自己的提醒模式,在特定的時間點以特定方式提醒我們去做某件事,再比如通過一句話就能快速開啓方便殘障人士使用的各類無障礙模式。
▲華爲小藝設置"晨跑場景"
AI大模型可以針對手機使用的場景進行學習優化,讓AI了解手機的各類功能,也就是說,小白也可以成爲"玩機達人",而每個手機,不同的品牌,不同的操作系統,功能設置的具體方式可能都有不同,這是ChatGPT所無法完成的。
再進一步,在手機使用場景中,還有很多能力也是ChatGPT不具備的。
比如我們可以讓智能助手根據備忘錄裏的信息寫一封明天開會的會議邀請郵件,也可以讓助手根據我們口頭描述直接找到手機本地相冊裏一張"下雨天我抱着貓的照片"。
▲vivo小V助手搜圖
在一些廠商開發的功能中,AI可以學習用戶的外貌特征,直接"創作"出一些照片,即使我們沒有去過一些景點,AI還是可以生成我們在這些地方的"旅遊照"。
▲小米相冊的AI創作圖片功能
此外,AI會根據我們日曆中對一些重點日期的标注進行主動智能服務的提供,比如在結婚紀念日前幾天提前給我們推薦一些購物、餐飲、娛樂服務。
▲華爲小藝在關鍵節日、紀念日提供主動提醒和服務
可以說,這種本地化、個性化、主動的智能服務體驗,是AI大模型在手機上落地帶給我們最直觀的感受,也是手機智能助手們區别于ChatGPT的主要特性之一。
當然,另外一部分直觀能力體現就與ChatGPT十分接近了,比如文字創作、文本摘要、圖像生成等等,這些能力也是AI大模型的核心優勢所在,不過今天我們對這些能力都不陌生了。
▲華爲小藝進行文字摘要
在餐館裏幫我們随手寫個用餐好評、過年幫我們寫個祝福語、針對一份會議紀要寫出一份思維導圖式的要點梳理、将一張照片轉換成不同風格的圖像,或者幫我們編寫簡單的程序,生成一些代碼。
▲小米AI大模型進行文字創作
整體來看,用一句話總結就是,ChatGPT能幹的它能幹,ChatGPT幹不了的它也能幹。而AI大模型落地智能手機,就相當于給每個人配了一個更聰明更能幹的全能助手,跟以往的智能語音助手體驗完全不在一個層次。
二、小到十億級,大到1750億參數,華米OV們的大模型有何異同?
說了這麽多AI大模型在手機上的應用,那是不是每家手機廠商的AI大模型都能實現這些功能和能力呢?各家的AI大模型有何異同?
就目前各家廠商在發布會上的演示和實際落地表現來看,在功能性上各家的大模型差異并不明顯,基本上你能做的我也能做,并沒看到有明顯的"人無我有"的優勢能力出現。
現在各家的做法更像是先打好基礎,搭建一個舞台,具體AI大模型能有怎樣更精彩的表現,一方面要看廠商的後續優化,另一方面也要看三方生态的建設,能否有更多手機App可以應用到這些AI大模型的能力。
值得一提的是,雖然在功能上各家并沒有拉開明顯差異,但在AI大模型落地手機的具體形式、參數規模、模型數量、自研深度、開源程度等方面确實存在一定差異。
比如從形式上來看,華爲這邊的載體是自家的小藝助手,在發布會上,華爲對于AI大模型能力的展示,基本上都是以小藝能力的形式,從知識獲取、邏輯推理、任務規劃、記憶擴展、工具調用到創作輔助。
跟華爲類似,vivo和OPPO也都是以各自智能助手能力的形式來展示AI大模型落地所帶來的變化,比如vivo的藍心小V以及OPPO的小布助手。
小米這邊,雖然小愛同學必然會成爲用戶接觸AI大模型的關鍵入口之一,但在發布會上,小米重點強調的是AI大模型技術在整個系統層面的應用,尤其是在各類App中的應用。
▲小米在WPS上推出的PPT生成功能
比如文本創作功能被應用在了輸入法中,寫摘要總結做PPT這樣的功能則與WPS進行了結合,像AI搜圖、進行圖片創作這樣的能力則整合進了相冊中。
值得一提的是,vivo這邊在藍心小V之外,還發布了一個會以公版App形式上線安卓、iOS手機應用市場的産品,名爲藍心千詢,一個自然語言對話機器人。
這就相當于手機廠商基于自己的AI大模型能力,做了另一個"ChatGPT"出來。vivo這種做法在華爲、小米和OPPO中并沒有看到。
說完了形式,我們來看看規模,首先,并不是每家廠商都在發布會上對自家AI大模型的詳細參數量、架構、關鍵特性都有詳細介紹,所以我們僅能從已公開的信息中尋找答案。
從發布的模型數量上來看,vivo這次在發布會上提到的大模型就有六個,是發布數量最多的一家,模型參數量從10億、70億、130億、700億、1300億到1750億,1750億已經看齊了GPT-3.5的參數量。
在vivo的規劃中,10億、70億規模的大模型主要用于端側,像語言理解、文本創作、文本總結這樣的能力基本上都可以實現,700億參數的大模型則主要用于雲端,可以進行更複雜的角色扮演、知識問答和自然對話。
值得一提的是,vivo的藍心大模型-7B是目前手機行業中第一個開源的大模型,vivo也發布了對應的開發套件BlueKit。
華爲這邊雖然沒有在發布新版小藝的同時介紹盤古大模型,但在今年的華爲開發者大會上,我們可以看到盤古大模型的更多詳細信息,比如最新的盤古大模型已經叠代至3.0版本,華爲也是幾家頭部手機廠商中布局AI大模型最早、産品叠代相對更成熟的一家。
不過華爲的盤古大模型并不是一個專門用于智能終端産品中的大模型,而更多的是面向行業應用,華爲給它的定位是"行業大模型",智能手機隻是其應用領域之一。
盤古3.0也有100億、380億、710億和1000億等幾個不同參數規模的基礎大模型,像知識問答、文案生成、代碼生成,以及多模态大模型的圖像生成、圖像理解等常見且必要的能力基本上都有涵蓋。
OPPO這邊的AI大模型目前已知的有Tiny、Turbo、Titan三個不同的規模,其中用在端側的Tiny參數量約爲70億,Turbo和Titan主要用在雲上。
雖然OPPO沒有明确提到其他大模型的參數量,但在AI大模型測試C-Eval的排行榜中,我們能夠看到由AndesLM研發的AndesLM-13B,參數爲130億。
與華爲、vivo和OPPO相比,小米是幾家中對于自研AI大模型的細節信息公布最少的,在C-Eval排行榜中,我們能夠看到參數量13億的小米AI大模型MiLM-1.3B和參數量60億的MiLM-6B。
值得一提的是,從目前各家廠商發布的模型來看,在手機端側落地的大模型,參數規模通常在60-70億左右,最高參數量目前在130億左右,這與高通、聯發科等手機芯片廠商在芯片發布時提到的信息也相吻合。
從各家模型特性上來看,vivo這邊給出的描述最爲詳盡,vivo也提出了他們認爲的優秀大模型應該具備的五個特點,包括大而全、算法強、安全性高、自進化以及開源。大主要是數據規模、模型參數大,知識量豐富,全主要指場景覆蓋要全,并且支持多模态。
端雲結合也是各家AI大模型落地手機的一個典型特征,目前各家基本上都是采取端雲協同的方式落地大模型,根據官方說法,這主要是出于成本、算力、效率、安全性等多方面因素考慮。
最後,有一點值得注意的是,華爲、小米、vivo都在發布會上明确提到了"自研大模型"的概念,而OPPO這邊用詞爲"自主訓練的",發布會全程并未提及"自研"。
在排行榜上,小米和vivo大模型的研究主體都是小米和vivo,而OPPO的研究主體是AndesLM。
整體看下來,雖然各家大模型目前落地功能并沒有差異,但是在參數量、架構、關鍵特性等方面可能仍然有各自的側重。
三、一年時間實現大模型落地,人才、數據、算力缺一不可
ChatGPT火爆至今不過一年多,各家手機廠商能夠在這麽短的時間内實現AI大模型在手機上的落地,足見其技術實力。
雖然國内的百模大戰、千模大戰早已上演,甚至有不少玩家已經退場,但相比這些創業公司或者做出一個個"試用産品"的互聯網巨頭們來說,華爲、小米、vivo、OPPO這些頭部智能手機廠商們要面對的是上億的終端用戶,這背後涉及到的技術研發量是不容小觑的。
提到技術研發,人才肯定是第一位的。
目前有比較具體研發團隊規模公布的是小米和vivo。小米集團總裁盧偉冰曾在财報電話會上提到,小米是在2023年4月組建的AI實驗室大模型團隊,目前在AI領域的研發人員有1200人左右。
相比之下,vivo這邊已公布的AI專家團隊規模同爲1000人左右,目前發布AI相關專利有700多個,AI頂會論文70多篇。
當然,各家手機廠商在AI領域的布局要遠遠早于AI大模型的出現,比如小米是幾家頭部手機廠商中布局AI技術較早的一個,在2016年就成立了小米探索實驗室,開始布局VR和智能機器人等方向的技術,而我們熟悉的小米小愛同學智能語音助手就誕生于次年3月。
vivo從2018年開始也在AI領域有所布局,成立了AI全球研究院、人工智能圖譜研究院,至今其掌握的13000T多模态數據、2800T中文文本數據都成爲AI大模型研發的重要數據資源。
vivo在發布會上提到,這2800T中文文本數據清洗和壓縮後産生的15T高質量訓練數據用于藍心大模型訓練,而這15T數據已經相當于2.5個中國國家圖書館藏書量。
當然,作爲在AI領域同樣布局較早的華爲,華爲雲在2020年就開始了盤古大模型的研發,是幾家中布局大模型較早的一個,其在2021年4月發布的盤古系列大模型中,就包括了千億參數中文語言預訓練模型,當時華爲還在現場演示了對話機器人産品。
OPPO這邊,從公開信息來看,相比獨立研發,OPPO可能更側重于産學研結合,2018年OPPO與浙江大學聯合成立了創新中心,當時人工智能就已經成爲雙方重點聚焦的技術創新領域,包括機器視覺、嵌入式AI、感知計算等等。
2022年OPPO和中國科學技術大學聯合成立了智能計算聯合實驗室,AI大模型就是其重要研究領域之一。
除了人才、數據,算力也是AI大模型研發和落地應用中非常關鍵的一環。對于當下中國AI芯片市場面對的窘境,vivo相關高管曾在發布會上坦言,目前他們在算力建設和部署上壓力很大、缺口也很大,高端芯片買不到了,他們需要用更多的技術創新來應對算力缺口,去提升訓練效率。由于芯片方面的限制,vivo建設出的計算集群規模要更大一些,能耗也要高一些。
可以看到,今天手機廠商們的AI大模型紛紛落地,實際上離不開各家廠商提前多年在AI領域的布局,多年來各家手機廠商智能語音助手在實際應用中所積累的數據以及研發經驗也成爲手機廠商們做AI大模型的優勢所在。
四、AI技術叠代日新月異,大模型會成國産手機的創新之光嗎?
目前,AI大模型在手機上的應用還處于初期階段,很多功能仍然處于測試狀态,未能實際落地,而從前文提到的各類功能以及模型規模來看,AI大模型在手機端的應用還有不少需要繼續優化叠代的方向。
有頭部手機廠商相關技術負責人告訴智東西,目前AI大模型技術本身和它的應用場景都在快速叠代發展中,從底層的AI大模型到上層應用都需要時間進一步探索。
雖然目前各家的功能還沒有拉開明顯差距,但在他看來,在應用層面其實各家是可以打出差異化的,因爲每家的産品、技術和生态側重都有所不同,比如華爲是鴻蒙生态,更主要的是手機+車,小米目前主推"人車家"的概念,生态産品規模最大,OPPO和vivo更多是自家生态内設備的落地應用。
應用場景、主要應用設備不同,AI大模型相對應的調整和技術難點也有所不同。
據業内人士透露,雖然參數量很重要,但未來随着算法的叠代、訓練方式的優化,以及更高質量訓練數據的應用,實際應用中對于模型參數的依賴會越來越小。
從目前各家AI大模型在手機上的落地應用來看,一個"超級助理"+N多個應用了AI大模型技術的App的模式已經成爲主流。
當然,未來技術叠代的空間是很大的,比如AI大模型目前距離真正的"智能"還有不少的差距,能夠實現本地運行的AI大模型更是如此,同時随着未來AI大模型能力越來越強,需要處理的任務越來越複雜,其對于芯片算力的要求也會更高。
值得一提的是,雖然國内頭部智能手機廠商們都已經積極踴躍地加入到了AI大模型之戰中,但身爲全球智能手機技術"風向标"的蘋果似乎仍在觀望,或者說是實實在在的慢了。
雖然此前已有各路關于蘋果AI大模型的相關爆料信息,但蘋果内部AI團隊動蕩、人才頻頻流失也是不争的事實,對于蘋果來說,想要快速跟進可能是"心有餘而力不足"。
三星這邊雖然也在上月發布了自家的自研AI大模型"高斯",但其最早落地應用于手機中也要等到明年Galaxy S24系列的發布了。
在技術創新方面,至少在AI大模型這一波,國産手機是實打實的領先了。
結語:手機大模型之戰開打,好戲還在後頭
從國内華米OV到海外的三星,智能手機巨頭們正積極湧入AI大模型之戰,智能手機也在AI大模型的加持下開始經曆新一輪"智能化"洗禮,當年智能語音助手們未曾實現的夢,AI大模型似乎要替它們圓了。
不過縱觀AI大模型在手機端的落地,目前功能和應用的發展都還處于早期,尤其是主動智能、個性化方面還有很大很大提升空間,目前各家手機端應用的AIGC功能,大多仍然需要雲側大模型支持,未來本地化大模型運行,仍需時日。
當然,未來蘋果的入局也是一大看點,蘋果能否後來居上甚至攪動産業,都充滿不确定性,但我們可以确定的是,AI大模型時代已經到來,手機大模型之戰,好戲才剛剛開始。