
「物理學不存在了,化學也不存在了,隻剩下了 AI。」
2024 年 10 月陸續公布的諾貝爾物理學和化學獎全都頒發給了 AI 領域的泰鬥級人物,也引發了有此讨論。
諾貝爾獎當然不會像媒體一樣追 AI 的熱點,之所以機器學習的兩位奠基者能獲得諾貝爾物理學獎,其原因是因爲相關技術已被用于推動多個領域的研究,包括粒子物理、材料科學和天體物理等。
類似的,被稱爲 AlphaGo 之父的 Demis Hassabis 能成爲諾貝爾化學獎的獲獎者之一,是因爲他參與研發的 AlphaFold2 的人工智能模型能夠幫助研究者預測研究人員已經确定的幾乎所有 2 億種蛋白質的結構,已經被來自 190 個國家的 200 多萬人使用。在無數的科學應用中,研究人員現在可以更好地了解抗生素耐藥性,并創建可以分解塑料的酶的圖像。
今年諾貝爾獎的流向,昭示了一件毋庸置疑的事實:人工智能并不孤立存在,已經切實地深刻地影響人類的方方面面。隻是有人心知肚明,有人後知後覺。

在另一邊,10 月可能會是曆年來手機行業最爲繁忙的一個月,在短短的二十天時間裏,我們可以看到年度旗艦芯片發布,年度旗艦手機發布和年底的系統大版本更新。
這種密集的節奏也昭示着一個事實:芯片、系統、終端正在以一種前所未有的方式緊密聯系,需要改變以往按部就班的節奏。
改變節奏的關鍵詞,也是 AI。
AI 影響人類的方方面面,自然也包括智能手機行業。

以天玑 9400 和 vivo X200 系列開始,智能手機的拐點出現
在手機行業異常繁忙的 10 月裏,開場嘉賓是聯發科旗艦芯片天玑 9400 發布,接着是 vivo 的 VDC 大會,發布自研大模型和 OriginOS 5,最後就是 vivo X200 作爲天玑 9400 和 OriginOS 5 的首發機型發布。

雖是秋日,但春江水暖的意思再明顯不過,在經曆了去年關于 AI 手機的初步探索之後,行業已然有所共識:智能手機的 AI 不應該是一個應用,一個入口,AI 智能體将發展爲未來生成式 AI 手機交互的中心 。
這就是智能手機行業的一個「拐點」,同時也是天玑芯片自己的「拐點」。作爲天玑系列的第五代産品,天玑 9400 的使命已經不僅是鞏固天玑品牌在高端市場的地位,而是肩負更爲深遠的戰略目标。
再遲鈍的人也會感到,芯片、系統和智能手機的發布會講述重點在發生變化。

比如說,早期芯片的重點通常在于提升 CPU 性能,後來随着手機産品的競争轉到了影像層面,芯片的 ISP 表現也比之前更重要,而如今,讨論芯片時,AI 性能已經成爲新的核心焦點。

手機産品的發展也是如此,以往大家關注跑分、随後焦點轉向影像能力,例如夜景長焦逆光等等長焦表現如何?而現在,講手機如何能夠無中生有,一句話能夠變出什麽好玩的東西出來。
所謂「拐點」,關乎到我們過去如何使用手機,更預示着未來如何使用手機。
過去,智能手機會常常會針對市場進行細分,比如商務手機,遊戲手機和影像手機,而如今旗艦機似乎不這麽做了,因爲它們需要在各方面做到極緻——不僅要提供強大的隐私和安全保護,還要保障足夠的續航,也需要有強大性能讓遊戲流暢運行,還需要多攝接力,征服長焦暗光逆光等困難場景。當然,設計上還要具備高級感,以及各種附加價值。

以此而言,按照以上傳統的智能手機評價體系,vivo X200 系列就是一份标準答案。作爲天玑 9400 的首發機型,我們可以看到在不少核心賣點層面的對外信息裏,vivo 和聯發科都在共同發聲,比如談到影像能力的時候,他們就表示「天玑 9400 和藍圖影像芯片 V3+ 雙芯協同」,帶來了 4K 逆光人像錄制這樣摧艱克難的功能,因爲 4K 視頻、逆光(DCG & HDR)和人像(背景虛化,實時美顔)每一個關鍵詞,都意味着數據量和計算量的急劇攀升,這就需要強大的芯片算力作爲支撐。
另外,時至今日,我們也開始接受兩個事實,一是天玑芯片的能力可以支撐起影像旗艦的名号,正如我們在年中所說的那樣:2024 年,「天玑芯片」配「影像旗艦」變得順理成章了。
第二就是計算攝影已經以潤物細無聲的方式被用戶所接受,幾乎任何的拍照場景,都融入了大量的影像算法來進行優化,這就是爲什麽諸如 vivo X200 Pro 這樣的旗艦手機成片在逆光下明暗有度,超長焦下也能纖毫畢現的原因,靠算法,也靠天玑算力。
更不用說如今終端廠商和上遊廠商之間協作的緊密度,進入到了共同深度打磨用戶體驗的層面。

比如去年聯發科天玑 9300 首發了全大核架構,背後也有 vivo 的深度參與和聯合定義,到了這一代的天玑 9400 也是如此,雙方将共同開啓第二代全大核時代。
蘋果産品之所以能效表現一直很好,源于其芯片與産品需求的高度契合,兩者緊密配合,雖然 Android 生态沒法完全複制這種模式,但聯發科與 vivo 實際上已有異曲同工之妙。
當然,以上所說的,還是雙方在圍繞着「用戶過往使用習慣」進行各個層面的聯合調校和優化。
「拐點」之後,還關乎雙方如何定義「未來如何使用手機」。
在先于 vivo X200 系列發布的 VDC 上,vivo 發布了全新的藍心大模型矩陣,以及 OriginOS 5。

藍心大模型矩陣上,千億級的藍心雲端大模型,重點優化了意圖理解與分發和任務規劃能力。而端側的藍心大模型 3B 則是一個亮點,這個 3B 的大模型在對話寫作、摘要總結、信息抽取等能力上可以比肩行業 7B-9B 的大模型,且同時具備功耗小,低内存占用的優勢。
另外,藍心大模型矩陣不僅僅是不同參數大小的大語言模型,也開始包含了語音大模型、圖像大模型和多模态大模型的多種形态大模型,聽說讀寫看畫都能覆蓋。
OriginOS 5 上也出現了一批新的 AI 功能:藍心小 V 與 Jovi 語音合并,交互和搜索實現了多模态化,新出現的小 V 圈搜能夠通過圖像識别與圈選交互的結合,精準搜索對象。
「原子島」功能,除通知功能外,其擁有藍心小 V 強大的意圖識别能力,不斷分析和判斷用戶當前的需求,主動爲用戶提供後項服務。
小 V 建議(主動智慧服務的桌面組件)、小 V 幫記(支持同聲傳譯)、内置小 V 寫作的 vivo 輸入法,一鍵剪輯加 AI 定制詞曲的小 V 時光剪影等等等功能,分散在了 OriginOS 5 的數十個模塊當中,無處不 AI 。
在這背後,聯發科旗艦芯片的強大算力與 AI 性能提供了堅實的基礎。

更能代表智能手機通過 AI 改變使用方式的,是「PhoneGPT」手機,在這一智能體加持下,藍心小 V 可以對屏幕界面進行識别和操作,也可以通過接管音頻進行自主對話,以完成用戶交代的任務,例如幫助我們去訂餐廳、訂咖啡等等。
一切都似曾相識,因爲在聯發科 10 月 9 日的天玑 9400 發布會上,端側大模型斷網運行,多模态大模型的支持,包括對于手機智能體的支持,都已經演示過一遍。
這當然不是巧合,而是共識,也可以說是共謀和共建。
今年年中,天玑開發者大會(MDDC 2024)上,聯發科與 Counterpoint 攜手軟硬件生态夥伴聯合發布《生成式 AI 手機産業白皮書》,其中重點如下:
端雲結合将是生成式 AI 部署的主流模式
多模态是實現 AI 智能體願景的關鍵
端側部署 AI 大模型的具有時延、安全和能效方面的優勢
App 爲基礎的用戶界面與 AI 智能體将會在未來幾年内共存
生成式 AI 手機的出貨量,算力和能力将會持續快速發展
可以看到,年中的共識,還沒到年底,就已經紛紛落地變成了現實,一切宛如當年智能手機參數的飛速發展期,處理器從單核變雙核,雙核變四核,四核變八核;分辨率從 480P 變 720P,720P 變 1080P,1080P 變 2K;隻不過現在的變化是模型參數越來越大,大語言模型變多模态模型。
當變化以另外一種方式呈現的時候,就可謂之爲「拐點」。
簡言之,天玑 9400 和 vivo X200 系列正是這種拐點的一種具象表現,我們可以像以往一樣使用最新的智能手機,它性能更強,玩遊戲更流暢,拍照拍視頻都更好。我們也可以嘗試全新的使用方式,給予它更多的自由度和主動權,讓自己少操作幾步,少看會手機。

關于手機 AI 的漏鬥效應:用戶感知,終端支持和芯片能力
當 Demis Hassabis 帶領 DeepMind 團隊做出的 AlphaGo 先後戰勝李世石和柯潔的時候,普通人知道了人工智能的強大,同時也在懷疑人工智能的用處:它隻會下圍棋,但下不了象棋,也點不了外賣,更沒法代替用戶上班。
當 Demis Hassabis 再次出現在大衆視野裏的時候,他已經是諾貝爾獎得主,他的研究成果對化學和藥學産生了巨大的影響和幫助,再遲鈍的人也知道,人工智能對人類的影響遠比想象中深刻。
這就是技術、技術展示和技術落地之間的差異。
類似的,關于手機領域人工智能落地的用戶感知,手機終端支持和芯片能力,也有類似的差異。
自去年年末大家高舉高打 AI 手機概念以來,其實消費者沒有預期中的熱烈,也沒有到非你不可沒你不行的 AI 功能感知。
但是諸如 AI 消除等等亮點功能,倒是成功地提高了用戶的認知度,完成了一次不錯的用戶教育。
總結下來,當下智能手機的用戶在手機 AI 的嘗試上仍然比較輕度,有新奇體驗,也有一些挫敗體驗,AI 和用戶日常使用習慣的耦合還隻是初始階段。
現在的手機呢,以 vivo X200 Pro 爲例,這一代旗艦機它最先出來,隻能靠它當典型了,整體的 AI 能力要比上一代搭載 OriginOS 4 的旗艦機強上不少,單是 PhoneGPT 爲代表的手機智能體就可以看做是 AI Agent 的雛形,而 AI Agent 又被認爲是通用人工智能的必經之路。
如果聊概念聊未來有點飄渺,那麽語音、圖像和多模态大模型能夠賦能的場景和功能,就很能說明問題了。

是的,我知道「賦能」這個詞高居大廠黑話名詞前列,充滿了假大空的意味,但當看到搭載了天玑 9400 和 OriginOS 5 的 vivo X200 系列在藍心大模型的支持下,能夠利用 vivo 看見,vivo 聽說,手語翻譯官等功能,讓殘障人士看到,聽到,說出來,被理解的時候,「賦能」這個詞也被 AI 所賦能。
在 vivo 聽說裏,一種不太常見的方言「苗語」也被支持,在信息便捷溝通和保護地方語言之間的矛盾裏,AI 成爲了那個化幹戈爲玉帛的樞紐。

而在天玑 9400 芯片端,除了繼續支持更強大更多模态的端側模型之外,本身在生成式 AI 内容層面的支持也更進一步,不僅能夠文生文,文生圖,文生動圖,甚至還首發了端側的文生視頻功能。另外,前文說到的手機智能體之所以能實現,也有賴于天玑 AI 智能體化引擎(Dimensity Agentic AI Engine),這個引擎最大的作用就是能夠爲 AI 智能體、第三方 App 和大模型之間提供統一的标準接口。

諸如人聲萃取,多模态端側模型的支持等等,也讓手機 AI 未來的百花齊放提供了無限可能。
從共識,到共建,這個過程無需對齊拉通流程,因爲這是上遊、終端和服務提供商一緻認同的方向。
雖然說這種上遊 — 終端 — 用戶的路徑裏,已然存在着類似于「技術、技術展示和技術落地」落差的漏鬥效應,但是,這個瘋狂的十月已經預示着,隻要像天玑 9400 這樣的上遊芯片和 vivo X200 系列這樣的終端産品足夠強大,AI 功能進化得足夠快,那麽最終用戶的感知也會足夠明顯。
以出貨量而言,手機的出貨量遠遠高于 PC、平闆和手表等計算終端,以算力水平而言,手機芯片能力正在逼近桌面級,同時因爲享用最先進制程的緣故,也有着最佳的能效表現,加之手機上有着最豐富龐大的數據生态和個人印記,所以毫無疑問地,手機就是目前端側 AI 最佳的載體。

藍心大模型 3B 就是這種邏輯的産物,以小巧輕便的形态來完成複雜的 AI 需求,在天玑 9400 發布會的演示上,面壁智能的端側模型也能提供相當不錯的多模态體驗,能解方程,能看菜單翻譯點菜 ......
不管是用水滴石穿,還是百川歸海,亦或是星火燎原來形容,依托于底層芯片,還有各種大模型爲基礎的 AI 功能正在爆發增長,正在從星星點點,變成星漢燦爛。
這個邏輯也和諾貝爾獎被 AI 包圍一樣,量變,在拐點之後,産生了質變。

由此,我們也可以大膽預言:這個 10 月,自天玑 9400 和 vivo X200 系列爲開端,後續上中下遊各家品牌齊齊發力,曾經被認爲是漏鬥形狀的體驗滲透過程,也會逐漸變成管道。
這就是這個 10 月日程如此密集的真相所在:以旗艦芯片爲起始,大模型和 AI 功能爲重點的系統更新,到新機發布的超快節奏裏,上遊芯片提供商和下遊終端制造商,是類似于舞伴的關系,隻有雙手相扣,踏對節奏,才有精彩的演出。
而後我們會發現,這也不是舞台上的雙人獨舞,而是一場關于 AI 的盛大舞會,音樂響起,舞步踏出,會有越來越多的舞者加入進來。
不過别忘了,踏出第一步舞步的,是天玑 9400。