文 | 大模型之家
12 月 20 日,有消息稱,DeepSeek 開源大模型 DeepSeek-V2 的關鍵開發者之一——羅福莉将加入小米,或供職于小米 AI 實驗室,領導小米大模型團隊。
羅福莉畢業于北大計算語言學碩士畢業,曾任職于阿裏達摩院機器智能實驗室,主導開發了多語言預訓練模型 VECO,并在 DeepSeek 參與了 MoE 大模型 DeepSeek-V2 的研發。
知情人士透露,雷軍對小米在大模型領域的發力時間較晚感到擔憂。此次親自下場重金招募核心人才,甚至開出了千萬元級别的薪酬。
如今,雷軍将 " 天才 AI 少女 " 招入麾下,小米打的是怎樣的算盤?
大模型 " 激活 " 手機存量市場
随着芯片算力的持續提升,AI Agent 在智能手機上的應用逐漸成爲常态。通過手機底層系統級 AI,AI Agent 将在人機交互和意圖識别方面取得顯著進步,能夠更加精準地理解用戶需求,主動完成任務,并成爲用戶高度定制化的私人助理。這一趨勢将成爲品牌維護用戶群體的核心護城河。
據 IDC 預測,2025 年中國新一代 AI 手機市場出貨量将達 1.18 億台,同比增長 59.8%,整體市場占比達到 40.7%。
在這一背景下,小米面臨巨大機遇與挑戰。根據 2024 年第三季度财報,小米智能手機業務實現收入人民币 475 億元,同比增長 13.9%;高端化戰略初顯成效。然而,随着市場進入存量化階段,高端創新需求的升級讓大模型技術成爲品牌突圍的關鍵。
事實上,AI 技術早已融入智能手機的方方面面,從語音助手到影像處理,再到性能優化。但大模型的出現,爲手機 AI 能力帶來了質的飛躍。
然而,與 OPPO 和 vivo 相比,小米在大模型技術的宣傳上顯得較爲低調。雖然在影像處理、語義助手等領域有所布局,但在多模态交互與跨 App 聯動等方面的應用仍有提升空間。
輕量化和本地部署
小米集團創始人雷軍曾公開表示:" 我們做大模型的思路可能和很多公司不太一樣,我們選擇主力突破的是輕量化和本地部署。"
從成本考慮,雲側的 AI 大模型要根據調用付費,還需要巨大算力,用起來成本也很高。而端側在本地運算,如果将大部分 AI 推理場景放在端側,不僅可以更接近用戶的數據,實現更有效的訓練,同時也能夠大量節約雲端算力開支。
從用戶構成考慮,以 " 互聯網手機 " 起家的小米,用戶對于互聯網新技術的接受程度更高。用戶對于小愛同學的接受程度也更高,小米旗下人工智能助手小愛同學月活用戶數達到 1.35 億,同比增長 8.5%。
從産品方面考慮," 爲發燒而生 " 的小米手機,用戶在芯片性能、攝像頭技術、屏幕顯示等方面有着相對更高的需求,這也讓小米更傾向于推出同價位性能更高的手機,這也爲其未來部署本地化 AI 創造了條件。
此外,根據 2024 年 Q3 财報顯示,小米集團的 AIoT 平台已連接的 IoT 設備數超 8.61 億,同比增長 23.2%。被稱爲 " 雜貨鋪 " 的小米,這些海量的 AIoT 設備,輕量化、需要借助分布式算力的終端設備,目前主要依賴于雲端的 AI 能力,想要實現本地化部署,對于輕量化的需求更高。
因此,盡管端側大模型在效果上難以媲美雲端,但其在隐私保護、低延遲和成本控制方面的優勢,使其成爲小米發力的重點領域。
甚至可以說,小米是更适合發力端側大模型的企業,也是更需要發力端側大模型的企業之一。
2024 年 2 月,小米推出了基于大模型的 AISP 影像處理平台,用于解決超高倍焦段拍攝中的細節缺失問題,顯著提升圖像質量。同年 5 月,小米發布了大語言模型 MiLM,覆蓋從 0.3B 到 30B 多個參數規模,适配不同場景需求,并通過技術突破實現了端側部署。
爲了确保本地部署模型的效果,小米團隊開發了專用的硬件加速模塊,使得 MiLM 模型的運行速度提升了約 35%,同時功耗降低 20%。此外,通過創新的 "TransAct 大模型結構化剪枝方法 " 和端側量化技術,小米團隊大幅提升了訓練效率并降低了量化精度損失。MiLM2-4B 模型已在端側成功部署,爲未來更多設備的本地化部署打下基礎。
重金招攬 AI 人才:雷軍的破局之道
小米爲何選擇招募羅福莉?
在大模型之家看來,這不僅是看中她的研究能力,更是認準其研究方向與小米大模型戰略的契合度。 羅福莉曾在阿裏主導開發的 VECO 模型是跨語言理解與生成的典範,其在文本生成與風格轉換領域的研究爲智能終端設備提供了核心技術支撐。其所研究的方向,都是目前最熱門的語音和文本識别技術,而文本的識别改寫、語義的轉化,正是目前手機、平闆、PC 等移動終端、以及車機設備中,最爲常用的場景。因此,羅福莉與小米的發展重點可謂是既專業又對口。
細數小米的發展過程,每年都有一個百萬美金年度技術大獎,這是小米内部規格最高的獎項,獎勵在重大技術創新項目中做出關鍵突破的 10 人以内團隊。而這哥獎項的評選,主要遵循三個标準:技術的獨創性、世界範圍内的領先性,以及與小米主營業務的契合性。
羅福莉的加入,延續了小米招募頂尖人才的傳統。無論是爲了吸引盧偉冰、王川等行業大咖,小米多次通過收購對方創業公司實現人才引入。在技術競争日益激烈的時代,人才是成事的關鍵。
小米近年來在全球範圍内廣泛吸納 AI 頂尖人才。從美國矽谷到中國北京,從算法工程師到 AI 産品專家,小米的人才布局正在形成覆蓋全球的 AI 研發網絡。這不僅提升了小米的技術實力,也使其具備了在多個領域同時展開創新的能力。小米 AI 實驗室的研究項目數量在過去一年增長了 45%,其中多模态交互、圖像生成和語義理解成爲重點方向。
羅福莉的到來,或将加速小米在這些前沿領域的技術落地,進一步縮小與行業領先者的差距。
雷軍曾表示 , 小米将繼續加大在 AI、物聯網 ( IoT ) 等前沿技術的投入 , 力争在全球科技創新中占據一席之地。 爲了吸引頂尖人才,小米不僅提供高薪酬,還打造了開放的研發環境和多樣化的技術交流平台。此外,小米還計劃與高校和研究機構建立更緊密的合作關系,共同推動 AI 技術的基礎研究和應用落地。這種雙向合作模式,将爲小米注入源源不斷的技術創新動力。
大模型駛向智駕風口
與其他手機企業不同,小米的另一優勢便是擁有汽車業務,雷軍在 2024 年度演講中提出,通過 AI 賦能 " 人車家 " 生态,推動技術與場景的深度融合。
小米的「人車家全生态」,其中汽車領域的大模型實踐,既是體驗賦能、也是落地樣闆。 這意味着在小米 SU7 上,用戶不僅能用小愛同學深度控車,還能進行手機、移動設備,甚至是與 IoT 設備的全方位控制能力。
如今,智駕已經成爲新能源汽車領域的必争之地。理想汽車創始人李想曾表示," 大模型的研發和訓練是智能電動車企業的必要能力。" 小米的智能駕駛系統通過接入多模态大模型技術,賦能從語音交互到複雜道路環境識别的全鏈路場景。
除了基于 LLM 帶來的理解能力的升級,在自動駕駛方面,小米汽車智能駕駛系統在半年内經曆了三次重大升級,從高精地圖 + 模塊化架構到無圖 + 模塊化架構,再到如今的端到端大模型架構,追趕了友商三代研發步伐。目前,小米端到端全場景智能駕駛系統面對車位啓動、路口通行、無保護左右轉、閘機通行、超車、借道避讓、自動進入車庫、自動泊車等場景時的表現都比較流暢,展現出了 " 類人 " 的駕駛能力。
12 月 23 日,小米 SU7 宣布 1.4.5 OTA 推送,正式接入視覺語言大模型(VLM),可識别複雜道路環境和特殊交通規則,并通過語音和文字給予實時提示。同時,充電地圖完成升級,與蔚來、小鵬、理想達成充電補能網絡合作。這些升級不僅提升了用戶體驗,也展示了小米在大模型技術實際落地中的實力。
除了智能手機和汽車,小米的大模型技術還深入滲透到 AIoT 生态中。從家電控制到安防監控,從語音助手到健康管理,大模型技術正賦能每一個 AIoT 設備。雷軍強調,小米的目标是實現全場景的智能化,讓每一個設備都成爲用戶的智能夥伴。
爲了實現真正的全場景智能化,小米正加快 AIoT 設備的互聯互通進程。通過統一的 AI 框架和大模型算法,小米希望實現設備之間的數據共享和協同工作。這種創新将使用戶體驗更加流暢,并爲小米的生态系統創造新的價值。
寫在最後
招募羅福莉等頂尖 AI 人才,預示了小米在大模型賽道上發力的決心。通過手機、汽車、AIoT 生态的全線布局,小米的目标并非僅限于技術突破,而是要打造 " 人車家 " 融合的完整智能生活場景。未來,小米的成功不僅取決于技術實力,更在于能否将 AI 能力與用戶需求深度結合。
然而大模型賽道競争者衆多,挑戰同樣嚴峻。小米在技術積累和市場影響力上仍面臨挑戰,如何将 " 輕量化 " 和 " 本地部署 " 戰略真正轉化爲用戶可感知的體驗差異,并在多樣化場景中形成閉環生态,是小米必須回答的問題。
站在大模型風口上的小米,能否飛得更高、更遠?答案或許正藏在 AI 賦能的每一個智能終端中。小米與大模型的故事,才剛剛開始。