一年之前,一個足以改變世界的産品—— ChatGPT" 橫空出世 ",這款由人工智能技術驅動的自然語言處理工具能夠基于在預訓練階段所見的模式和統計規律,來生成回答,它讓人們認識到,生成式 AI 已經進化到了可以像真正的人類一樣來聊天交流,并完成相應的工作。
在接下來的半年各類生成式 AI 工具如雨後春筍般的大量出現,不過對于對前沿技術沒那麽敏感的大多數人而言,它還是一個有門檻且小衆的新鮮玩意兒。但當半年前,國産手機品牌也宣布要在未來産品中集成端側大模型 + 雲端大模型時,作爲相關從業者的我着實的感覺到 " 未來 " 已來。
但當第一批手機品牌開始公測大模型後,我發現這些大模型大多數隻能看作是 " 詢問型機器人 ",它們隻集中在各家的語音助手中,本質上和下載一個第三方 App 的區别也不大,可我理想化的手機與大模型的結合場景,應該是将 AI 分布在系統的方方面面," 分布式 " 的去調用它的各項功能。
從大模型出現在 PPT 中,到實際有相對成熟的産品落地,大緻總共經曆了三個階段發展。
第一個階段:起 " 點 ":比如起了個大早的小米和華爲,是第一批宣布要在旗艦手機中公測内置大語言模型的,并且都是用内置的語音助手:小藝、小愛同學來搶占先機,這類大模型主要是通過獨立對話框輸入指令來完成操作,之後通過模型 API 接口來調動手機中應用,你可以丢給手機助手一份文檔,讓其幫你整理大綱或潤色,或者幫你生成風格化的文案。
第二個階段:連 " 線 ":利用大模型來提升某一操作效率和準确度,這類模型終于能夠 " 融入 " 到一些場景中。榮耀最新的 MagicOS 8 中,通過任意門一拖一拽,之後拖拽的内容就會結合背後的 " 魔法大模型 " 來 " 預測 " 用戶下一步操作,進而在旁邊顯示應用圖标;vivo 的文生圖以及圖片的二次創作,也是基于大模型的功能延伸和發展。
第三個階段:成 " 面 ",我認爲這是手機端側大模型的完成體,即以大模型爲核心的智能操作系統,這類 AI 會 " 神不知鬼不覺 " 地嵌入到手機系統中,用戶甚至都不知道手機的哪部分功能是調用了給予大模型的 AI 來實現的。它就像是你的 " 私人管家 ",目前在這方面做的比較好的是 OPPO,而在 18 日舉行的三星 Galaxy S24 系列新品發布會上,我們也看到了這種苗頭。
圖源:三星
在發布會開始,三星移動部門的負責人 TM Roh 就表示:" 這股 AI 創新力量将會賦予我們每個人創造和探索的能力,推動我們将夢想變爲現實。" 這也是整場發布會上三星手機最大的亮點,那麽内置了 Galaxy AI 的三星 Galaxy S24 系列,究竟能否成爲一名合格的 " 私人助理 " 嗎?
這次不客觀實驗室提前拿到了 " 小尺寸旗艦 " ——三星 Galaxy S24,在正式評測之前,我們先來讨論一個問題:" 未來集成 AI 大模型中端的設備,到底應該做到多大?" 畢竟現在手機的尺寸越來越大了。
我認爲,在未來大模型一定是爲場景需求提供解決辦法的設備,它需要做到非常方便地随拿随用,比較好的例子就是近期特别火的,由 TE 設計的 Rabbit R1,憑借僅有 BP 機大小的體積和新穎的造型在 CES 上迅速出圈,這款設備僅有一塊 2.88 英寸屏幕外加一個翻轉鏡頭,拿在手裏非常小巧,三星 Galaxy S24 雖然沒有達到 Rabbit R1 這樣袖珍的體積,但作爲爲數不多的 " 小屏 " 手機,在一衆闆磚旗艦中絕對是一股清流。
圖源:lzh 攝
6.2 英寸屏幕大小、僅 147.0 x 70.6 x 7.6mm 三維尺寸、167g 的重量,它比手中的 iPhone 15 Pro Max 薄足足輕了接近 70g,把三星 Galaxy S24 拿在手裏會有一種久違的輕盈感。
而在做工方面絲毫不用擔心,三星産品的質感總能讓人放心,邊框采用了目前 " 流行 " 的钛金屬材質,邊框與 iPhone15 的設計幾乎相同,S23 那種與背闆結合處 " 割手 " 的問題不複存在,同時正面爲康甯大猩猩 Victus 2,我的建議是如果你平時對手機用的比較自信的話,可以直接裸機使用。
圖源:lzh 攝
這一代三星依舊采用了獨家定制版的第三代骁龍 8 移動平台,這款芯片頻率更高超大核可達 3.4GHz,爲了達到最佳散熱效果,S24 的散熱闆面積要比上代面積高出 1.9 倍,能在高散熱效率穩态下,爲處理器 AI 算力提供持續穩定保障。
圖源:lzh 攝
高性能處理器是手機流暢運行端側大模型的 " 基底 ",對體驗起到決定作用的。則是淩駕處理器之上的軟件系統部分,就像前文中提到的,移動終端發力端側大模型的第三個階段,是從第二階段的專注某個領域中的 " 線性 " 發展到爲服務整個系統的 " 面 ",如果簡單概括 "Galaxy AI",它就是這樣服務于整個系統的底層 AI 軟件體系。
需要事先說明的,這次 "Galaxy AI" 中的各個功能接口都做了本地化适配,不用擔心聯網問題,在響應速度上,延遲也非常小,可以忽略不計。目前 "Galaxy AI" 有且僅有提供的功能基本覆蓋了電話、短信、拍照、記錄這樣最爲底層的使用場景。
使用一段時間後,不難看出三星對于手機端側大模型應用的思考:利用大模型爲底層功能賦能。
這與其他手機品牌端側大模型不盡相同,并不能簡單直接地說孰優孰劣,但是底層邏輯就完全不同,三星 "Galaxy AI" 更多承擔了 " 私人助理 " 職責,比如我最喜歡的寫作助手功能,隻要在打字中使用三星鍵盤打字,就可以把文字輸入内容轉換爲多種使用風格。
圖源:三星系統截圖
這項功能意義在于,如果我恰巧今天心情不好,但又要使用 " 愉悅 " 風格,這時候隻需要點擊輸入法頂部左邊的小星星,就會彈出風格改寫 / 拼寫和語法選項,之後就可以在出現的五種風格外加表情符号中進行快速切換。如果需要輸入很長一段文字,但又來不及細看檢查,就可以直接調用選拼寫和語法選項。
以上場景其實還是有一定使用局限性,比如隻适合及時消息回複,而對于多數場景而言,還不算非常 " 智能 ",要想 " 榨幹 "Galaxy AI 文字極限,在我看來可以通過一套 " 文字組合拳 " 功能進行組合,進而提升辦公效率。
圖源:三星系統截圖
比如對于我這樣有和産品經理對話工作需求的用戶,通常在線上訪問時需要錄音,雖然目前很多軟件都有錄音直接轉文字服務,但大多數都需要單獨下載 APP 導入音頻和購買轉寫時長,而借助 Galaxy S24 中的轉錄助手功能,不僅能實時轉錄成爲文字,還能分辨出發言人,之後直接複制粘貼到筆記助手中,就可以直接利用歸納功能進行整理。
圖源:三星系統截圖
此外在一些大型展會上,訪問對象通常都是外國人,如果像平時就需要啓動同聲傳譯軟件,室内網絡信号不佳,很有可能會錯過重點造成溝通障礙,而借助端側的翻譯助手,就可以實現類似對講機的方式進行離線翻譯,而從翻譯效果來看,也更接近 " 人話 "。
以上這些功能相當于一個 " 私人助理 ",能夠從一定程度上提升使用手機的溝通效率,但如果 Galaxy AI 隻局限在如何提升辦公效率,那你就太小看大模型了。消費者使用手機不僅局限在文字辦公場景,在影像越來越 " 卷 " 的今天,使用手機拍攝也是 AI 一大重要應用場景。
這次三星 Galaxy S24 标準版上的影像硬件配置中規中矩,後置三攝,分别搭載了 1200 萬像素超廣角鏡頭、3 倍光學變焦的 1000 萬像素長焦鏡頭以及支持光學防抖的 5000 萬主攝,不管是硬件配置還是最終成像質量,雖然不能和這些采用超大底的國産旗艦手機來比,但借助 Super HDR 功能的提前預覽,能夠 " 所見即所得 "。
從拍攝的一些樣張中不難發現,三星樣張的整體色彩飽和度并不算高,邊緣過渡自然,且在影調上也沒有刻意強調冗餘的光線,走了一條任何人都覺得不偏不倚的風格,整體比較耐看。
圖源:lzh
圖源:lzh
圖源:lzh
不過話說回來,在回看這次出差拍攝的圖片時,發現讓同行拍的圖片那叫一個 " 慘不忍賭 ",好不容易找到了一張有自己人像的照片,構圖簡直是災難級别,不僅人像非常小,酒店門口還有别人的行李箱,對于這樣 " 災難照 ",如何來進行修補?
圖源:lzh
如果想要看得舒服些,其實隻要把身後行李箱 P 掉,之後适當放大人像即可。但對于不會修圖的普通人來說,這事兒說起來容易做起來難,拜托别人又費時費力搭人情,而這時候借助 Galaxy AI 中的修圖,長按人像、放大、點擊行李箱、徹底删除一氣呵成。
圖源:lzh
圖源:lzh
當我出差回來落地北京後,走在廊橋中發現飛機機翼後邊映襯的晚霞非常好看,于是立馬舉起手機抓拍了一張圖片,可回家查看時發現飛機稍微有點歪,要像以往調整角度的話,會 " 裁切 " 掉一些周圍場景,顯得不完整。而通過生成式編輯功能,就可以在不裁切邊角爲前提下,通過 " 智能填補 " 來調整到角度。這時你就可以點擊編輯照片中旁邊的星星圖标,一鍵生成 " 填補空位 ",可以看到整體填補效果還不錯,機翼的識别也相當準确。
圖源:lzh
圖源:lzh
從這些 AI 體驗中不難看出,不管是修改文字風格的寫作助手,還是提升采訪效率的轉錄助手,再到填補圖片空缺的生成式編輯,這些功能雖然乍一看微不足道,但因爲有了大模型的賦能,讓這些早就存在于手機中的基礎編輯功能在使用效率和便捷度上都得到了質的飛躍。
最關鍵一點就是這些功能沒有用被嵌入一個全新的 " 殼 " 裏,它沒有令人摸不着頭腦的複雜的界面,也沒有免費時長限制,不需要額外充值,隻要用戶之前有操作手機的經驗就能輕易上手,不需要用戶付出額外的學習成本就可以體現出 AI 最大的價值,而才是手機端側大模型的意義。
三星 Galaxy S24 系列正是通過最簡單的應用場景,來印證了不需要華麗的 APP 界面就能讓用戶感受到智能 AI 的存在,畢竟之前有位前媒體前輩曾經說過:" 科技,就是讓你感受不到科技的存在。" 現在我們也可以說:"AI 的終極形态,就是讓你感受不到它的存在。"
手機端側大模型技術的繁複演化與維護成本,是創新者需攀登的高峰,且大模型安全性的守護,猶似握在手中的達摩克利斯之劍,一面指向便捷高效的未來,一面則警示着潛在的風險。
因此,手機大模型的革新之路,是探索人性與科技和諧共生的哲理之旅,這需要不斷在權衡、突破與堅守中找尋那個微妙而深遠的平衡點。
圖源:lzh
不過,在手機端側大模型百花齊放的今天,我們大可不必這樣杞人憂天或過于追求 AI 真理,馬上就要迎來中國人一年最重要的春節了,過年回家的你不妨拿起手機,教教平時嫌修圖麻煩的媽媽來使用 AI 修圖功能,讓不善于情感表達的爸爸使用寫作助手來發一條朋友圈,這才是端側大模型實際落地的别樣風景線。