2023 年做大模型,國内更關注的是雲廠商,很少有人會注意到,硬件廠商的大模型做得怎麽樣。
例如,三星。
實際上,就連三星自己,似乎也沒那麽熱衷于大模型。
相較于其它互聯網公司的瘋狂跟進、高調發布,三星直到 2023 年 11 月才對外公布了自己的大模型産品——一個以傳奇數學家高斯(Gauss)命名的大模型。
至于在三星意在打造成下一代機皇的三星 Galaxy S24 上,并沒有看到 Gauss 的身影。
不過,Galaxy AI 還是毫無懸念地成了這代産品的代名詞。
用一個更時髦的詞來替換的話,應該是,端側 AI。
01 三星求變,大模型上線
在智能手機這個行當裏,三星一直是全球銷冠,每年出貨兩三億部手機都不在話下。
不過,2023 年對于三星來說,是運勢不佳的一年。
IDC 前不久公布的統計數據顯示,蘋果在 2023 年超越三星,成爲全球智能手機 " 榜一大哥 ",這也是蘋果首次超越三星坐上這個期待已久的寶座。
這時的三星,也就更需要一個變數。
"AI 将爲移動産業帶來深遠影響,三星也将開啓一個新的時代," 在三星 Galaxy S24 發布會上,三星電子 MX 部門總裁 TM Roh 如是說。
TM Roh 這裏提到的 AI,正是加入了雲邊協同的生成式 AI 能力的 Galaxy AI。
這樣的 AI 在三星 Galaxy S24 上第一個功能體現是「實時翻譯」。
三星是直接将實時翻譯裝進了手機通話系統中,在接打電話時,用戶可以選擇将通話語音實時翻譯成母語語音或文字呈現,這一功能被三星親切地稱爲 " 私人翻譯 "。
目前這一功能支持漢語、英語、法語、德語、西班牙語等 13 種語言實時雙向互譯。
對于國内大部分習慣了使用聊天軟件,而非電話功能的用戶,這似乎就成了一個比較雞肋的功能升級。
不過,不要緊,三星還将這一功能下沉到了本地 interpreter 軟件中,用來供國外旅遊線下問路、點餐等場景使用。
本地軟件,不是這一功能下沉的終點。
三星将這一功能進一步下沉,直接下沉到了三星官方鍵盤上,讓三星鍵盤可以直接将用戶打字内容翻譯成目标語言。
從現場演示效果來看,這樣的功能升級,要歸功于自去年興起的生成式 AI。
實時翻譯功能,主要用到的是生成式 AI 的語言處理能力。
在被三星高度重視的 S24 上,另一項用到這一能力的功能是「筆記助手(Notes)」。
在三星 Galaxy S24 的筆記助手中,用戶可以對已經寫下的會議記錄加入不同風格的個性化排版,也可以對會議記錄提取摘要。
這樣的筆記助手體驗,其實在大模型風靡的 2023 年已經十分普遍。
尤其是在國内,大部分協同辦公軟件都已經有了類似的功能,例如此前鋅産業文章中提過的釘釘魔法棒,騰訊會議、字節飛書也都上線了類似功能。
如果說有什麽不一樣的話,那應該是另一個應用了生成式 AI 圖像處理能力的「Circle to Search」功能,翻譯成中文就是「即圈即搜」,這實際上是一次對搜索功能的優化。
也是谷歌爲 Android 機帶來的一個搜索功能升級。
以往用戶對搜索引擎的使用,往往是基于文字搜索,即便是基于圖片搜索,也是直接上傳圖片,通過圖片對比,搜索同類圖片。
這次,在谷歌新新研究出的「Circle to Search」功能中,用戶可以在手機上各類應用中圈出感興趣的元素或内容,直接進行搜索。
在三星 Galaxy S24 上的使用方法是,長按 home 鍵喚醒這一功能,然後圈出要搜索的元素進行搜索。
這樣的搜索功能,顯然吸取了以往應用在智能手機中的拍照搜圖的靈感,但經谷歌之手,直接在移動端的搜索引擎上進行功能升級後,鋅産業認爲,這樣的新搜索功能更接近用戶在成熟應用繁多的移動生态上的搜索習慣。
值得注意的是,上述這些 " 端側 AI" 能力,實際上均來自谷歌 Gemini。
02 GPT-4 的終極對手
2023 年 12 月 7 日零點過後,谷歌在官方公号上發布了一篇推文,就這樣,谷歌 Gemini 正式亮相了。
谷歌 CEO Sundar Pichai 說,"Gemini 分爲 Ultra、Pro、Nano 三個版本,是我們迄今爲止最強大、最通用的模型。"
當時谷歌官方公布的測試結果顯示,Gemini Ultra 在文本、推理、數學、代碼幾個領域的表現,已經遠超 OpenAI 的 GPT-4。
在多模态能力方面,Gemini 在圖像、視頻、音頻幾個領域的表現,更是全面碾壓 GPT-4V。
正是因爲 Gemini 測試數據的突出表現,尤其是其亮眼的現場演示視頻,Gemini 在發布後一度陷入 " 造假 " 風波。
對此,谷歌官方随後也做出了解釋:視頻中的輸入和輸出數據是真實的,隻是出于演示簡潔目的,剪輯了延時的等待時間。
不過,這并沒有影響 Gemini 成爲堪比 GPT-4 的頂級大模型,Gemini 也被認爲是 GPT-4 最強勁的對手。
這其中,Gemini Nano 是用于端側 AI 的大模型,首款搭載 Gemini Nano 的,是谷歌去年發布的 Pixel 8 Pro。
在 2023 年 10 月的 Made by Google 大會上,谷歌曾在 Pixel 8 Pro 上展示了不少基于生成式 AI 的功能,當時谷歌用在這款手機上的大模型還是未升級的 Bard。
即便如此,谷歌依然在 Pixel 8 Pro 上實現了類似 Bing AI 的對話式搜索,可以基于本地諸如 Gmail、YouTube、谷歌雲盤、谷歌地圖等應用中獲取的信息,爲用戶生成出行計劃、旅行計劃等内容。
甚至還将谷歌鍵盤 Gboard 進行了一番改造,推出了 " 智能回複 " 功能。
可以說,正是 Pixel 8 Pro 的順利上市,讓三星得以将這一盟友在端側 AI 的技術複用到了這次發布的三星 Galaxy S24。
初代 Galaxy AI,谷歌 Gemini 至少有一半的功勞。
03 三星高斯慢半拍
2017 年,尚且籠罩在 Galaxy Note 7 爆炸事件陰影中的三星,着手加緊對人工智能相關技術的研究。
這年年底,就傳出了三星計劃成立人工智能研究中心的消息。
當時 CNBC 報道稱,這一研究中心橫跨三星電子的移動和消費電子業務兩大部門,爲的正是以人工智能這一技術創新,推動以手機爲主的消費電子設備的商業創新。
也是在這一年,三星特别爲人工智能技術做了一場規模不小的活動,請了十幾位大學教授和知名企業、研究機構的研究人員來分享人工智能最前沿的成果,這就是 Samsung AI Fourm。
這一論壇,後來一直延續到了今天。
就在兩個月前,在 Samsung AI Fourm 2023 上,三星電子 CEO Kye Hyun Kyung 在開幕式上分析稱:
"2023 年,大家已經将目光聚焦到了生成式 AI 上,以大語言模型爲代表的生成式 AI 技術正在重塑世界,但隐私、幻覺等問題依然存在。"
生成式 AI 的出現和随之而來的問題,是一個新技術周期的起點,尤其是這項技術中讓科學家們束手無策的不可預測與不可控性,科學家們最終隻能将生成式 AI 歸結爲 " 智能湧現 "。
另一個更微妙的産業背景是,經過 2023 年一年的百模大戰,生成式 AI 已經從技術競賽邁入到了産業落地競賽階段。
這其中尤以 1 月 10 日 OpenAI 應用商店—— GPT Store 的推出最爲代表。
正是在這樣的背景下,三星在這個一年一度的 AI 論壇上,也對外公布了自己的 AI 大模型—— Gauss。
和大多數大模型類似的是,三星 Gauss 同樣強調三項能力:自然語言、代碼編寫、圖像處理。
三項能力分别對應的是三星 Gauss 的三個模型:Gauss Language、Gauss Code 和 Gauss Image。
作爲三星研究院一款自研大模型,Gauss 首先被三星用到了公司内部,例如通過 Gauss Language 來輔助員工簡化編寫電子郵件、工作總結和編譯内容等工作。
目的是爲了看看,現在的大模型究竟能不能提高工作效率?又能提高多少效率?
另外,也是要在内部使用過程中,發現問題、解決問題,進而優化軟件功能,在産品商業化之前盡可能地将模型優化到位。
創新技術内部使用、内部先消化一段時間,是互聯網公司一貫的技術驗證手段,尤其是對于軟件技術。
至于 Gauss 的商業化,三星官方當時解釋稱,三星會在 2024 年将 Gauss Language 陸續應用到商業化産品中。
銷量觸頂、亟需新意的智能手機,自然也成了 Gauss 附魔的對象。
然而,從發布會上公布的信息來看,鋅産業并沒有看到本該出現的 Gauss 的身影。
盡管如此,三星依然十分看好大模型帶來的這波紅利,不僅在發布會現場大談 Galaxy AI,TM Roh 甚至還做出了兩個預測:
第一個預測是,Galaxy S24 系列手機将實現兩位數增速,三星重回全球第一;
第二個預測是,生成式 AI 功能,預計将幫助全球智能手機市場實現觸底反彈。
大模型,成了三星爲智能手機押注的變數。
那麽,從「智能手機」到「AI 手機」,什麽才是劃時代的變化?