又是被 AI 轟炸的一周。除了蘋果「放棄造車」的大消息,這周全球科技行業的焦點還是集中在 MWC24 大會上,在巴塞羅那現場的雷科技報道團也帶來了全方位一線報道,您可以在雷科技網站或微信點擊 "MWC · 現場 " 回顧所有内容。
和之前預料的差不多,AI 成了這屆 MWC 大會的重中之重,各式各樣圍繞 AI 進行設計和産品定義的硬件設備,更是現場最受關注的品類之一,甚至就連在場外,蘋果放棄造車據傳也是因爲戰略重心轉向 AI。
但說回 AI 相關硬件,除了 AI 手機、AI PC,過去一年最受關注和期待的産品應該就是以 AI Pin、rabbit r1 爲代表的獨立 AI 終端,按照計劃,它們都将在今年 3 月、4 月正式發貨——在宣布放棄傳統智能手機新項目 All in AI 時,魅族曾提到這兩款 AI 新物種,不過魅族認爲這兩款 AI 新物種都不夠完美,因此魅族要做更好的 AI 終端。2 月 29 日晚魅族将新發布的魅族 21 Pro 定義爲 "AI 入場券 "。
那麽 AI Pin、rabbit r1 體驗到底如何?1 月,雷科技 CES 報道團曾深入聊過 rabbit r1 這款全新形态的産品,而在本次 MWC 現場,我的同事「一位天明」就在高通展台體驗了聽聞已久 AI Pin,結合他的分享,我們對 AI Pin 這款産品有了新的認識。
圖片來源:雷科技報道團現場攝制
了解過 AI Pin 的讀者應該知道,AI Pin 是一款沒有屏幕的獨立穿戴設備,搭載了高通骁龍八核芯片,通過 eSIM 支持網絡連接,不依賴于手機或者其他個人終端,将語音作爲核心的交互方式,但其實還支持激光投射、手勢以及觸摸(機身表面)三種交互。
不過總的來說,AI Pin 最主要的使用方式還是「對話」。就像手機或者智能音箱上接入大模型的 AI 助手一樣,用戶可以問各種問題來獲取所需信息,還支持 50 種語言的實時翻譯,可以将用戶的語言實時翻譯成另一種語言,或是将他人的語言翻譯成用戶的母語。
圖片來源:Humane
AI Pin 雖然沒有屏幕,但也是有圖形用戶界面。當用戶需要查看信息的時候,AI Pin 可以通過内置的單色激光投射到手掌上浏覽,同時支持手勢交互,通過手指的點按進行導航。The Verge 記者還指出,AI Pin 的手勢比他想象得更加流暢和靈敏。
這在很大程度上可能受益于 AI Pin 對視覺大模型的關注。AI Pin 搭載了一顆廣角攝像頭,當然不是爲了拍照,核心是成爲 AI Pin 的「眼睛」,并利用大模型了解攝像頭捕捉的畫面,比如在 MWC 現場就能「看到」這是一個人聲鼎沸的會場,或者對面人的穿着打扮。
另外值得一提的是,AI Pin 的穿戴設計可能是最容易被忽略的地方之一。打造 AI Pin 的 Humane 公司之所以将其設計成挂在胸前的設備,核心還是爲了讓 AI Pin 擁有更接近用戶第一人稱視角,可以「觀察」用戶看到的現實世界。
這也是很多人對于 AI Pin 最期待的地方。
回想一下,OpenAI 去年發布 GPT-4 的時候,就特意演示過讓 GPT-4 通過照片了解冰箱裏的「材料」,并以此給出一份合适的菜譜。理論上,通過視頻獲取的信息密度遠高于照片,而「看我所看」的 AI Pin,确實有潛力成爲真正意義上的「AI 助理」,一個能看不能動的「具身智能」。
AI Pin 也不是第一款想通過機器視覺技術來解決人機交互問題的設備,早在 2012 年 Google 就推出了 Glass,後來國内的百度跟着做了一款智能眼鏡百度 Eye,它們當時的故事是視覺搜索,用戶戴着眼鏡就能 " 指哪打哪 ",然而受限于硬件算力、深度學習算法的智能水平、續航以及網絡,智能眼鏡并未取得成功,成了先烈,不過,它們在這一階段的探索也給後來的 AR 眼鏡等相對成熟的品類奠定了基礎。
圖片來源:Google Glass
大模型時代 AGI(通用型人工智能)有了更強的感知能力,同時也具備了理解與模拟真實世界的能力,基于此擁有真正的認知能力。在此基礎上,AI 硬件被寄予厚望,AI Pin 也是希冀用新一代 AGI 技術來實現 Google、百度們探索失敗的智能視覺交互。
圖片來源:Open AI Sora
然而,目前視覺大模型方面的技術還難以支撐識别萬物,AI Pin 通過攝像頭了解到的現實世界信息還很有限,視覺交互在短期内很難做到完全可用。
續航也是一個問題。AI Pin 采用了分體式的設計,由一個 AI Pin 本體和一個通過磁鐵連接的無線充電寶(他們叫做 Battery Boost)組成,Humane 公司還專門設計了熱更換的電池以延長續航時間,但就算是總的續航時間,也停留在「輕度負載能堅持大半天」的水平。
而這還是建立在少用或者不用激光投射的基礎上,畢竟激光在這樣一個小型設備上确實是非常耗電的。
還存在算力的問題。據雷科技了解,AI Pin 采用了混合模型,設備本身的算力極其有限,端側模型隻用來處理語音識别以及基本操作等需要快速響應的請求,更多的處理還是交給雲端模型進行處理。但雲端處理就必然涉及到連接和延遲問題,還要再加上模型生成的時間,在 MWC 現場的演示中,AI Pin 往往就需要等待好幾秒才能給出回應。
對于語音交互來說,無疑是很糟糕的體驗。更何況,語音交互還存在嚴重的局限性,網友當年對錘子 TNT 的群嘲都還曆曆在目。
當前,AI 硬件的重點攻克方向就是端側算力的提升,除了給終端裝配更強大的 AI 芯片外,在 MWC24 上聯發科甚至展示了 " 多設備共享算力 " 技術——即讓 A 設備可将閑置算力共享給 B 設備來進行大模型等巨量計算,然而這樣的計算模式又需要新的邊緣側網絡技術的支持,有挑戰,也有機會。
「手機能做的,AI Pin 都能做。」Humane 的工作人員在現場講解時提到,AI Pin 的終極目标是取代手機。
但 AI Pin 真的可能取代手機成爲下一代的個人計算平台嗎?恐怕沒有多少人相信,不管是在現場的雷科技編輯,還是 The Verge、DIgital Camera World 在内的媒體明确指出自己的質疑,包括語音交互的局限性,算力、隐私與體驗之間的權衡,以及大量具體到産品體驗的實際問題。
更何況,這是一款售價高達 699 美元(約合人民币 5029 元)起的設備,有網友就吐槽得好,「有這錢爲什麽不換個好點的手機。」
事實上也是,AI Pin 能做的,理論上都能通過手機做到,并且考慮到更強大的算力、屏幕和軟件生态,手機大概率會做得更好,這也是包括 rabbit r1 在内所有獨立 AI 終端所面臨的挑戰。
不過也要承認的是,受限于設計和形态,手機很難像 AI Pin 一樣挂在胸前,很方便就能讓機器「觀察世界,回答一切」,這其實也是可穿戴計算設備一直備受追捧的一個重要原因,單單是從口袋拿出 → 解鎖 → 呼出相應界面,這幾步就能制造足夠的「摩擦」,勸退用戶随時随地「召喚」AI 助理。
從這個角度來看,手機相比 AI Pin 或者 Vision Pro 這類穿戴設備确實存在天然的問題。所以 AI Pin 的成功或失敗其實不重要,更關鍵的問題可能是:
可穿戴的 AI 終端能不能在手機全面 AI 化的未來找到生存的空間,甚至在技術的進一步突破之後,成爲下一代個人計算平台?
這當然還是一個沒有答案的問題,但可以相信,一定會有人和廠商繼續沿着這條路進行探索,而 AI Pin 正是這樣的一次探索,哪怕 AI Pin 像 Google Glass 一樣一敗塗地,但它至少點燃了一團 AI 硬件的星星之火,包括榮耀、OPPO、三星、魅族、小度、Rabbit 在内的越來越多廠商正在 AI 硬件的路上,勇往直前。