圖片來源 @視覺中國
文 | AR 研究媛
勢和時
2022 年下半年,如此慘淡的經濟和投融資大環境,幾家 AR 初創公司在中國融到了動辄千萬美金的融資,仿佛 2016 年、2017 年的泡沫盛世再現。
資本眼裏,智能手機出貨量跌到甚至不如 10 年前,巡視一圈,消費電子接力棒大概率隻在 VR 或者 AR。
而 VR 天花闆非常明顯,因爲 VR 在戶外不安全,臆想以 VST 攝像頭來實現環境透視注定不如雙眼,它有延遲,也不能快速對焦,強烈環境光下還有圖像噪點和過曝的問題。VR 打造視覺沉浸完全包裹式的設計,悶且重的頭盔形态即使能改進,它更偏靜态、肢體活動範圍更固定,應用場景注定有限。體感遊戲機幾乎是 VR 商業化的全部想象力。
相比之下,AR 新建了一個真正數字化的三維空間,這個空間以高透光、可視化的真實空間爲基礎,跟你的日常生活息息相關,未來你無時無刻都要置身其中。而且理論上 AR 可以包含 VR,隻要鏡片透光率降低到 0,就切換到完全計算機生成的虛拟視覺沉浸世界。
To C,工作、生活、學習、娛樂,AR 可以帶來獨一無二的虛實交互新奇體驗;To B ,工業檢修、園藝遊覽、遠程指導、醫療培訓、戰場信息透視和增強 ... 空間通過數字化的視覺改造和增強,輔助以語音、手勢、指環 / 肌電交互,提升效率,提升生産力。
以傳言中蘋果 MR 頭顯主推「空中打字」功能爲例,理想狀态下,你眼前随時随地可以「開啓」一個高清顯示屏,環境中再投影出一副虛拟鍵盤,高精度傳感器識别手指敲擊和鼠标拖拽等精細動作,在星巴克坐着你可以一邊喝咖啡一邊在小桌子上虛拟敲擊投影鍵盤,空間映射浏覽網頁、編輯文檔和修改 PPT 等操作,就實現了真正的 AR 辦公。一副輕便 AR 眼鏡足以替代筆記本電腦的日常高頻應用。
AR 讓你眼前整個世界變成可直觀可抽象,可靜态可演繹,可以深度增強和改造的,潛力巨大。
但是 AR 太難了。
微軟 Hololens 和 Magic Leap 展示了什麽
全功能 AR 眼鏡微軟 Hololens 1/2 、Magic Leap 12,兩家有充足的資金和智力資源公司,都被迫從 to C 轉向 to B,我們可以從中窺視 AR 難度在哪。
成像上,LBS(激光掃描)和 LCoS(矽基液晶)光引擎可以調制和投射出 1080P 和 2K 分辨率色彩表現較好的畫面,但是功耗和體積很難縮小,亮度也上不去。超小體積、超低功耗、超高亮度 Micro LED 光引擎是未來,但 AR/VR 目前基于單片集成工藝的 Micro LED,一是無法在源生發光材料層面做 RGB 正常彩色顯示,隻能依靠棱鏡合色、量子點轉色、像素垂直堆疊等工程化方法。二是紅光 LED 在 LED 芯片尺寸縮小到 5-10 μ m 左右時,發光效率急劇降低,無法兌現理論上的低功耗高光效,還需要持續探索紅光 LED 新的材料和芯片結構方案。
光學顯示上,衍射光波導輕薄、高透光,能看到自然環境,搭配其他技術還可實現環境光可調,大大增強了 AR 眼鏡的實用性。衍射光波導也一直在提高光效率,擴張水平和垂直方向 FOV,增大 eyebox,消除彩虹紋,實現更好的色彩飽和度和色彩還原,呈現更幹淨更真實畫面。但模拟人眼最自然透視三維空間環境,虛拟視覺疊加到真實環境,會遇到 VAC 視覺輻辏調節沖突、多重景深、黑色視覺遮蓋等難題,衍射光波導方案目前無法解決。這意味着光波導眼鏡長時間佩戴一定會有或輕或重的眩暈和不适感,AR 畫面與真實環境無法做到 100% 的視覺融合。Magic Leap 曾花費了極大精力、資源、多年研發的獨有技術 FSD(光纖掃描顯示),以期待實現多重景深和類光場顯示最符合人眼習慣的效果,終是黃粱一夢。
AR 眼鏡最重要虛實融合功能,微軟 Hololens 或 Magic Leap 的傳感器和定制芯片數量衆多,它們有多個 RGB 攝像頭來進行手勢識别,以及實現 SLAM 三維空間定位和建圖,一個或幾個紅外相機用來眼球追蹤交互和畫面渲染。最近一兩年的技術升級方向,用 SPAD sensor 的消費級激光雷達 SLAM 精度能更高,以 event camera 來實現眼球追蹤,畫面渲染功耗和延遲都能明顯降低,還有更好的 RGB 攝像頭和手勢識别算法,或者更直接的肌電交互,都是可見的技術方向。但這些傳感器如何小型化、低功耗,高度精密整合到一副輕量化眼鏡上,進展非常有限。
全功能一體式 AR 眼鏡在現有技術條件下,笨重的頭盔形态,1-2 小時的續航,應用場景被限死在工業和企業端。
相比之下,VR 這一類多爲頭盔形态,源于它完全做一個計算生成的虛拟世界,要隔絕現實物理世界打造沉浸,大 FOV 并且隔絕外部視線,光學設計是 VR 體積做不小的關鍵原因。而功能完全的 AR,難度更高。AR 光學不是計算機生成的平面二維,真正的三維空間做虛拟視覺、交互和動态演繹,對傳感、計算、對光學要求是全方位環環相扣超高難度,現有技術條件下隻能做取舍。
AR 太依賴光學、顯示、高精度的 SLAM 和新型交互傳感器、專屬算力芯片和算法的進步,還必須牢牢限定在極低功耗和極小體積的前置條件上。更進一步,消費級 AR 眼鏡最好做成普通眼鏡的重量和體積,終端市場才能最大限度接受它。
出路在哪?
國内 Rokid 領頭,從 Air 到 Max
消費級 AR 現階段大多是妥協式産品方案,拿掉本地算力、電池和存儲,沒有傳感、手勢識别和交互,隻有最靜态的虛實畫面融合。
分體式主打 C 端的 AR 眼鏡,得益于近些年高亮度高飽和色彩 Micro OLED 微顯屏成熟,關鍵廠商索尼和視涯均實現了矽基 Micro OLED 高良率量産并且成本降低,這給 BirdBath/ 自由曲面原理的 AR 眼鏡帶來了質變。BirdBath 眼睛目前顯示效果突出,在虛拟大屏觀影、遊戲、辦公上實現了場景突圍,從 2021 年底到 2023 年年初,Rokid、雷鳥、Nreal,乃至後面的華爲、魅族、中興、榮耀,正把 AR 觀影市場一點點做起來。
同時進行的,單色 Micro LED+ 光波導 + 輕量 SLAM 主打信息提示的 AR 眼鏡,INMO、小米、李未可、OPPO 也在消費市場投石問路。
3 月 21 日晚 8 點,守在電腦前全程看完了 Rokid 的發布會,個人感覺從 2021 年年底 Rokid Air 面世到 2023 年 Rokid Max,除了虛拟投屏尺寸增大,進步完全是乏善可陳。以下是根據發布會産品内容的幾點推斷:
1. 投屏尺寸做大,依賴采購索尼更高規格的 Micro OLED 微顯屏
2. 近眼顯示光學設計有短闆,倚靠供應鏈廠商,缺乏深度設計能力
3. 根據眼鏡頂部的厚度判斷,Rokid Max 光機大概率沿襲了上一代 Air 小 eyebox 和很短的出瞳距離,讓 IPD 設計難度增大。IPD 适配出問題導緻雙眼合目容易出現重影,短出瞳距離導緻 VAC 視覺調節眼球輻辏沖突更明顯,長時間佩戴眩暈和不适加重
4. 關鍵的光學模組 MTF 參數,從畫面邊緣到中心的畸變矯正沒有披露,減小色差、過濾炫光和雜散光的光學設計改進也沒說明,這兩項十分影響真實的畫面顯示質量 。唯一的光學介紹居然是類似 Nreal Air 減少正面漏光注重個人隐私的「墨鏡」設計。
5. 發布會演示的靈境,創作時的交互精度、用戶學習成本、實用性、體驗存疑
6.Rokid Max Pro 以黑白化周圍環境來對比凸顯彩色視覺增強信息,毫無技術含量可言,甚至是一種倒退
Rokid 的問題在哪
總以黑色衛衣示人的 Rokid CEO,特立獨行風格 Rockie,但這隻是表象。
Nreal 和 Rokid 兩位創始人都是海外歸國的年輕極客創立的,但是兩人的專業背景和産品方向并不同。
Nreal 的創始人徐馳曾在 NVIDIA 參與過新一代 GPU 計算平台的研發,而後加入 Magic Leap,負責頭部跟蹤定位算法實現及嵌入式優化。Rokid 創始人祝銘明 UC Berkeley 博士畢業,成立猛犸科技被阿裏全資收購,在阿裏 M 工作室主要負責深度學習,視覺和自然語言處理的研發。
媒體描繪徐馳的時候,并沒有像祝銘明那樣「天馬行空的技術理想和熱情」,更偏務實、理性,對産品、技術、商業理解更「結合」:
" 我很慶幸自己在浙大畢業後,沒有因爲一時沖動而創業。和身邊的朋友們一樣,我們大多懷揣着創業夢想。于我而言,當認清自己的缺少工作經驗的現況下,我決定在工作中一邊學習一邊積累,再去尋找合适的發展方向。"
"我最初的想法也是極其單純、幼稚、甚至偏理想主義的,但這是一個避免不了的狀态,每個創業者都會經曆這樣的一個理想到實際的落地過程,這些都是很正常的。"
"其實我隻是把技術和市場對接起來,因爲這樣會吸引越來越多優秀的人才回國,大家才能一起将事業做大做強。"
相比之下,祝銘明掌控的 Rokid 這家公司的整體風格,比較矽谷範,精英味道比較濃,大把的融資可以造。官網産品内容和出街的營銷素材就能看出來,品牌視覺比較突出,壞處就是不夠落地,不夠「本地化」,不夠完全瞄準用戶。
" C 端産品在當前階段不足以代表整個 Rokid "
"務必去感受一下公司一樓的展陳設備,那也是能代表 Rokid 的東西(AI、AR 技術與博物館放在一起)"
"我們是一家做人機交互的公司。"
Rokid 做的東西确實有點寬,從 AI、音箱到 AR,AR 眼鏡也是先切企業場景,衆所周知企業和政府事業單位的 AR 眼鏡都瞄特定場景,也并非高頻使用,追求産品功能性,勝于日常體驗。Rokid Air 就是這樣一個有強烈的工業設計風格,有技術細節偏執,但是不注重整體體驗和欠缺一定 C 端産品思維的産物。
主打觀影的 BirdBath 眼鏡,追求的應該是近眼顯示最舒服的設計,這要求一定的适眼距即光學設計上把出瞳距離做大,以及大 eyebox 可以最大限度地保證佩戴眼鏡的靈活度。還有更注重矯正畫面邊緣的畸變和色差,呈現最好的顯示質量,這意味着要将鏡片模組的 MTF 值做好,在細節要害之處,比如光引擎投射光調制和光學鏡片鍍膜上深度研究。
但上一代 Rokid Air 的出瞳距離、eyebox 兩項指标,相比 Nreal Air、雷鳥 Air / Air 1S,居然是最小的。鏡頭 MTF 值,也是最差的。
這一代 Rokid Max 發布會凸顯的居然是近視可調功能和減少正面漏光的隐私偏好設計,沒有花一點篇幅講 MTF、eyebox、出瞳距離等光學設計。而 Rokid 重點營銷的近視可調功能,無論 Air 0-500 度屈光度調節還是 Max 0-600 度加上無損畫面,爲啥 Nreal 和雷鳥兩家偏偏不用這源自供應鏈廠商的方案,老老實實選擇了近視配鏡,光學設計選擇适宜的出瞳距離便于用戶佩戴眼鏡?
BirdBath 目前近視屈光度調節方案,調的是畫面,并非近視眼鏡那種光學層面,而且還調不了散光,實用性存疑。還有畫面調焦對 IPD 的影響,可能出現人眼雙目合目重影的副作用,Rokid 産品經理可能并未真正深入研究過。
來自惠牛科技官網
還有一個細節,Rokid Max 的入眼亮度來到了 400 nits,峰值 600 nits,這得益于索尼更高規格的 Micro OLED 微顯屏,還是以小面積 eyebox 光學設計來實現的?AR 觀影眼鏡大多相對靜态、私密的場景,是否真的需要很高的入眼亮度,值得仔細推敲。雷鳥眼鏡似乎隻有 200nits-400nits 入眼亮度,差一截,但 eyebox 做的很大,Nreal 入眼亮度在 400nits 左右,eyebox 大小介于雷鳥和 Rokid Air 之間。而 Nreal 和雷鳥兩家現在在争銷量第一了。
産品上舍本逐末是有意或無心,我無法鑒别。Rokid to AI、to B、to C 還是 to VC,隻感覺到了一點極客和現實之間的拉扯。經曆了喬布斯式的産品月石被幾十塊的百度廉價智能音箱沖垮,公司幾乎推倒重來般的大裁員,轉型 AR to B 再到 to C,從沒有做過底層員工的 Rokid CEO,似乎依然「不忘初心」。
融到錢,活下去,講好故事,等待春暖花開。
至于産品,先把概念做出來而不是出貨量做上來,也許才是 Rokid 目前真正考慮的緊要事情。
後話
AR 有潛力成爲 time killer 設備,因爲日常眼鏡佩戴,看到周邊環境,随時随地進行視覺增強和虛實交互,信息提示、學習、工作、娛樂,使用高頻,場景不限。
AR 在消費市場普及關鍵在虛實交互和光學顯示,依賴傳感器、算力、更小體積的高透光高亮度光學設計,特别是眼球追蹤、手勢識别、SLAM 功能的傳感器。SLAM 能否做到高精度,眼球追蹤能否低功耗低延時快速畫面渲染,手勢識别能否做到空中打字的程度,還有整個體積、續航、能耗的限制,單拎出來一項其實可以做好,但 AR 難就在任何這其中任何一項關鍵技術都不能有短闆。
AR 還是要等硬件技術的成熟,其實大家普遍吐槽的内容和應用沒什麽好擔心,硬件做好了一定會最快速度普及,至于時間點,幾項關鍵技術這幾年進步很快,可能 2025-2027 年初步成熟的硬件可能就出來了。
希望一直都在。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App