但現實是,迄今爲止仍沒有一款 AR 眼鏡真正滿足大衆需求。蘋果公司的 AR 眼鏡,也遲遲沒有推出。
在萬千期待中,有一家中國公司驚豔亮相,它的名字叫 Rokid。
不知不覺中,Rokid 公司已經産出多種 AR 産品,例如 RokidAlien、Rokid Glass、Rokid Vision 等等。
小試牛刀的 Rokid Glass 已經取得驚人效果。
疫情期間的執勤人員佩戴後,可以在一米距離外快速識别通行車輛和人員信息,特别是戶籍身份,從而識别是否存在潛在風險。
小區保安佩戴後,可以快速識别業主身份,并提前送上溫暖問候,避免了保安流動性強所導緻的業主進出尴尬。
Rokid 公司創始人兼 CEO 祝銘明表示,AR 将成爲手機之後新一代交互平台,而 AR 眼鏡則是繼 PC 和智能手機之後的下一個可以承載人機交互的最佳産品形态。
今天上午,祝銘明先生做客混沌 app,爲大家帶來精彩一課,《AI + AR 人機交互産品的探索與實踐》。
以下爲課程筆記:(篇幅所限,文章内容僅爲部分課程内容,請前往混沌 APP 看完整課程)
授課老師|祝銘明 Rokid 創始人 &CEO
編輯|混沌商業研究團隊
支持|混沌前沿課
AI 時代信息展示和交互将遭遇瓶頸
AI 時代是科技發展到今天爲數不多的一次巨大時機,人與科技的關系正在發生 180 度的轉換,科技開始爲人服務。其中必然有一些深層次的代價,諸如倫理問題、安全性問題、信息準确性問題、主導權問題。但純粹從人機交互和人機體驗的角度看待,AI 會帶來一個前所未有的變化。它的本質變化在于人們不需要通過學習科技去享受科技,而是從第一天起,科技就反過來了解我們、學習我們,學會爲我們服務。
但是,人類獲得信息的效率越來越高,當同時獲取文字信息、圖像信息、視頻信息甚至更複雜的空間信息時,就會發現信息的展示和交互變成了瓶頸。
提到人機交互的多模态,就不能僅僅指語音,也一定包括視覺以及讀腦等技術。信息終端和信息科技的核心問題就是解決兩個問題;第一,如何讓人們更自然、更方便、更平等地獲得信息;第二是如何更豐富、更有效、更自然地展現與這些信息的溝通。人們經曆的所有信息終端的革命,都會在二者裏找到映射,這就是 Rokid 要去做的事情。
……
篇幅所限,本文内容僅爲課程十分之一,
海報右下角掃碼,觀看完整課程!
Google glass 的啓發
Rokid 自成立第一天起,主要做兩件事:第一件事是 AI,第二件事是 AR。2012 年 Google glass 發布會上,我第一次見到眼鏡形态的産品,當時就認爲這個産品的潛力很大,但技術上還需要演進。2014 年 Rokid 成立,進行了一系列的技術演進。大家可以想象一下 5 年以後,掏出手機看信息将成爲輔助行爲,不再是主要行爲了。如果變成我們每個人戴的眼鏡就擁有這種展現力,将會是一次巨大的進步。
VST&OST:兩種技術方向
技術的研究方向也很有意思。2024 年 2 月,Apple 發售 Vision Pro,方案路線是 VST,VideoSee Through。這一方案路線認爲脫離接觸是不對的,還是要跟真實世界進行互動。發展路徑就是在前面加一個攝像頭,把外面的世界用攝像頭記錄下來,然後傳到産品之中顯示出來,這種的視覺效果更好。
Rokid 的方案路線是 OST,Optical See Through,希望人們用肉眼看到真實的世界。
今天,VST 跟 OST 并行發展,沒有誰對誰錯。VST 有個好處,當人們想隔絕世界的時候,可以選擇進入數字世界,不想的時候可以拿下來再進入真實世界。但它的問題在于,個人不會有什麽感覺,而旁觀者會感覺唐突,因爲個人進入數字世界時是一種隔離的狀态。OST 的好處是,它總體會讓你感覺跟周圍的環境沒那麽唐突,表現出來更自然,它的壞處是技術還沒有 VST 那麽完整。但如果放長遠看,未來也許是 OST 的天下。
我個人認爲,未來真正的玩家會同時擁有 VST 和 OST,不同的場景選擇用不同的産品,大家自己去思考哪個産品更合适。
……
篇幅所限,本文内容僅爲課程十分之一,
海報右下角掃碼,觀看完整課程!
AR 産品的不同發展路徑
AR 的發展經曆了不同的時代,從工具時代到内容時代,大家可以看到整個的象限:
我們最終的目的是希望走到第一象限,即日常佩戴,内容也很豐富。這是理想狀态,還需要 5 年到 10 年的時間去發展。Rokid 現階段有不同的産品,比如第三象限是典型重工業使用的,Rokid 基本上形成了壟斷。在第二象限裏面,全國大概 200 多個省級博物館都有 Rokid 眼鏡。
我覺得,第三象限最終可能還會繼續存在,因爲不同場景有不同的特殊需求,但是其他兩個象限都會被第一象限合并掉。如果發展到日常佩戴體驗非常好的一天,就隻會剩下一、三象限,第三象限就會變成特别專業的,如 X-Craft,人類曆史上第一個登上太空服役的 AR 眼鏡就是 Rokid 的産品,使用在天宮一号上面。但是重工業領域使用的産品與老百姓日常生活關系不大,所以平時人們關注的更多的仍是第一和第二象限的東西。
AR 時代:五個重要的組成
AR 時代由五個重要的部分組成,即感知、理解、交互、協同、數字内容創作。
第一部分是感知,通過半導體、傳感器技術感知這個世界的原始信息。
第二部分是理解,感知到這個世界之後是如何去理解它,理解原始信息與周圍環境的關系。
第三部分是交互,即信息的展現方式。過去,人們組織和展示信息的方式實際上受硬件技術約束。人類跟其他動物一個巨大的區别是人具有抽象能力。我們對信息的展現和組織能力有限,所以我們的抽象能力非常好。人類花了幾萬年時間做了一件事,就是把真實的世界抽象成符号。信息展示方式的變化是技術變革引發的,随着技術的變革,内容的展現方式、組織方式就會不同。短視頻領域有一個概念叫瀑布流,瀑布流就是解決用戶因屏幕有限而隻能一張一張看的問題,到了 AR 時代,當你的能力擴張到十幾倍二十倍的時候,整個商機、信息展現和交互方式都會發生質的變化。
第四部分是協同,即可以不在同一空間進行協作。最典型的例子是電影《Kingsman》,所有人戴上一個眼鏡就可以開會,實際上他們不在現場,有的是真人,有的是數字人。
第五部分是數字内容創作,即追求更大空間更爲立體生動的展現方式。有一個遊戲叫掌中寶,會生成内容很詳實的虛拟生物形象,甚至動物的肌肉組成、骨骼化石和生長環境。但是數字内容創作十分困難,平面的創作已經很不容易,立體的創作更難,成本要更高,所以數字内容創作一定要注意保護産權,防止被盜版。
……
篇幅所限,本文内容僅爲課程十分之一,
海報右下角掃碼,觀看完整課程!
預見 AR+AI 時代的來臨
交互是要解決人對信息的平等獲取和自由獲取。當人們要記住一堆概念,掌握一些流程,并通過一系列的培訓,才能夠獲得信息服務的時候,這是不公平的,這些流程都在不斷地抛棄所有人。所以 Rokid 提出了 Leave Nobody Behind,讓每一個人都享受科技。
理論上來講,戴上 Rokid 眼鏡後,如果對某一件衣服感興趣,用戶隻需要盯着它一會,這件衣服的信息就都出來了,避免用戶詢問的尬尴,甚至用戶還可以做比價。未來,大家不需要通過學習,眼睛看在哪兒,就可以獲取哪裏的信息。
Rokid 在 2021 年推出了一個技術,爲各個高檔小區的保安配備眼鏡。因爲保安的流動率很高,而保安是所有業主用戶體驗的第一層,很多業主剛和保安熟悉了,過段時間又換了個人,就很麻煩。如果保安帶上 Rokid 的眼鏡,從很遠的地方就可以知道業主來了,知道他們住在哪棟樓,就可以和業主主動打招呼,即使這個保安是新來的。這種方式會改變整個的社區關系,非常有趣。
所以,當我們去體驗和理解一個産品的時候,我并不希望大家過多地去思考技術是什麽,能力是什麽,而是要考慮場景是什麽,如果有一個産品可以爲保安和業主提供服務,即使這個保安不喜歡戴眼鏡,他也會選擇一副。當産品的能力和體驗好到一定程度的時候,人是不會拒絕一副眼鏡的。
在今天的 AR 時代,人跟真實世界會有一個巨大的變化。現在很多人在聊天或者對話的過程中,手機一響就會去看,實際上每個人并不知道自己已經跟這個世界産生了一種非此即彼的關系,當人進入數字世界時,不得已要與物理世界割裂。有的時候兩個人坐的隻隔了一張桌子,也習慣于通過網絡信息進行表達,這就是改變。
Rokid 是一家軟件平台公司,爲什麽要做硬件?因爲軟件和系統平台需要紮實的硬件做基礎,才能展現它自身的能力,這個行業我們做的太早了,那時候找不到如此基礎的東西,隻能由自己來構建。有些人會提出,可以等技術成熟之後再去做,這是大部分的創業者和從業者的思考,但實際上,從來沒有一個完善的技術像魔法一樣突然出現在大家面前,一定要帶着發展的眼光去看,要接受所有技術的不成熟,唯一思考的問題就是當技術、産品不完美的時候,用什麽樣的場景去匹配它。
AR 技術最早來自于軍方,現在阿帕奇直升機上,駕駛員頭盔上有個設備,看着哪裏導彈和槍就攻擊哪裏,威力非常大。二三十年前這一技術的成本是多少?僅顯示屏大概就 20 萬美金。Rokid 通過多年技術的沉澱,對于産品和消費也起到了積極作用,我們在消費端的産品僅僅賣 3000 多元,這是一個巨大的變化。Rokid 的技術,從最早的科研、軍方到工業、展陳,從 toB 到 B2C 到 toC,它經曆的時長大概是多少?是從 2019 年到 2024 年的 4 年多的時間。未來整個行業進入一個爆發期,所以 2024 年之後的世界發展要看 AI+AR,一定要相信,這個時代已經到來了。
好産品就是比用戶預期高一點的産品
作爲 CEO,我的主要時間都花在産品上,而不是在賣東西上。從一個 Idea 的産生到最後産品的出現,中間要經曆千差萬别的很多東西,甚至有可能最後的産品跟開始的 Idea 完全不一樣。
例如,公司原來的 AR Studio 前面是有個攝像頭的,但是我發現用戶真正在使用過程中使用手勢的時候,因爲擡得太高導緻上臂不舒服,最後我們決定把攝像頭下調 20 度,這樣操作可以讓用戶保持更久的時間。這就是一個典型的例子。
我每天的工作,就是解決成千上萬的問題,并且要做各種細小的決策,這就是做産品的人的樂趣,同時也是我的痛苦。樂趣是永遠有很多東西等着去解決,痛苦的是永遠不知道解決了這個問題會帶來其他哪些問題。
很多人會抛掉用戶談鑒賞力,比如拼多多,到底是消費降級還是消費升級?沒有一個絕對标準,還是要把用戶放進去。鑒賞力就是直面用戶需求,在解決用戶的需求的情況下,考慮如何做得更好。
對于很多創業者而言,大部分人連第一個問題都沒回答好,根本沒有解決好用戶的問題,更談不上在解決了用戶問題的基礎上做得更好。大部分真正解決用戶問題的人,通常都已經做的很好了。對于創業者而言,要關注的是目标用戶是誰,用戶對産品的期待是什麽,如果你做的産品比用戶的期待更高,用戶就會感覺不錯。對于用戶來講,比期望值稍微高一點就是最好的産品定義,這不是一個絕對的概念。這裏的前提是,你要清楚用戶的期望值在哪。低于用戶的期望值,隻能走低價策略,降低期望值最簡單的方式就是降低價格。例如,同樣買一個電視,你的電視屏幕有點小,但是價格隻有 1000 塊錢,用戶也會選擇忍讓購買,這就是降低用戶的期望值。但這不是 Rokid 想做的事,我們希望在明确目标用戶期望的情況下,做的比用戶的期望值高一點,但不要高太多。
埃隆 · 馬斯克說的第一性原理,這就是我們的第一性原理。用戶需求的基本線到底在哪?抛掉品質,抛掉其他的因素,用戶到底需要一個什麽樣的東西?先給自己一個業務産品的定位,如果你定得低,就要降低用戶的期望值,拉高基本線是很難的,因爲人群消費和自身的觀念以及過去的經曆是有關系的,沒有辦法突然通過一個品牌、一個産品,将用戶變成另外一個層級的人。所以,在定義好用戶和基本線的情況下,把産品做得超出一點點,比如超過 10%,可能是一個比較不錯的務實想法。
在今天的市場裏面,比如淘寶或者 Amazon 上看我們的産品,你會發現它的定價都遵循了這個決定。我們做過很多實驗,最後發現這個價格總體是不錯的。Rokid 有很多技術,可以把産品打扮得很酷,但是我們對消費者産品定義的很簡單,叫個人的私享助理,私人享受的一個伴侶。用戶可以在家用它看球賽,在高鐵上自己看電影,戴上它并沒有脫離跟外面的接觸,但同時也在享受自己的東西。
我們在産品上做了三件事:
第一件事,超大的屏幕。
第二件事,非常容易使用。我們消費端的産品跟家裏的遙控器一樣容易操作。
第三件事,内容足夠豐富。用戶在消費端可以找到抖音、B 站等所有産品,以及海外版本的 Google、Ecosystem。
雖然 Rokid 的定位非常簡單,但實際上 Rokid 已經進入了空間計算時代,多屏互動、手勢識别、空間交互等等,但如果把這些東西放在這裏,就會離原來的用戶基本線過遠,所以現在還在 B2C 的一個階段。
對于創業者而言,要直視基本線的定義,不要回避它。創業者會有一些 Ego,對産品有自己的定義,這個 Ego 可以有,但要基于自己真實的客觀用戶,基于你能服務的用戶人群,和跟你最匹配的人群。
……
篇幅所限,本文内容僅爲課程十分之一,
海報右下角掃碼,觀看完整課程!