在進博會的人工智能體驗區,不少參觀者戴着一款智能眼鏡開始逛展。
這款智能眼鏡,是由奇點臨近打造的全天候智能眼鏡。11 月 8 日,奇點臨近開售了 QIDI ONE 開發者版(QIDI ONE INFINITY EDITION),價格4999 元起。
全天候智能眼鏡的第一步:戶外室内都能用的一體機
奇點臨近創辦于 2021 年 12 月,創始人兼 CEO 張慧敏曾是華爲 P 和 Mate 旗艦機核心開創者之一,也是華爲手機第一位首席科學家、第一位首席架構師。
繼去年億元級天使輪融資後,今年 7 月,奇點臨近又拿下了阿裏的數千萬元戰略輪融資。在見證并深度參與消費電子多次産業升級後,張慧敏認爲智能眼鏡将成爲下一代智能終端,而一款真智能眼鏡需要具備以下特點:
眼鏡形态,要舒适輕便,長時間佩戴,适應日常工作生活各個場景;
第一視角的感知和識别,自帶算力和電池能量;
即時全息顯示,融合數字世界和現實世界;
裸手交互,符合自然直覺。
張慧敏認爲,要做好創新,必須對底層技術有深入思考,對人性和用戶有深刻洞察,想清楚最終産品應該是什麽樣,能給用戶帶來什麽價值和體驗,再 Top to Down 地向下拆解所有關鍵技術及模塊,在關鍵技術上做創新,在關鍵技術之間做系統性的架構設計和解決方案,再回到終端産品,實現從需求到技術再到産品的閉環。每一代産品,都沿着拆解關鍵技術後形成的 roadmap,先行一步解決至少 1-2 個用戶最在意的關鍵底層問題。
QIDI ONE 開發者版就是他對真全天候智能眼鏡設想的初步實踐,這一代産品優先解決的是兩大問題:一是實現高透高亮,必須保證戶外無遮光片也可正常使用;二是做成一體機,且盡可能輕巧,舒适便攜。
QIDI ONE 開發者版重量在80g左右,是自帶算力電池存儲的一體機,采用 LCOS+ 雙目陣列光波導的光學方案,顯示亮度最高能夠達到3000nits,分辨率 1280 × 720,透光率大于85%。在輕度使用場景中,QIDI ONE 開發者版的續航能力能夠達到 3-4 小時左右
△來自 QIDI ONE INFINITY EDITION 官方介紹 AR+AI 打造創新功能,兼具強大兼容性
圍繞高透高亮、重量輕、一體機三大特征,奇點打造了 QIDI ONE 開發者版本的一系列亮點功能。
比如能在進博會上實際體驗到的AR 名片功能:
戴上智能眼鏡看朋友,它會極速識别朋友的身份信息,并随之展現在你的面前。
上傳朋友信息至智能眼鏡的過程也很便利,隻要通過手機直接掃描各式各樣的名片,同時将人臉照片上傳即可。下一次無論何時何地,奇點臨近智能眼鏡都能幫你識别出 TA,堪稱 " 社交神器 "。
AR 翻譯也很簡單,單擊開始,就可以即時看到轉錄出的翻譯文字。AR 大模型更是随身百科全書型的利器,直接提問,大模型的回複就會即時顯示在眼前。
第一視角拍攝不是什麽新概念了,但過往的拍攝方法,例如把運動相機頂在頭上、戴着胸前,或者采用攝像頭放置在鏡腿上的眼鏡型設備,最終成片和實際肉眼所見存在視差。
奇點通過硬件和算法的創新優化,實現零視差第一視角攝錄。進博會現場體驗中,可以明顯感受取景框中的畫面、最終拍攝到的畫面,和肉眼所見基本一緻。
除了基礎功能,還有一些有趣的玩法。例如旨在打造沉浸式戶外健身功能的應用 Libra,可以根據你的心情、環境選擇适當的歌曲類型,邊聽邊徒步,眼鏡會實時提醒你走了多少步、消耗了多少卡路裏,主打一個及時激勵,還可打開攝像頭,實時記錄所看到的畫面。
另外,還有實用的 PPT 提詞功能。演講詞實時顯示在眼前,還能通過指環,實現隐藏式手動翻頁,不用斜眼看提詞器,不用害怕看不清,更不用擔心後台翻提詞的工作人員翻錯頁,日常工作場合也能使用。
不僅如此,QIDI ONE 開發者版本能夠呈現 4 米外 85 寸大屏,這也爲其作爲拓展性設備提供更多可能性。比如 Switch、Xbox 打遊戲;連接無人機,直接看到無人機的拍攝畫面;手機、電腦更不在話下。
底層技術創新,賦能千行百業
在智能眼鏡中,奇點臨近通過不同的 APP 向用戶以及開發者們展示其顯示、語音算法、圖像算法等底層技術所提供的強大能力。
" 我們希望通過展示這些成果,讓更多人能夠通過我們所提供底層能力、底層技術,去開發适合他們所在行業的應用。" 張慧敏說道。
在顯示方案上,奇點智能眼鏡選擇了 LCOS+ 雙目陣列波導的 AR 光學方案。爲了降低 LCOS 的功耗,奇點智能眼鏡嚴格選擇所有關鍵器件。據張慧敏介紹,某個同一位置的關鍵部件替換,可以實現同等功耗下提高 30% 亮度。選擇 LCOS 方案的另一大原因是,能夠支持85%透光率,且其入眼亮度能夠達到3000nits,奇點智能眼鏡在不需要遮光罩的情況下,能夠滿足大部分的室内、室外場景。
奇點自研的,擁有獨立知識産權的自标定雙目合像方案,實現了分體式左右顯示模組的雙目合像。通過結構定位,軟件自标定的方式,突破硬件極限,将雙目合像的精度做到了 5 ’,并實現了行業首創的合像距離可調模式,達到行業領先水平。
在交互方案上,奇點智能眼鏡擁有語音、觸控兩大交互方式,也可選配指環。大家都知道語音交互比較容易受外界環境所影響,出現短暫失靈的情況。通過奇點臨近的語音聲紋識别算法,能夠讓智能眼鏡在聲音比較嘈雜的地方,識别智能眼鏡用戶的聲音,從而執行響應的指令。" 目前我們的物流客戶在倉庫、機房裏已經進行了上萬小時的使用,語音指令基本能獲得準确執行。"
據介紹,奇點臨近已經形成了一套行之有效的、多模态複雜場景的、輕量化小模型的環境感知萬物識别的算法應用體系,通過基于應用場景的 Camera 定制開發、軟件多線程框架設計及優化、深度學習算法 ARM/GPU 融合優化等軟硬件一體化的開發,将行業中目标檢測識别算法提升了十倍以上,實現0.1s的極速識别,達到行業領先水平。
在張慧敏看來,無論是物流、文旅等商用市場,還是消費者市場,奇點智能眼鏡都是爲人打造的産品,因此都有共同的需求,比如說重量。
" 我們認爲用戶對眼鏡的重量其實是非常敏感的,哪怕是多重 3g 或者多重 5g 都會影響用戶的佩戴時間。因此我們在眼鏡的重量上,下了不少功夫。" 通過深度定制二三級的零部件,并且在系統工程一體化上反複打磨,目前 QIDI ONE 開發者版本的重量在 80g 左右。
△QIDI ONE 開發者版媒體實測
圖像識别能力、語音交互能力以及顯示能力,都是奇點臨近爲千行百業提供的 " 百寶箱 ",支撐着各行各業将他們的創新想法落地實現。
對話張慧敏:造智能眼鏡≠造手機智能眼鏡範式或呈多樣化
智能眼鏡,是張慧敏職業生涯中進入的第四個創新性賽道。從白電(冰箱、洗衣機等白色家電的代稱),到功能機,到智能手機,再到智能眼鏡,張慧敏已經非常熟悉如何從 0 到 1 搭建自己的團隊。
△奇點臨近的創始人兼 CEO 張慧敏
據他透露,目前奇點臨近有不少來自于華爲旗艦機、大疆等頂尖團隊的員工,并且他們還擁有一個相當優秀的嵌入式算法團隊,幫助他們将各類應用輕量化 " 塞入 " 智能眼鏡中。" 有些關鍵技術難關,就需要找到專業的人來攻克,這也是我們的優勢所在 " 張慧敏說。" 終端廠商是推動行業向前關鍵的一環,隻有他們才知道用戶真的想要什麽。" 多年的終端研發經驗,讓張慧敏不滿足于停留在等待供應鏈技術成熟的層面,反而選擇進一步推動供應鏈提升自己的工藝,共同打造出好的産品。
作爲曾經見證手機如何從功能機轉向智能手機的關鍵人物,他表示,智能手機時代,屏幕内、外是割裂的,數字歸數字,現實歸現實,它更像一個平台,集合了各種不同的 APP;但智能眼鏡是把屏幕内的數字信息和屏幕外的現實融合在眼前,實現 1+1>2 的效應,在應用方面,未來将實現場景驅動,而不是依賴人的主動觸發。智能眼鏡和智能手機的硬軟件産品範式都會不同,核心技術也不同,造智能眼鏡的思路不能完全照搬手機,但可以從定義産品的底層能力,選出超越用戶期望的使用場景等方面借鑒手機創新的方法論
據他推斷,未來智能眼鏡的範式可能不隻 1 種,可能有 2-3 種類型。" 我們希望奇點臨近能夠定義其中 1 款。" 在他看來,如果一款智能眼鏡能夠在不虧本、不營銷的情況賣出 50 萬台,這可能意味着智能眼鏡即将迎來爆發階段。當 AR 産業達到成熟階段時,可能會擁有 15-20 家進入智能眼鏡賽道終局。
從 2021 年成立,到奇點智能眼鏡量産上市,再到 2023 年 11 月公開發售 QIDI ONE 開發者版本,奇點臨近交上了自己的産品答卷,通過 QIDI ONE 開發者版本直觀向千行百業的人員展示智能眼鏡能夠提供的底層技術能力,并推動他們加入開發創新應用的隊伍。在日益升溫的智能眼鏡賽道,期待 QIDI ONE 開發者版本給行業的開發者帶來新的工具、靈感和體驗。
* 本文系量子位獲授權刊載,觀點僅爲作者所有。
— 完 —
量子位 QbitAI
վ ' ᴗ ' ի 追蹤 AI 技術和産品新動态
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~