在國内企業先後發布數百個大模型之後,人們的實際生活似乎并沒有因爲新一輪 AI 浪潮的到來産生容易被感知的變化。應用端,自年初 Chat GPT 的爆火和 AI 繪圖成功破圈後,大模型的落地應用似乎就被困在了 " 陪聊 " 和 " 繪畫 " 之中。
" 大模型對于行業來說無疑是一場革命,但它并不是萬能鑰匙,我認爲在很多垂直領域,很多企業應該更多地建立自己能夠負擔起的‘小模型’,通過具備學習能力的 AI 加速小體量應用場景的體驗更新。" 未來智能 CEO 馬嘯告訴钛媒體 App。
作爲一家在創業階段的人工智能硬件公司,馬嘯将目光投向了 " 會議耳機 " 品類,研發服務于在線會議和紀要、摘錄功能的智能硬件就是他口中提到的 " 垂直應用領域 "。
" 生産力 " 成爲耳機的附加值
後疫情時代," 混合辦公 " 已經成爲常态化的工作模式,受疫情影響的 3 年時間内,很多人從不會用、不習慣在線協同辦公、舉行會議,逐步被教育成完全适應在線氛圍,并以此提升效率。因此在線下生活逐步恢複後,在線會議的需求非但沒有熄滅,反而實現了進一步增長,線下與線上呈現出融合趨勢,根據騰訊會議的數據,到 2022 年,平台用戶數已經超過 2 億。
不過高效、便捷的溝通也帶來了一些 " 副産品 ":大量需要轉譯的語音數據,以平均 150 字 / 分鍾的正常語速來計算,1 小時的會議理論上就會産生 9000 字的速記稿,這也是爲何衆多會議平台都開始推出會議紀要、速記等功能的背後原因。
" 會議耳機的切口其實就是成爲線上以及小規模線下溝通的‘記錄員’,相較于單純由軟件提供的轉譯、記錄功能,耳機作爲硬件産品,其自身具備拾音和聲音傳導的特性,因此不會産生兼容性和數據跨平台提取的問題,隻要用戶需要就能随時進行記錄。" 馬嘯說到。
從産品搭載的實際功能來看,會議耳機産品等于在傳統的 TWS 耳機基礎上增加了與語音、文字處理相關的功能,換句話說,此類産品帶來的差異化體驗并不隻限于是音質、降噪、佩戴等傳統耳機産品競争的賽道,而是更加偏向于作爲提升工作效率的生産力工具,就跟爲了碼字更快換一把鍵盤、爲了剪輯視頻換一台高性能 PC 同理。
但作爲耳機與智能錄音筆或其他具備錄音處理能力的硬件結合體,哪個類目才是 " 本我 " 也是一項挑戰,即:究竟是做一個耳機形态的智能錄音設備,還是做一個具備錄音轉寫功能的耳機。
剛涉足耳機領域時,未來智能的團隊也碰到過釘子,首款驗證産品直接延續了 " 單點打透 " 的思維,采用突出語音處理的功能屬性弱化耳機體驗的方式,但經過市場驗證後很快回爐重造,事實證明用戶并不是需要一台戴在耳朵上的 " 錄音筆 "。
馬嘯分享到:" 僅從現階段的産品表現來說,我們的産品更像是在提供一個符合同價位産品基礎體驗功能的耳機,比如目前主打的千元級價位,我們推出的 Nano+ 同樣也支持低延遲連接、主動降噪、通話降噪等功能,同時它還擁有文本轉譯、語音記錄等功能作爲‘附加值’。" 他說到。
與生産力的高度貼合,也激發了會議耳機在内卷嚴重的 TWS 領域獲得了較爲差異化的競争力,在此之上,馬嘯則認爲獨有功能會成爲用戶持續選擇旗下産品的 " 品牌粘性 " 之一。他提到:" 傳統的 TWS 耳機除了手機 + 耳機的獨家生态以外,缺乏很多應用層面的抓手,而與會議記錄場景的高度綁定,則讓用戶在保留核心功能的同時,會爲周邊體驗的升級付費。"
AI 不止有大模型,小模型時代也将到來
消費者端,經過一段時間的打磨,初代會議耳機依靠簡單的文字速記、語音轉譯功能開始受到金融圈、媒體等需要高頻交流且有實時記錄需求群體的關注。而在新一代産品上,則增加了生成式會議助理、同傳聽譯、待辦跟進等功能。
其中,生成式會議助理可以根據通話内容自動提取出待辦事項,這就需要利用到 AIGC(人工智能生成内容)技術,這就與目前主流的大模型人工智能産生了交集,該行業目前也處于極速膨脹的狀态,幾乎所有科技公司對大模型的趨之若鹜,甚至要花費巨量資金、人力以構建自身的獨有大模型。
但對于未來人工智能的整體發展方向,馬嘯則提出了不同的觀點:" 經過我們的測算,不需要大模型那麽大的參數量 也能夠滿足絕大多數會議紀要生成、日程提取的需要,同時由于訓練數據更加适合專業場景,有限規模的‘小模型’反而效率更高。"
舉個例子,通用的大模型在處理語言信息的時候需要用大量廣義的資訊、文章甚至論文進行機器學習,才能擁有更強的理解能力和邏輯組織能力,如果還需要增加繪畫功能,那麽對模型的規模要求還會更上一層樓,因此通用場景往往需要大公司重金投入的大模型才能勝任。
但僅從會議場景和日常辦公來說,大量與生活相關或者與專業領域極少産生交叉的資料其實是不需要學習的。" 從長遠發展來看,我認爲每個公司甚至每個産品都會擁有一個适合對應 AI 場景的小模型,主要是用來解決細分場景的應用落地需求。" 馬嘯表示。
構建會議耳機品類初步認知與爲産品加入 AI 延伸的功能,可以看作是未來智能公司的第一階段落成,未來在産品層面還會探索更多形态的同時,也還會不斷加深市場教育。在其所處的辦公賽道,其實并不缺乏競争者,一方面視頻會議平台本身就已經開始涉及到硬件層面的部署,同時傳統的辦公場景耳機賽道,也有羅技、Poly 等廠商正虎視眈眈。
馬嘯坦言:" 面對競争,我覺得 AI 功能也好、私有數據庫的訓練也罷,都稱不上是未來智能公司的和訊飛會議耳機的最大競争力,從我的視角來看,‘用戶心智’或者說對産品的‘第一認知’才是更重要的底牌,就像可口可樂成爲了汽水的代名詞,戴森成爲了高速吹風機的代名詞,那我們的産品就是會議耳機的代名詞。(本文首發钛媒體 App 作者 / 鄧劍雲 編輯 / 鍾毅)