圖片來源 @視覺中國
文|科技新知
過去十年裏,技術的進步可謂翻天覆地,從 3G 飛躍至 5G,再從因特網擴展到萬物互連。
與此不同,智能音箱的走勢顯得逆流而上,去年出貨量僅 2600 萬台,更有觀點認爲這預示了一場技術泡沫的破裂。然而,市場轉折的迹象似乎已初露頭角。
正如 ChatGPT 這種先進的生成式 AI 模型所展現的,它爲智能音箱賦予了一種深度的 " 智慧 ",大大提升了用戶交互和内容的質感,甚至在視覺等領域的多模态能力,讓其應用範圍得到了廣泛拓展。
百度、小米、阿裏巴巴等大廠,敏銳地捕捉到這一趨勢并投入資源,寄望于爲其智能音箱帶來創新與活力。他們的最新戰略動向,再次确認了對此技術方向的堅定信念。
不難看出,得益于大模型技術的嵌入,智能音箱市場的競争再度激烈。至少在參與者們看來,智能音箱是有望真正轉變爲下一代互聯網的核心入口,而不隻是一個高科技的小玩具。
BAX 再度涉足智能音箱競逐
在智能音箱的新故事中,近期小度原 CEO 景鲲的辭任,成了一個典型的标注。景鲲在 2014 年進入百度,主管搜索相關業務,并自 2018 年起逐漸成爲公衆關注的焦點。
令人印象深刻的是 2018 年 3 月,百度宣布整合三大部門——度秘事業部、硬件生态渠道部及智能家居事業部,組建爲智能生活事業群組。這一重要闆塊原爲集團總裁陸奇所持,他離職後則由景鲲正式接班。
值得一提的是,同年百度首次推出了帶屏智能音箱 " 小度在家 ",并由李彥宏親自站台。景鲲也在社交媒體上熱情地分享了這一創新産品的發布。在他的帶領之下,小度獲得了不錯的市場響應," 小度之父 " 的美譽也實至名歸。
2019 年 5 月,成績斐然的景鲲被提升爲集團副總裁,并繼續領導智能生活事業群組。直到 2020 年 9 月,百度宣布其智能生活事業群組獨立完成融資,估值高達約 200 億元,而景鲲在這新的組織架構中,走馬上任了首席執行官。
如今,景鲲的突然辭職引發關注。此前已有消息,他本應在 10 月 17 日的百度世界大會上,作爲小度科技的首席執行官發表題爲 " 大模型時代,小度重塑智能生活 " 的演講。
許多行業觀察人士推測,新任領導的履曆意味着在 AI 的大背景下,小度科技将肩負起更爲重要的任務。比如,将大模型技術納入小度的衆多業務中助推發展。
事實上,小度早就已經公開與文心一言技術的結合策略,并宣布創新出專門爲智能設備場景而設計的 AI 模型—— " 小度靈機 "。
毫無疑問,大模型技術會深度塑造小度的智能音箱業務,使其與百度形成更爲緊密的戰略聯盟。
同時,國内智能音箱市場的其他兩大巨頭——阿裏和小米,也在積極布局大模型技術,抱着和百度同樣的目的。
8 月末,小米已啓動智能音箱大模型的内測計劃,并邀請了部分用戶參與。目前,第一輪測試已經完成,主要針對了小米 Sound 和小米 Sound Pro 兩大産品線。
據小米 AI 品類商務總監透露,小米在未來将不斷地優化智能音箱的功能,尤其是在特定的應用場景上,他們希望能爲用戶創造更多價值,并探索更多的付費可能性。
與之對比,阿裏巴巴的策略更爲連續和明确。
4 月 11 日,阿裏雲峰會上宣布了天貓精靈與通義千問的合作。到了 9 月,阿裏又推出新 AI 品牌—— " 未來精靈 "。這實際上是受到大模型浪潮推動,天貓精靈進行的品牌升級。" 小靈,小靈 " 已成爲默認的喚醒指令," 天貓精靈 " 僅作爲一個備選喚醒詞。
洛圖科技(RUNTO)7 月 24 日公布的《中國智能音箱零售市場月度追蹤》報告指出,今年上半年中國智能音箱銷量達到 1148 萬台,與去年同期相比減少了 19%;而銷售額也同樣下滑 20%,至 33.7 億元。在市場份額方面,百度、小米和天貓精靈分列前三,分别占據 37%、34% 和 23% 的市場,三大品牌共同占據了市場的 94%。
不難看出,智能音箱行業的玩家們似乎正走在一條相似的軌迹上。而随着先進技術如 AI 大模型的加入,預計這個市場的競争将變得更加激烈。
智能音箱的困境:爲何陷入 " 玩物 " 标簽?
智能音箱市場的漣漪,讓人聯想到昔日的 " 百箱大戰 "。
追根溯源繞不開亞馬遜的 Echo。2011 年,這家國際電商巨頭在其 lab126 實驗室默默點燃了火種;三年後的 2014 年 11 月 Echo 正式問世,這場革命性的創新不僅定義了智能音箱,也預示了一個新技術時代的到來。伴随着全球的關注,越來越多的公司開始踏入這片藍海,注入源源不斷的活力。
再過三年,在中國這片科技熱土上,微軟、蘋果、阿裏和小米紛紛推出智能音箱,帶來前所未有的市場熱度。又不到一年,百度也揮師而來,使得中國的智能音箱市場猶如火箭般騰空而起,掀起了第一波真正的消費熱潮。
2018 年的智能音箱大戰達到了白熱化。阿裏巴巴宣布斥資高達 30 億元推動天貓精靈及周邊生态的建設。百度和小米也毫不示弱,加大投資力度展開市場份額争奪戰。" 百箱大戰 ",硝煙四起。
在這輪浪潮中,中國智能音箱市場呈現出井噴之勢。2019 年,市場出貨量飙升至 4589 萬台進入了巅峰階段。
進入 2020 年,中國智能音箱市場呈現出阿裏、百度、小米三強鼎立的格局。然而市場的增長勢頭突然放緩,洛圖科技提供的數據揭示了這一趨勢。在達到 2020 年的銷售高峰後,智能音箱銷量連續兩年出現下滑,2021 年和 2022 年的銷量分别下跌到 3654 萬台和 2631 萬台,年降幅達到 3.5% 和 28%。
此外,智能音箱在國内市場的整體地位也出現了明顯的滑坡。一個顯而易見的現象是,這類曾經的科技新寵,在各大電商平台上已經逐漸被視作其他主打産品的贈品,而非主要銷售對象。
到底是哪些因素促成了這樣的局面?站在事後諸葛的角度,智能音箱面臨的挑戰其實并不難發現。
首先,從交互體驗角度看,智能音箱并不盡如人意。在早期,遠場交互技術受到了很大限制:遠距離的操作容易導緻交互失敗,而背景噪音則經常打斷溝通。後期雖然技術有所進步,但交互能力依然不足,例如缺乏 " 免喚醒 " 和 " 多輪對話 " 功能。
再者,智能音箱在個性化交互方面也表現得不夠強大。如難以準确識别和響應用戶的情緒,或進行有針對性的對話。簡而言之,其交互性仍然顯得過于 " 呆闆 "。
其次,使用場景過于單一。大部分用戶使用智能音箱的功能僅限于查詢天氣、聽故事、播放音樂等基礎操作,真正的深度應用并不多。
最終,用戶對智能音箱的期待被大大降低,很多人僅将其當作一個常規的音響來使用,而不是一個智能家居的入口或一個有潛力連接商務的工具。這無疑阻礙了智能音箱市場的進一步擴展。
業界也一直在争論,智能音箱的價值是不是被過度誇大了,畢竟我們已經可以直接用手機來完成衆多的智慧家居服務?
但答案并不簡單。未來的智能家居生态并不會依賴于某一個單一的設備如手機或智能音箱。行業專家認爲,未來的智能硬件将呈現多樣化,不可能一種設備滿足所有需求。每種設備都将有其獨特的角色和用途。
雖然手機有能力控制很多事物,但由于其形态和使用場景的穩定性,智能音箱仍然有其獨特的價值,特别是作爲智慧家居的核心入口。
大模型:打破僵局的魔法棒?
事實上,我們已經有幸體驗了大模型技術賦能的智能音箱的初步版本。近日 OpenAI 發布消息,他們爲 ChatGPT 賦予了與用戶進行語音和音頻互動的能力。
ChatGPT 可以扮演五種不同的角色來回應用戶的問題,使得它的回應聽起來比 Alexa 和 Siri 這些流行的語音助手更像真實的對話。許多用戶在各大社交媒體平台上分享了他們對 ChatGPT 語音交互的驚豔和期待。
若在現階段将高級的大模型整合到智能音箱中,可以極大地優化音箱的交互體驗及内容生成的質量。
詳細地說,智能音箱的運作包括三個關鍵步驟:首先是将用戶的語音轉化爲文字指令;接着,理解并處理這些指令;最後,将處理結果轉化爲語音輸出。
這三個步驟分别涉及到自動語音識别(ASR)、自然語言處理(NLP)以及文本到語音(TTS)這三種技術。
在這三個技術中,ASR 的技術已經相當成熟,NLP 正在經曆顯著的突破,而 TTS 雖然早期便開始向成熟邁進,但在情感交互方面仍面臨挑戰。然而,随着大模型的出現,不僅 NLP 有巨大的增長潛力,其他技術也預期将實現顯着的進步。
我們可以大膽預測,随着大模型的加持,智能音箱未來不僅可能實現更個性化的服務,還能夠準确捕捉和響應用戶的情感,進一步豐富應用場景。
但采納新技術也是一個漸進的過程。
行業專家指出,廠商在融合大模型時,需克服諸如算力分布和時延控制等挑戰。決策比如是否在本地處理情緒識别,還是在後端執行?同時,大量 API 接口的調用可能會導緻更長的時延,進而影響交互質感。
僅僅接入大模型并不能立即帶來顯著效果或即刻推出新産品。雖然這一技術能夠顯著提高交互體驗,但也伴随着相應的問題。
其中,與語音交互相關的問題之一是成本,特别是考慮到用戶可能需要支付 API 調用費用。而數據安全性也是一個關鍵問題,一旦涉及用戶數據,廠商需要嚴格遵守國家法規。
因此,近期的變革将取決于市場參與者——無論是軟件還是硬件的創新方向和技術演進。
那麽,大模型是否真的能夠重塑智能音箱市場呢?可能性是存在的,但并不絕對。盡管技術進步爲智能音箱開辟了新途徑,要想真正取得成功,還需擁有可行的商業策略。
簡而言之,智能音箱的發展前景依然存在許多未知數。但大模型的湧現爲其注入了新的活力。我們必須認識到,技術的演進往往不是單調上升,而可能是起伏不定的。智能音箱目前似乎正試圖從某個低點中躍遷。