智能音箱市場正在逐步進入 " 冷靜期 ",從部分數據可以看到,有關智能音箱的市場需求也在逐漸消退中。那麽在這樣的情況下,ChatGPT 的出現是否可以爲智能音箱帶來新的增長空間,又或者帶來智能應用的新場景?一起來看看作者的解讀。
曾經靠語音助手紅極一時的智能音箱,近年來的市場表現卻欠佳。據洛圖科技發布的最新《中國智能音箱零售市場月度追蹤》報告顯示,2022 年中國智能音箱總銷量爲 2631 萬台,同比下降 28%;市場銷售額爲 75.3 億元,同比下降 25%。而 IDC 發布的 2023 年中國智能家居市場的十大洞察也透露,智能音箱的市場需求正在逐漸消退,整個市場呈現下滑趨勢。
但随着 ChatGPT 這種生成式 AI 技術的快速發展,搭載 ChatGPT 的智能音箱将有望獲得新的增長空間。據中泰證券分析,目前全球存量智能音箱超 7 億台,如考慮産品本身 3-5 年左右的替換周期,本輪 ChatGPT 帶來的替換需求或在 1.4 億 -2 億台每年,有望再次成爲市場熱點。在此基礎上,智能音箱的交互水平也将有望再上新台階。
一、ChatGPT 或成新變量
一直以來,市場上的智能音箱産品多多少少都存在着交互體驗差、應用場景單一、産品缺乏創新,以及互聯互通差等問題,而當下以 ChatGPT 爲代表的生成式 AI 技術,則在上下文理解、多輪對話、内容生成等方面,展現出了極高的交互水準,ChatGPT 或将爲智能音箱帶來新的變量。
一來,依托于 ChatGPT 在内容生成和理解能力上的優勢,智能音箱的應用場景将進一步被擴展。
ChatGPT 具有在對話系統、文本生成、語音識别和文本分類等多種場景中的應用優勢。具體來說,在對話系統中,ChatGPT 可以生成自然流暢的對話内容,支持多輪對話;在文本生成中,ChatGPT 可以生成高質量的文本内容,支持多種文本生成任務;在語音識别中,ChatGPT 支持多語種語音識别,提供全面的語音交互體驗;在文本分類中,ChatGPT 可以應用于多種文本分類任務,自動學習特征,提高分類效果和效率。ChatGPT 的多領域應用優勢,使得它成爲自然語言處理領域的重要工具之一。
也就是說,搭載了 ChatGPT 的智能音箱可以進一步理解用戶的意圖,讓回答内容的質量能夠更趨向于真人的表現。未來,智能音箱的功能可能并不止于家庭,或許會走進辦公場所成爲人們工作的助手等。
二來,ChatGPT 也正在帶動智能音箱産業成爲資本的焦點。
随着 ChatGPT 在全球的走紅,作爲人工智能交互載體的智能音箱再次成爲市場熱點,包括奮達科技、漫步者、惠威科技、國光電器等在内的智能音箱概念股,近期都出現了大漲行情,資金湧入迹象十分明顯。可以說,在智能音箱産業進入瓶頸期的當下,ChatGPT 的出現又将智能音箱重新拉回了大衆視野,并爲其帶來了全新的可能。
當然,ChatGPT 能爲智能音箱産業帶來多少新變量,還需等到搭載着 ChatGPT 的智能音箱真正走進萬千家庭才能知曉。
二、小度更聰明
目前爲止,智能音箱與生成式 AI 技術的結合已經在巨頭玩家中初現雛形。據悉,今年 2 月 9 日,小度宣布将融合文心一言,打造針對智能設備場景的 AI 模型 " 小度靈機 ",并将其應用到小度全系産品中。借助小度靈機大模型,小度智能音箱中的語音助手可以變成 " 超級助理 "。
其一,借助小度靈機大模型,小度智能音箱擁有了提取和整合複雜信息的能力。
在官方發布的測試視頻中,測試員告訴超級助理,他要在周末做各種各樣的事情,而在叙述這些事的時候,測試員會故意提出 " 修改時間 " 的要求,比如原定于周日要做的 A 事件被 B 事件替換。即使面對測試員的一系列複雜要求,這位超級助理也可以從中提煉出真正有效的信息,并據此給測試員生成一份正确的時間安排表。
而此前的小度智能音箱并沒有理解和提取整合這樣複雜信息的能力,可見小度靈機模型的作用體現得比較明顯。
其二,在智能家居場景中的設備控制環節,小度靈機大模型能更準确地識别出用戶的真實需求。
在智能家居場景中,小度靈機大模型可以化身爲 " 智能管家 ",例如在官方的測試中,測試員告訴智能管家他每天早上七點半一定要起床,周末可以晚一些,大概九點,幹脆就九點半,冬天室内溫度不能低于 23 度,夏天溫度可以定在 26 度。此時,超級助理就可以根據這些描述,确定要在什麽時候開啓家中的空調、調整到什麽樣的溫度比較合适。
相比傳統智能助手隻會理解 " 打開空調 " 這樣簡單、單一的指令,靈機模型則可以認識到用戶到家時,家裏溫度與用戶所期望的不一樣,所以需要打開空調,并且根據現在的季節調節到合适的溫度。顯然,大模型的加入,可以讓智能音箱實現認知能力上的提升。
三、天貓精靈更有溫度
另一智能音箱領域的巨頭玩家天貓精靈,也亮出了其在生成式 AI 技術領域的成果積累。4 月 11 日,天貓精靈宣布将正式接入阿裏巴巴通義千問。根據官網顯示的信息,通義千問是一個專門響應人類指令的大模型,目前已經開啓了企業邀請測試,并放出了測試官網。
據阿裏巴巴集團董事會主席兼首席執行官、阿裏雲智能集團首席執行官張勇透露,未來,天貓精靈除了能回答用戶的提問外,還會成爲更人性化的智能助手,天貓精靈的策略是針對智能音箱訓練出一個個性更爲鮮明的大模型。
一方面,接入通義千問的天貓精靈能夠産生一些特定的人格化特征,滿足用戶的個性化需求。
不同于知識面更爲廣泛的通識性大模型,天貓精靈在通義千問這種更加垂直的個性化大模型的加持下,能夠變得更拟人、更聰明,其知識、情感、個性、記憶力等都會得到大幅躍升。比如 " 鳥鳥分鳥 " 這一模型,其語氣、語調與脫口秀演員鳥鳥就如出一轍,這樣也增加了天貓精靈的可玩性,使其成爲有溫度的智能化助手。
另一方面,新一代的天貓精靈将具備更爲靈活的對話能力。
接入通義千問的天貓精靈支持自由對話,用戶可以随時打斷或者切換話題,天貓精靈能根據用戶需求和場景随時生成内容。例如,用戶在跑步過程中,可以要求天貓精靈根據 180 步頻合成适合跑步的歌單,同時還可以與天貓精靈展開關于文化、人生等領域的深入交流。
得益于通義千問強大的技術支持,天貓精靈的用戶體驗将更具智能化和個性化。而在正式接入通義千問之後,天貓精靈在未來一段時間或許會出現比較大幅度的使用體驗提升,這或許也可以幫助阿裏巴巴進一步鞏固其在智能音箱市場的領先地位。
四、現實壁壘
事實上,不隻是小度和天貓精靈在 ChatGPT 領域有所布局,華爲、小米等也在生成式 AI 技術以及智能音箱領域均有布局。不過,要想讓搭載着生成式 AI 技術的智能音箱真正在每一個用戶家中實現普及,其背後還存着一些天然壁壘。
一是,算力成本高昂。從算力層面來看,面對參數規模的大幅增長," 暴力堆疊 "(利用大量高性能 GPU)已經成爲企業提升大模型訓練效果的主要手段,這背後高昂的成本可能将會成爲 ChatGPT 版智能音箱落地普及的門檻。
不過,随着開源大模型的出現,一些企業不需要自己從 0 到 1 去訓練大模型,被訓練好的大模型可以直接調用,再在這一基礎上進行優化,這相比于從頭開始訓練的大模型,其成本将少得多。并且,未來随着算法進化,大模型訓練過程中對算力的依賴度也會大大降低。
二是,搭載 ChatGPT 的智能音箱的使用場景受限。
ChatGPT 爆火的很大一部分原因是它可以颠覆式提升生産效率,而這種輸出方式主要是以文字、圖片、視頻爲主,但智能音箱則更注重語音交互。而且在人們的日常生活和工作中,需要音頻反饋的内容可能隻占一小部分,因此 ChatGPT 版智能音箱的普及落地需要尋找更多的适配于語音交互的場景,而使用場景受限則意味着使用 ChatGPT 版智能音箱可能很快也會褪去熱度。
三是,搭載 ChatGPT 的智能音箱可能面臨數據安全挑戰。
若想要搭載生成式 AI 技術的智能音箱能夠更好地理解用戶需求,并給出個性化的解決方案,那麽生成式 AI 勢必會涉及對用戶個人信息的收集,而用戶對于個人隐私的收集問題一直都比較敏感。另外,相關的法律法規并不健全,這都将是 ChatGPT 版智能音箱在普及過程中面臨的挑戰。
此外,ChatGPT 對智能音箱整個産業的影響必然是一個長期的過程,而生成式 AI 技術仍處于發展早期,其對于智能音箱這一産業所産生的切實影響可能還未明确展現出來,但可以預見的是,ChatGPT 引爆的熱潮正在加速這一進程。
專欄作家
劉曠,微信公衆号:劉曠(liukuang110),人人都是産品經理專欄作家。海南三車網絡科技有限公司董事長、購團邦資訊創始人、知名自媒體。
本文原創發布于人人都是産品經理,未經許可,不得轉載。
題圖來自 Unsplash,基于 CC0 協議。