圖片來源 @钛媒體拍攝(下同)
大模型在 B 端應用的焦慮感正在向會議辦公場景襲來。在本周開幕的 Infocomm China 2024 展會上,全球 400 家巨頭和新興品牌展出超過 500 款新品,但隻有零星品牌公開了在會議場景中大模型能力可能有的樣子。
視頻會議場景是否适合于大模型?騰訊會議副總裁吳祖榕一年前同樣的展會上對外界表達:" 騰訊會議的場景非常适合大模型訓練,無論是人物講話、視頻内容、共享屏幕還是會議紀要,都是多模态大模型重要的信息來源。"
今年,騰訊會議已經将其混元大模型能力融合到會議場景中,以類似于 "AI 助理 " 的方式呈現。不僅是騰訊會議,钛媒體還注意到,今年的 InfoComm 展台,海康威視、大華等參展 AI 企業也展示出了智能會議屏等産品,科大訊飛、思必馳等 AI 企業也透露将基于各自所訓練的大模型能力融合到會議場景。
不少企業都展示了面向會議場景的智能物聯設備,包括智能交互平闆、AI 音頻吸頂麥,以及鍵盤、鼠标等 AI 智慧辦公整體解決方案。它們無一例外,對會議智能化帶來的聽覺、視覺、内容上更加沉浸專注的會議體驗,持有積極理念。
會議,在極緻效率背後的聚合思維
當你處于高度信息交流的會議現場,遲到 10 分鍾上線,但對入會前講話人提及的信息一無所知,你該怎麽辦?
當你開會時,遇到交流中專業的術語,需要你快速檢索回應,能不能跳轉到搜索框?
再者說,當你被動拉進冗長的會議,想偷懶摸個魚,悄無聲息地做一份 " 假期旅遊攻略 "?
這類場景其實很常見,但在此之前,沒有多少産品關注到這類用戶痛點。
據官方介紹,在騰訊會議 4 月上線的 3.25 版本中,針對會員版、商業版、企業版,騰訊會議 "AI 小助手 " 功能,可在會後對已錄制内容分時間、章節、發言人等進行更精準地提問,實現個性化會議整理。
钛媒體了解到,目前騰訊會議上線的 AI 小助手,基于混元大模型,用戶可通過會話框提問,小助手即可總結會議中說話人的要點信息;如果開會中走神,也可以讓小助手提前設置關鍵詞對與會者進行提醒,提高入會效率。當開會結束,用戶還能在曆史會議界面找到相應的 " 提問按鈕 ",找到過去提問的記錄。該過程中,是跟用戶與 AI 的互動界面,是相對私密的。
展台前,不少人士對騰訊會議這款産品功能駐足。騰訊會議産研負責人賈民偉向钛媒體介紹道,騰訊會議将在 5 月前後上線 AI 小助手新功能,與當前版本核心區别就在于,針對 " 會議外 " 的場景,也實現大模型能力的接入。可以理解爲通用 ChatGPT 的入口,AI 小助手也将實現通用 AI 能力。
賈民偉指出,目前該功能面向商業版和企業版,計劃一個賬号一年 840 元進行收費。舉個例子,一家企業有萬人企業規模,但并不代表着需要給所有人買 AI 助手的賬号,可能其中有一千人,強會議使用者購買就可以。
此外,他還表示,對于企業員工而言,可能這也是接受和将 AI 能力普及化的一個入口。他們跟很多互聯網企業溝通時談到,很多企業的職能部門包括行政财務,以及一些業務人員,對 AI 怎麽使用,怎麽跟 IT 部門協同,其實沒有清晰的認知。
相比于在檢索引擎的對話框去檢索問題,騰訊會議希望能減少這一動作,不需要再去跳轉到另一個接口,在同一個場景内聚合所有的 AI 能力。" 會議是一個很好的入口,大家習慣于每天去開會,先告訴你 AI 在會議中怎麽使用,然後逐步向業務場景延伸。"
大模型落地到硬件生态,還需要多久?
會議硬件産品正逐漸吸納先進的互聯網技術實現功能适配和場景融合。
騰訊會議的展區非常顯眼,這多半還源自多家硬件生态夥伴的 " 遙相呼應 ",MAXHUB、羅技、耳目達、poly、維海德、億聯網絡等多個硬件廠商,均展示了與騰訊會議合作的适配不同場景的會議解決方案,例如騰訊天籁最新升級的 16mic 多模态人像分割、精準區分、定位發言人和去混響等能力,就已經應用其中。
從 2021 年開始,騰訊會議公開布局硬件生态,核心的音視頻解決方案——騰訊天籁語音模組,就已經搭載到連接器、一體機、智能大屏、揚聲器麥克風、攝像頭等硬件設備廠家産品中。
那麽,硬件産品接入大模型需要儲備哪些能力?或者成本有多高?
钛媒體觀察,不同于可封裝适配的 AI 語音模組能力,會議硬件産品接入大模型能力可能也需要具備一定的端側能力。假設有大量用戶同時進行推理請求,會消耗大量的服務器計算資源,這對于服務商來講,基于雲端進行推理的成本是非常高昂的;而對于用戶,基于端側具備的計算能力,也會減少延遲,或者模型并發的情況。
在整個會議環節中,對大模型的調用也不止于文本對話框,也會有視頻、圖片能力的解析。因而,會議用上大模型,仍需要一定時間來探索和解決這類問題。(本文首發于钛媒體 APP, 作者|楊麗,編輯 | 蓋虹達)