3 月 19 日,阿裏大模型産品 " 通義聽悟 " 發布多項新功能。音視頻問答助手 " 小悟 " 上線,在業界首次實現單記錄、跨記錄、多語言自由問,支持對單個最長 6 小時、一次性上百條音視頻的内容理解問答,用戶可對超長音視頻随心提問,讓 AI 總結任意知識點。此外,針對學習科研場景對 AI 工具的強烈需求,通義聽悟推出 " 高校公益計劃 ",向所有中國大陸高校師生直接贈送價值數千元的 500 小時音視頻轉寫時長。
超長音視頻自由提問,AI 秒速總結知識點、潤色口語、做腦圖
音視頻承載了密集的信息内容,但因涉及多模态理解、自然語言處理、搜索等多項複雜技術,長期以來内容查找難、回顧難、提煉難。阿裏通義聽悟産品負責人楊帆介紹,通義聽悟爲這一需求而生。" 作爲一款工作學習 AI 助手,通義聽悟希望讓高知識附加值的音視頻被輕松閱讀、整理和分享。"
通義聽悟接入通義千問大模型,融合了十多項 AI 功能,包括轉寫、翻譯、角色分離、全文摘要、章節速覽、發言總結、PPT 提取等,并支持标重點、記筆記,被許多用戶稱爲 " 寶藏 AI 工具 "。
楊帆介紹通義聽悟曆程
通義聽悟本次升級上新了六大功能點。最重磅的是音視頻問答助手 " 小悟 ",關鍵信息直接 " 問 " 出來。小悟通過多語言 Query 處理、長篇章文本理解、指令演化框架優化及檢索增強生成算法,在業内首次實現對超長音視頻的單記錄、跨記錄、多語言自由問答,支持内容問答的音視頻時長和文件數均突破業界上限。
用戶不僅可在單一記錄頁呼喚小悟,對最高 6 小時、6G 大小的音視頻提問任何相關話題,或直接小悟要求整理金句、梳理結論、寫會議紀要;更可在首頁針對用戶所有記錄提問,支持一次性掃描理解上百條音視頻内容;也可花式對英文視頻用中文提問,小悟将直接給出中文回答,省去翻譯。作爲一個 " 懂你 " 的 AI,小悟還會智能推薦問題。
随時喚起 " 小悟 " 課代表
針對用戶需求,通義聽悟還上線了一鍵 AI 改寫、思維導圖生成等新能力。例如,一鍵 AI 改寫,将口語轉爲書面表達,尤其适合整理采訪;思維導圖自動生成,最多支持五級 xmind 腦圖,适合播客摘要。
通義聽悟思維導圖示例
産品細節體驗也進一步升級,包括筆記支持一鍵插入視頻時間戳及截圖、音視頻文件語種自動識别等。
教育福利上線,郵箱認證即可得 500 小時免費時長
學生和科研群體對 AI 新工具有普遍需求,但目前音視頻 AI 轉寫工具普遍收費,或僅提供如每月 1 小時的少量免費時長。
通義聽悟推出 " 高校公益計劃 ",推動 AI 算力普惠。所有中國大陸高校師生通過後綴 edu.cn 的教育郵箱進行認證後,均可直接獲贈 500 小時轉寫時長,存儲空間從 20G 拓展至 200G。按目前市面上語音廠商 9.9 元每小時的折扣價,這一教育福利價值數千元。
通義聽悟能聽、能看、能讀,還能實現速覽加精聽,正成爲學霸們的全新學習方式。楊帆介紹,調研中發現約一半用戶是學生,他們活躍度相當高,後台每天收到大量私信 " 求時長 "。
有的同學上課、開組會 " 無時無刻不聽悟 ";有的用通義聽悟兩倍速上網課備考;有的每天在 " 發現 " 欄目中閱讀數十檔播客節目," 獲取最前沿新鮮的觀點内容 "。
成都一位管理學博士生蔡同學在社交媒體上寫道," 通義聽悟絕對是最強科研神器 ",她向身邊幾乎所有親朋好友推薦了這款産品。通義聽悟發布才 9 個月,她的使用時長已近 7000 小時,平均每天轉寫 20 小時以上,包括分析網絡視頻進行學術研究,以及日常學習工作随時使用,這款軟件已成爲她沉澱知識和科研成果的重要平台。
作爲國内首個開放公測的大模型産品,去年 6 月發布以來,通義聽悟累計已有上百萬用戶,包括學生、老師、白領、記者、律師、金融分析師等群體,活躍用戶日均轉寫音視頻 3 次以上,平台每天處理字符數約 20 億字。