教育科技公司精準學宣布,公司已在 AI 語音交互技術上取得領先性的突破,成功訓練了中國首個語音端到端大模型 " 心流知鏡 -s ( V02 ) ",可直接實現語音輸入 - 語音輸出的交互,使其更适配輔學場景,使大模型達到 " 真人老師 " 級别的自然對話交流體驗。
" 心流知鏡 -s ( V02 ) " 使用端到端語音結構,避免了級聯 ASR+LLM+TTS 方式額外延遲,同時也更好的改善純文本模型損失的情感節奏等豐富信息,接近人類的語音交互體驗。
精準學也提供時間表開放基礎模型供學術和非商用使用,緻力于爲中文 AI 社區的科研和技術探索作出貢獻。
" 心流知鏡 -s ( V02 ) " 的發布,不僅将在高質量中文語音 Codec 和中文自監督預訓練 Encoder 基礎設施上填補中文開源社區的空白,還将在全球範圍内成爲首個開放給技術社區的語音端到端大模型。
精準學将于近期對外展示這項技術的應用成果。5 月,公司獲得了阿裏 2 億元投資,目前其 AI 輔學機 Bong 系列已在天貓京東上線。不久後用戶也可以在精準學 AI 輔學機上體驗到這項技術突破成果。