圖片來源 @視覺中國
文|硬科技星球
3 月,随着 OpenAI 新一代模型 GPT-4 以及百度 " 文心一言 " 的正式公布,通用人工智能 AGI 的概念再次點燃全球社交平台。從最初的文字對話到如今的看圖寫代碼,AGI 領域終于迎來了屬于自己的 "iPhone 時刻 ",而對話式 AI 這一充滿無限可能的 AI 類型也再次展現出融合未來趨勢的美妙圖景。
本月初,人工智能聊天機器人公司 Character.ai 獲得一筆超 2 億美元融資,由 a16z 領投,其聯合創始人 Mark Andreessen 将加入 Character.ai 董事會。作爲一家成立不到一年的公司,Character.ai 在 0 收入的情況下達到 10 億美元估值,并得到資本巨頭青睐,發展不可謂不快,但其業務卻非常 " 簡單 " ——創建人人可用的 AI 聊天機器人。
在 Character.ai,你可以和任何你想到的人物對話,無論是現實中的埃隆 · 馬斯克還是漫威電影裏的托尼 · 史塔克,任何人都可以創建屬于自己的虛拟人格并與其對話,對方則會代入對應的身份和語言風格,看似簡單的業務背後是真正的千人千面型 AI 未來。打造這一宏大目标的是谷歌早期員工之一,也是 Transformer 作者之一的 Noam Shazeer,從谷歌離開之後,他的對話式 AI 如今成爲投資領域關注的焦點。
縱觀全球,個性化聊天機器人作爲流行趨勢已愈發明顯。從海外的 Character.ai 到 Replika,各自都在探索 " 人人享有各自專屬 AI 聊天機器人 " 的未來,而回望國内,該領域的發展也日益受到投資者關注,無論是自微軟小冰團隊獨立的小冰公司,亦或者是由清華大學黃民烈教授創立的聆心智能,近年來都正逐漸成爲新一輪革命的排頭兵。
投資潮爆發,對話式 AI 價值凸顯
近兩年,以 OpenAI 爲代表,對話式 AI 成爲資本領域的香饽饽。今年 1 月,微軟确認了對 ChatGPT 母公司 OpenAI 的新一輪數十億美元投資,而 Character.ai 在 0 收入的情況下也于今年 3 月完成超 2 億美元融資。根據 PitchBook 統計數據,2022 年投資圈向生成式 AI 的投資總額達到 13.7 億美元(折合人民币約 93.69 億元),幾乎爲過去 5 年的總和。
這其中,對話式 AI 以自然語言處理技術(NLP)爲核心,使機器可以理解、反饋人類語言并從交互中學習,最終實現人與機器之間的自然對話,成爲衆多企業沖擊的技術領域。然而,很長一段時間裏,對話式 AI 作爲和人們日常距離最近的 AI 技術類型,一直被認爲 " 不聰明 "" 沒有條理 "。這是由于對話本身是語言處理中最困難的任務,早期聊天機器人的表現都比較刻闆和機械,以 " 關鍵詞 + 模闆 " 爲主,将輸入語句與預先定義的 FAQ 知識庫進行匹配,但在随後,對話式 AI 的發展過程不斷提速,共經曆四個階段:
規則引擎階段:這一階段主要是基于規則的對話系統,即設定一系列規則和模闆,用于響應用戶的指令和問題,但是由于規則的限制和模闆的創新難度,導緻該階段的對話系統具有很大的局限性。
統計學習階段:随着機器學習和自然語言處理技術的發展,人們開始嘗試使用統計學習方法來構建對話系統,主要是基于概率模型的統計語言模型,如隐馬爾可夫模型和條件随機場等,但是由于數據和算法的限制,該階段的對話系統仍然存在很多問題。
深度學習階段:随着深度學習技術的發展,人們開始使用神經網絡模型來構建對話系統,主要是基于序列到序列模型和變形自編碼器模型,如 Google 的 Seq2Seq 和 Facebook 的 FastText 等。這一階段的對話系統在理解上下文和語義的能力方面取得了很大的進步,但是在生成多樣性和流暢度方面仍然存在一定的問題。
GPT 模型階段:近年來,以 OpenAI 的 GPT 模型爲代表的大型預訓練模型的出現,使得對話式 AI 的生成能力和智能水平得到了飛躍式的提升。目前,GPT-3 和 GPT-4 已經可以實現高度流暢的對話和知識問答,并逐漸應用于多個領域。
對話式 AI 的發展經曆了從規則引擎到統計學習,再到深度學習和 GPT 模型的階段,随着技術的飛躍,其應用場景和智能水平也不斷擴展和提高。根據《AI 對話系統分級定義》,過去,隻能夠完成單一場景下的對話在 L1 和 L2 之間。當問題數量多、語義複雜時,攔截率較低,難以快速實現響應,客戶滿意度低,且維護成本較高。如今,随着大模型的發展,從數據、算法、算力等方面使對話式 AI 産生巨大變化,ChatGPT 爲代表的的 L4 級别對話式 AI 無疑是工程、技術、數據等方面的綜合成功,并朝着 L5 級别進一步邁進。
如今,對話式 AI 在行業垂直類應用上已展現出其價值。以 Character.ai 爲例,通過搭建端到端的工程棧,覆蓋模型的研發與訓練、數據、應用整條價值鏈。用戶不僅能夠随意與平台上訓練好的海量對話式 AI 角色進行對話互動,還能夠訓練自己需要的任何虛拟角色,并保持角色的屬性一緻性。這些産品特性不僅将 Character.ai 自身的能力無限延伸,也保持了較高的用戶黏性。在外界看來,Character.AI 擁有較大的商業發展空間,不僅能夠面向 C 端以訂閱式服務打造千人千面的 Ai 陪伴式應用,也能夠面向 B 端用戶打造符合其定制特性的個性化 AI 形象。
無論智能客服、IoT 語音助手、醫療診斷還是金融風險評估等領域,其商業價值快速提升,投資潮也随之爆發。而對千人千面的 AI 聊天機器人來說,其價值不僅在于簡單的問答,還能夠根據用戶的口吻、情感等進行情感分析和智能回複,提升用戶體驗的同時,進一步融入更多領域。
多家概念股持續拉升,國内對話式 AI 争先冒頭
放眼國内,對話式 AI 的市場潛力也不可小觑。根據利文聯合頭豹研究院發布的《人工智能系列報告:2021 年中國對話式 AI 市場報告》數據,2021 年,中國對話式 AI 市場規模爲 82.7 億元,到 2026 年,這一數字有望增長至 265.8 億元,年複合增長率高達 26.3%。
與此同時,國内巨頭 " 跑步入場 " 對話式 AI 領域,百度、阿裏、字節、京東等大廠接連入局,各大 AI 創企也不甘落後。今年以來,以百度 " 文心一言 "、複旦團隊的 "MOSS" 爲代表的功能型語言大模型路線,和以小冰公司 " 小冰島 "、聆心智能團隊 "AI 烏托邦 " 等代表的拟人型語言大模型路線受到了廣泛關注。随着衆多玩家廣泛深入,創新項目不斷湧現,但無論是大型企業還是創業公司,在人才建設、技術突破、商業模式等方面都處于早期階段,更需要長期堅持、投入和創新。
國内,早在 2021 年小冰公司發布了全球首個 AI 社交平台 " 小冰島 "。在該平台中,人類用戶可以創造各種人工智能個體,并形成一個共同生活的社交網絡。在大模型領域,小冰公司發布了 " 小冰鏈 "。小冰 CEO 李笛指出,小冰鏈采用自然語言處理技術,能夠理解用戶的問題,并給出相應的答案。此外,小冰公司在檢索模型、生成模型、大模型和 X-CoTA 等方面也實現突破,于 2022 年宣布完成了總額 10 億元人民币的新融資。
北京彩徹區明科技在 2021 年推出的 " 彩雲小夢 ",基于常識和小說語料訓練的中國本土語言模型在續寫生成方面相比 ChatGPT 也有着不錯的表現。其核心邏輯是用戶輸入一段文本,就可以用 AI 續寫一段文字,用戶還可以任意的增删改。2022 年 " 彩雲小夢 " 推出了 2.0 版本,用 NLP 技術驅動對話場景,在情節續寫的基礎上實現用戶與 AI 虛拟人物的對話,提供更多互動性和情感陪伴。
相較于前兩者,2022 年 11 月上線的 Glow 屬于 " 新玩家 ",但吸引了部分 Z 時代年輕用戶。該産品和 ChatGPT 百科全書一樣的回答不同,其定位爲 AI 虛拟聊天社交軟件,主打聊天、陪伴等情感功能。GLOW 背後的公司 MiniMax 成立于 2021 年 12 月,以實現 AGI 爲目标,由前商湯副總裁闫俊傑創立。在 2022 年上半年由明勢資本領投了天使輪融資,此前米哈遊參與了對 MiniMax 的兩輪投資,目前正在謀劃與紅杉資本共同發起新一輪投資。
2022 年 12 月上線的 "AI 烏托邦 " 則對标 Character.AI,由清華大學黃民烈教授創立的聆心智能團隊推出,通過小程序和網頁端向公衆開放,也引發了 Z 世代用戶群體的廣泛關注。該産品基于聆心智能團隊自研的超拟人大模型,根據大模型可控、可配置、可信的核心技術優勢,優勢在于允許用戶快速定制 AI 角色,提供千人千面的 AI 形象,不僅能夠滿足用戶聊天、陪伴的情感需求,還能夠提供與 ChatGPT 相似的助理、百科功能。目前,聆心智能已完成 Pre-A 輪融資。
機遇和挑戰,對話式 AI 成爲泡沫還是希望?
2023 年作爲經濟全面複蘇和發展的重要一年,數字化轉型成爲當前中國經濟發展的 " 主旋律 ", 其中人工智能技術在數字經濟建設中發揮着重要作用。
我國曾提出《新一代人工智能發展規劃》,明确 " 三步走 " 戰略:2020 年實現我國人工智能總體技術和應用與世界先進水平同步;2025 年實現我國人工智能基礎理論重大突破,部分技術與應用達到世界領先水平;2030 年實現我國人工智能理論、技術與應用總體達到世界領先水平。2022 年,科技部等六部門聯合印發的《關于加快場景創新 以人工智能高水平應用促進經濟高質量發展的指導意見》,圍繞構建全鏈條、全過程的人工智能行業應用生态建設十大示範場景,爲加快推動人工智能應用。在這樣的政策背景下,人工智能技術在助力穩定經濟當年發揮積極作用,同時爲培育新的經濟增長點保駕護航。
從市場前景來看,據 IDC 研究預計在未來 5 年内,對話式人工智能在金融、零售、制造、醫療、政府和教育等六大行業至少會帶來 30%-64% 的價值提升。随着技術的不斷發展和普及,對話式 AI 已經在許多領域展現出了它的巨大潛力,如客戶服務、醫療診斷、教育培訓等。對話式 AI 不僅可以爲用戶提供更加智能化、個性化的服務,還可以幫助企業降低成本、提高效率,對于推動産業升級和經濟發展具有重要的作用。
與任何新興技術的出現一樣,對話式 AI 仍存在一定的挑戰。
從技術方面來看,目前的對話式 AI 還難以完全替代人類的智能,特别是在情感理解、判斷和創造性方面。其次,對話式 AI 的普及和應用還存在一些法律和道德問題,如數據隐私、安全性、責任和權益等方面。這些問題需要得到社會和政府的關注和解決。
從應用層面來看,一是語言輸入的問題,目前的對話式 AI 産品,僅支持正式的文本或語音,這提高了用戶的使用門檻,一些方言、口音等語言會影響 AI 對原始輸入的理解,進而産生錯誤或者無效的回答。二是 AI 的輸出問題,無論是 ChatGPT 還是其它大語言模型,都可能面臨着胡編亂造、不安全可信的問題,這不僅需要平台在模型層面做好控制,也需要做好相關政策的治理,避免産生 " 有害的應用 "。
以 Character.AI 爲代表的對話式 AI 的出現預示着無縫人機交互時代的來臨,也加速了國内外對話式 AI 領域的成長态勢,但要打開市場,需要的不僅僅是模型的技術,還有場景化的應用開發。
如今,海外企業在人工智能方向的投資和熱情已經從技術本身走向了如何應用落地,也爲國内行業探索帶來啓示。清華大學計算機科學與技術系長聘副教授、聆心智能創始人黃民烈指出:" 行業發展需要推動大模型整個生态的發展,不僅需要底層大模型,也需要業務、垂直場景大模型、工具層,以及直接應用型的公司。" 在他看來,教育、金融、數字産業将成爲大模型應用生态的重要領域。
随着高性能大模型的成本正在快速降低,未來對話式 AI 應用層的颠覆式創新或許不在技術,而在于産品設計的絕妙想法。那些更具有創業精神、産品基因的年輕團隊,或許更能抓住這一次浪潮。
目前來看,行業先行者們已經初步形成以數據爲核心的飛輪效應,伴随用戶與平台上的虛拟角色産生互動,海量的數據成爲完善其基礎模型的最佳基石,正如從量變引發質變的 GPT-3 一樣,在虛拟人格方面的行業進展将大大超過人們想象。
未來,随着對話服務場景的智能化和線上化,AI 對話引擎與産業深度融合将成爲未來社會釋放數字化疊加倍增效應、構築綜合競争優勢的必然選擇,并有極大可能改變人類的生活和生産方式。而如何積極擁抱這門新的技術并通過 AI 實現更高的人生目标與價值、實現更廣泛的應用并産出更高的業務價值,是個人與企業共同需要關注的命題。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App