出品|虎嗅科技組
作者|齊健
編輯|陳伊凡
頭圖|FlagStudio
4 月 7 日,阿裏雲官方宣布,上線自研大模型聊天 AI" 通義千問 ",并定向邀請企業用戶進行測試。不過此後不久,阿裏雲官微就删除了上線測試的公告,通義千問的首頁也删除了邀請用戶測試的按鈕。不過目前,拿到了邀請碼的用戶仍可登陸通義千問,并進行實測。
在通義千問上線測試之前,阿裏雲已經對該款産品進行過一波預熱。4 月 4 日,國内脫口秀演員鳥鳥就在微博秀出了 " 鳥鳥分鳥 " 的聊天 AI 分身,并與這個數字分身進行了多輪對話。鳥鳥在視頻中介紹稱,該分身采用了阿裏的類 ChatGPT 語音助手,能夠模仿她的音色、語氣以及文本風格。
測試版的通義千問與目前市面上的大型語言模型(LLM)産品的界面類似,都是左邊對話列表,右邊對話窗口的布局,對話也是采用一問一答的形式。通義千問在單純的對話模式之上,制作了 9 款稱爲 " 百寶袋 " 的小應用。
答題一般,但似乎更好玩
相比當前上線的大模型應用,通義千問多了一個 " 百寶袋 " 功能。
通義千問的 " 百寶袋 " 中一共有 9 款小應用。其中包括,效率類:寫提綱、SWOT 分析、商品描述生成;生活類:會放飛的菜譜、小學生作文、然後呢;娛樂類:彩虹屁專家、寫情書、爲你寫詩。
設定場景對于普通用戶來說是一個非常友好的體驗類功能,給用戶提供了更強的可玩性。
" 我們曾經對 ChatGPT 的測試用戶做過問題收集,一開始用戶并不知道怎麽對 ChatGPT 提問,多數問題都是‘你是誰?OpenAI 是誰?’。" 某國内大模型研發機構專家告訴虎嗅,普通用戶玩 ChatGPT 的上手速度很慢,使用之初很難感受到基于大模型的對話機器人與傳統 NLP 有什麽差别,因此在之後的使用中,很難保持熱度——用一段時間就沒什麽問題可問了。
而像通義千問這樣,提供了設定場景的對話,可以在一定程度上提高用戶的試玩興趣,保持使用粘性。
" 留住用戶對一款大型語言模型來說非常重要,用戶的真實問答和反饋,可以說是大模型生存發展的根基。" 前述大模型專家對虎嗅說,對于大模型,算法的可延展性很高,但這仍需要基于足夠的數據進行優化,隻要有大量不斷的數據輸入,算法是可以持續改進的。
OpenAI 的算法優勢最爲明顯,這源自于其先發優勢,真正壁壘實際上是 GPT 前三個版本的持續叠代。在 ChatGPT 上線後的 3 個月中,OpenAI 就根據用戶反饋的數據對 ChatGPT 進行了兩次升級。
對于國産大型語言模型來說,現階段的研發工作固然重要,但留住真實的測試用戶,收集他們的反饋數據,對于大模型的叠代和後續的研發工作來說,更加關鍵。
大模型隻是基礎,生态爲王
事實上,應用不僅是現階段積累用戶的手段,更是大模型的未來。
在 ChatGPT 的插件功能上線之後,AI 大模型的商業化路線,在公衆的視野中,開始逐漸清晰:AI 通用大模型可能就是未來的 Window、iOS、Android。
無論通義千問還是 ChatGPT,任何一款問答機器人産品都隻是它背後的大型語言模型能力的體現,單純的操作系統是沒法賺錢的,生态才是最關鍵的。真正在 iOS 和 Android 上創造價值,賺到錢的還是抖音、美團、滴滴這樣的産品以及它們背後廣闊的應用場景。
對于通義千問未來的應用方向,虎嗅從阿裏内部人士處得到的回答是 " 皆有可能 "。該人士表示,阿裏巴巴集團的業務範圍很廣,數字化産品線豐富,通義千問的 AI 能力在很多場景和産品中均有施展空間。
與海外先行者微軟、谷歌相比,阿裏巴巴的業務不僅覆蓋了互聯網、軟件服務,還包括了大量的在線購物、生活服務、物流,以及文娛産業。
" 淘寶、天貓的客服,肯定是 AI 大模型最直接的應用場景。" 某淘寶店主告訴虎嗅,目前淘寶的 AI 客服對于店家和賣家來說,體驗都很一般。免費的機器人明顯 " 不太聰明 ",高級的付費機器人對于很多中小型賣家來說,不僅操作複雜,而且還會多出一筆 " 不必要的開支 "。
在這方面,ChatGPT 類的大模型産品明顯可以提升體驗,不過在成本方面或許還有長期優化的空間。目前,國外已經有一些基于 ChatGPT 等 LLM 模型,給網站構建聊天機器人的服務上線,例如一家名爲 Chatbase 的網站。
" 辦公軟件和 SaaS 行業現在是最有動力‘卷’大模型的行業,畢竟微軟已經公布了 GPT-4 版本的 Microsoft Copilot,現在不追上,以後可能就連追的機會都沒有了。" 某阿裏雲研發人員對虎嗅表示,釘釘在 SaaS 辦公軟件行業的市場份額在國内相當領先,這也給應用落地提供了很強的市場基礎,"目前國内用戶試用欲望很強,但是它們對産品要求也很高。"
達摩院研發的通義千問最先實踐的場景很可能會直線對接在阿裏雲的業務當中,釘釘無疑是最佳落地場景之一。在 3 月 28 日,阿裏巴巴官宣分設六大業務集團,并計劃各自獨立上市,這或許能促進通義千問在阿裏雲業務中更快推廣。
通義千問,源自阿裏達摩院在 2022 年 9 月發布的 " 通義 " 大模型。而阿裏對大模型的研究可以追溯到 2019 年的 PLUG,以及 10 萬億參數的多模态大模型 M6。
随着 OpenAI 發布 ChatGPT,微軟、谷歌、Meta 等矽谷互聯網巨頭紛紛宣布加入大型語言模型戰局,中國廠商也不甘示弱,密切跟進。這些大廠們都在競相開發自己的大模型,試圖在大模型研發中争奪生态的主導權。在這樣的背景下,如何打造大模型的生态成了互聯網大廠需要考慮的問題。
如今,各家大廠都在秀肌肉。微軟與 OpenAI 直接達成合作,谷歌公布了 LaMDA、PaLM 等大模型和聊天機器人 Bard,Meta 發布了開源大模型 LLaMA 系列并在多個測試中取得了出色成績。
國内廠商如阿裏、百度和華爲也在加緊布局,阿裏達摩院發布通義千問之前,百度剛剛推出了基于文心大模型的聊天機器人 " 文心一言 "。4 月 8 日,華爲雲人工智能領域首席科學家田奇在人工智能學會的人工智能大模型技術高峰論壇上,更新了一些盤古大模型的最新進展,并展示了盤古大模型在多個專業領域的應用場景,以及模型能力。在此之前不久,華爲雲盤古 AI 大模型中的 NLP 大模型、CV 大模型、多模态大模型以及科學計算大模型均已被标記爲即将上線狀态。
目前,國外的深度學習框架如 TensorFlow(谷歌開發)、PyTorch(Facebook 開發)、Keras(基于 TensorFlow 或 Theano 的高級 API)和 MXNet(亞馬遜開發)已經聚攏了一衆開發者。國内,百度有飛槳 PaddlePaddle 社區,阿裏有魔搭 ModelScope 社區,華爲有昇思 MindSpore 社區。圍繞這些社區,各大廠商也在打造自己的開發者生态。誰能率先在生态上占據有利地位,就能夠在這場 AI 之争中拔得頭籌,這不僅意味着應用,也意味着擁有更多的訓練數據。" 中國的 AI 大模型,先不管好不好用,先要有。" 一位 AI 芯片企業創始人對虎嗅說。