作爲一家 16 歲 AI 公司的董事長,思必馳創始人高始興在今年初第一次使用 ChatGPT 時依舊難掩驚豔," 至少,發言稿可以不用專人寫作了。"
然而,伴随驚豔而來的,還有當時外界對幾乎所有 AI 公司的質疑。
大模型走紅後,不論是計算機視覺、語音識别,亦或基于垂直任務的自然語言理解,都被統稱爲 " 上一代 AI"。在 36 氪今年的交流中,就有好幾家 " 上一代 "AI 公司坦言面對新技術倍感壓力。
對比之下,雖然思必馳也屬人工智能語音語言公司,高始興的内心卻沒有過多波瀾," 我們比較早就布局了這一技術。之前十億級的模型已經用在産品上,隻是沒有對外強調 "。
據介紹,思必馳十億級參數量的模型,名爲 DFM-1,于 2022 年研發推出,在 ChatGPT 還未火熱的 2022 年已進行了小規模産品應用。而在 7 月的發布會上,思必馳又新推出了 DFM-2 大模型,參數量達到百億級别。
除卻已有布局,高始興對思必馳的信心,還源于大模型的技術路線和場景積累。
對比其他模型,DFM-2 在技術上強調對話交互能力,在場景中強調專業化和行業化。
思必馳聯合創始人、首席科學家俞凱專門厘清了幾個概念," 通用人工智能,必須要大模型加上語言計算才行,否則隻是專用大模型。而在此基礎上,通用大模型還分全域和垂域。" 而語言計算,恰好是這家對話式人工智能公司的擅長所在。
俞凱解釋,大模型概念由來已久,包括 AIphaFold 蛋白質折疊、Stable Diffusion 圖像生成大模型到 Whisper 語音大模型等,但都沒有引起産業廣泛重視。直到對話式語言大模型 ChatGPT 的出現,展現出語言計算與大模型結合所達成的通用人工智能效果。俞凱笃信," 對話式語言計算大模型 ",是認知領域通用人工智能發展的裏程碑。
基于大模型和語言計算技術,思必馳的百億參數模型選擇落地垂直行業,而非全域。俞凱認爲,目前 To C 領域,生成式 AI 已經跨越生産力門檻,但在 To B 領域,對大模型的數據和經驗的要求都非常高。
思必馳的百億大模型将主要聚焦汽車、物聯網等行業——也就是這家公司早前已深入的領域。以汽車爲例,據介紹,自 2019 年正式進入汽車前裝,思必馳的産品目前已 " 上車 "600 多萬輛。
" 汽車和物聯網領域是思必馳的主要業務領域——服務于汽車、家電等智能化,同時,也賦能垂直行業的信息智能化,如金融、政務。" 高始興表示。
但即便對所選行業已有積累,高始興依然不否認大模型落地到具體垂直行業場景的困難。在他眼中,現在思必馳的百億大模型 " 還不錯,但依然有提升空間 "。尤其,在汽車和家電等物聯網領域,産品類别非常多,各種複雜場景下各系統的融合,都需要差異化方案——這種情況下要用好大模型,勢必是一場長期戰。
而在回答大模型是否會促進 IPO 的提問時,高始興坦言,思必馳會在今年或明年繼續啓動上市,而大模型是否會對此有促進作用,還是要看産業落地。
" 我們的主戰場針對幾個重點垂直行業,如車聯網、IOT 以及金融政務等。這個方向,思必馳在技術、資源和客戶各方面都有積累。" 他總結," 思必馳是一家比較踏實的公司。"
以下是對話部分(經節選):
36 氪 : 思必馳是什麽時候開始考慮做大模型的?而且是大模型加上語言計算的概念?
高始興:語言模型和人機對話,确實是我們首先提出的理念。我們是中國最早做對話式人工智能的公司之一,甚至可以說是首個引入這一理念的公司。
思必馳的聯合創始人俞凱曾經參與創辦過一家人機對話公司,後來被蘋果公司收購,所以我們在人機對話方面的經驗非常豐富。而在語言模型方面,我們已經做了三四年了。思必馳實際上很早就發布了十億級别的模型。
36 氪:這次發布的 DFM-2 百億模型是什麽時候開始做的?現在的進展是?
高始興:我們的百億級模型在四月份開始内部測試,現在已經開始與一些客戶進行落地應用。
另外,思必馳的模型更加深紮行業。B 端和 G 端與 C 端有很大不同,我個人認爲,或許應該由國家來做這些能夠覆蓋各種生态的大模型,因爲這應該是國家的基礎設施。對思必馳來說,行業更應該是我們模型所深耕的對象。技術型公司應該深入到行業場景中去做技術創新,做産業應用。所以,我們的百億模型的定位是具有一定的通用能力,然後深入到行業中,服務于行業的垂域模型。
36 氪:思必馳怎麽看生成式人工智能和大模型?
俞凱:今天我們講了大模型和通用人工智能。生成式人工智能其實是諸多人工智能中的一類,它可以不是大模型,也可以不是通用的,而且在人工智能領域早已存在。現在的關鍵變化是,生成式人工智能在圖像、語音和文字生成的多樣性和質量上已經到了一個突破性階段。
從産業上看,現在生成式人工智能在 To C 領域跨越了門檻。但如果是在 To B 領域,情況可能會有所不同。C 端和 B 端的需求不一樣,在 To B 領域,判别式人工智能的問題,生成式人工智能同樣會面臨。判别式人工智能關注正确與否,生成式人工智能更關注好與壞。然而在 To B 領域,即使是生成式人工智能,正确與否也非常重要。
對于我們來說,巨大的機會在于,生成式人工智能已經過了門檻,它可以作爲輔助工具,與現有的商業模式結合來擴大應用。但是,出現一種全新的、純技術的生成式人工智能被大規模複制的可能性是相當小的。
因此,在我看來,既沒有那麽樂觀,也沒有那麽悲觀。我不認爲現在的生成式人工智能能夠改變世界,但我相信,它會擴大我們的工具使用範圍,并促使我們将人工智能系統更全面地應用到工作中。
36 氪:大模型是否會對 To B 行業過去的部署應用産生影響?
俞凱:會有一部分影響,但我認爲影響比較小。這個事情特别容易判斷,舉個例子:
假設你是一名不了解 To B 業務的媒體工作者,我把你派到一個制造工廠,你能否在一天之内完成那裏的工作?如果能,那麽這項工作肯定可以被 ChatGPT 或其他通用人工智能複制。如果不能,那麽所有的積累都是有價值的。這件事的重點并不在于你生成了一些文案,而是你對整個知識流程的精确理解非常重要。
然而,你要如何獲得這種精确的理解呢?要麽需要有數據,要麽需要有人教你。但如果你沒有和廠商合作,沒有處在這個垂域内,怎麽可能有這些呢?所以行業的數據和經驗是非常重要的。因爲它無法代替人的經驗和繁瑣的 to B 流程,因爲在 to B 領域評價指标是多維且複雜的,這些無法被通用人工智能簡單替代。
36 氪:目前思必馳大模型所重點關注的行業是?
高始興 : 我們主要關注汽車和物聯網領域,這與我們的主要業務——汽車、家電智能化,行業信息智能化息息相關。對于垂直行業,如金融,我們也在做智能外呼等項目,像公安的智能審訊和反詐騙等也有。
我覺得我們目前也承載不了太多行業,而且要把幾個垂直行業的賦能做好,也是一件非常了不起的事情。
比如在汽車、物聯網領域,産品類别本身非常多,成千上萬。而且,其中有的場景需要本地服務,有的需要雲端服務,有的需要本地與雲端結合才能做出好的端到端的人機交互體驗。
在這之外,還有各種系統融合、聲學環境等需要考慮。實際上,我認爲如果不深入到行業中,是很難做好的。我們必須理解場景,而這些場景實際上非常複雜。
汽車領域思必馳從後裝到前裝,做了八到九年的時間,才做到現在的程度。我們已經做得相當好了,比上一代的語音控制技術已經進步很大,但還有進步的空間,東風大模型将會帶來新的體驗升級。
36 氪:比如說還存在怎樣的進步空間,有具體的例子嗎?
高始興:未來,我覺得汽車一定會有無人駕駛,它(大模型)就是你的駕駛助手、汽車空間的生活娛樂助手。你問它任何問題,除了常見的汽車控制等問題外,其他任何問題都可以回答你,像汽車工程師。車裏也是一個生活娛樂空間,車内學習、辦公等等都可以實現。
36 氪:比較像現在流行的 " 副駕駛模式 "。
高始興:對,一定是這樣的。我們實現了很多創新發布,如多音區人機對話,我們在這裏不僅結合了人機對話技術,還結合了一些聲學技術。無論你在車内的主駕駛座位、副駕駛座位還是後排座位,都可以進行人車交互。
有了百億大模型之後,之前的産品就像大腦更聰明了一樣。在車内,現在的人機對話還無法讓它成爲你車内的說明書。大模型之後,你可以問它關于車的任何問題,無論是維修問題,還是其他的問題,都能回答你。這就是一個例子。更高級的場景,你在車内,它就是你的助理,你可以通過人機對話進行訂票、訂酒店,一站式的服務。我們期待大模型可以像一個智能助理一樣,更好地理解和與人交流。
36 氪 : 現在我們内測的效果怎麽樣?
高始興 : 還是很不錯的,也還有提升空間。因爲這涉及到很多方面,不僅是技術性能的提升,真正的落地還需要結合我們在垂直行業中的經驗,結合這些場景進行優化,這不是一朝一夕可以完成的。比如剛才提到的讓大模型消化、吸收産品說明書,就需要我們和汽車制造商一起合作。
36 氪:思必馳今年還會啓動上市嗎?大模型會對這件事産生怎樣的影響?
高始興:我們肯定會啓動上市,但不一定在今年,有可能是明年。至于大模型是否有促進作用,我覺得核心還是要把業務做好。大語言模型隻是我們一個工具,我們一直在做人機對話語言模型,最終還是要産業落地。
36 氪:作爲一家準備 IPO 的公司,财務狀況也非常重要,但訓練大模型是一件比較貴的事。
高始興:是的,訓練大語言模型是很貴的,但好在我們過去有積累,包括人機對話的語料積累,語言模型技術的積累,以及早期購買的計算資源。
對思必馳來說,首先,這是必須要做的事情。其次,公司能承受。我們已經有了對話語言模型的技術和數據,所以這就是一個投入的問題。我們早期也有了 GPU 算力和超算中心,蘇州政府也給了我們很多支持。
36 氪:對于大模型的投入産出比,思必馳有什麽預期嗎?
高始興:我覺得效果是陸續顯現的,其實并不一定僅從 C 端直接收費。比如,如果我們的 B 端産品升級,用戶體驗好了,自然 B 端客戶就會有源源不斷的升級需求。當然我們大模型也有直接的 C 端用戶。
整體來說,思必馳的大模型主要服務于 " 溝通萬物、打理萬事 " 的理念,主戰場是針對特定行業,如車聯網、IOT 以及金融政務等,構建具有通用能力的行業專業模型。對于這件事,我們在技術、資源和客戶各方面都有積累。思必馳還是一家比較踏實的公司。