第四範式創始人、CEO 戴文淵(來源:钛媒體 App 編輯拍攝)
ChatGPT 熱潮下,又一家 AI 公司入局國産大模型賽道中。
钛媒體 App 獲悉,4 月 26 日下午,人工智能(AI)平台公司第四範式在北京推出其 GPT 大模型産品 " 式說 3.0"(4Paaradigm SageGPT),并首次提出 AIGS 戰略(AI-Generated Software),即生成式 AI 重構企業軟件。而 " 式說 " 将定位爲基于多模态大模型的新型開發平台,以提升企業軟件的體驗和開發效率實現 AIGS。
會後,第四範式創始人、CEO 戴文淵向钛媒體 App 表示,目前 " 式說 " 大模型參數量并不固定,最高達到千億個,産品已經有十多家企業内測合作。
" 參數量其實是一個辯證的問題,我們沒有一個固定的參數,給到不同客戶的參數量也是不一樣的,會根據客戶不同場景,可能會有幾十億、幾百億參數版本。千億萬億參數隻是代表你最高的能力,但高參數意味着思維能力要求更高、算力高,而客戶場景不一定需要這麽高的算力要求,因爲不是所有場景都能接受千億參數量成本,所以客戶要選擇(大模型)。" 戴文淵強調,此前 B 端的企業級軟件的交互體驗極爲複雜,拉低了産品開發效率,如今生成式 AI(AIGC)對 B 端軟件重構和改造空間足夠大。" 式說 " 每天都在進步。
據悉,第四範式成立于 2014 年,主要爲企業端服務,聚焦于決策型 AI 領域,提供以平台爲中心的 AI 解決方案,目前該公司解決方案已應用于金融、零售、制造、能源電力、電信及醫療等行業。最新招股書顯示,2022 年,第四範式營收達 30.83 億元,同比增長 52.7%,過去五年虧損淨額達 53 億元。(詳見钛媒體 App 前文:《第四範式四赴港股 IPO:2022 年營收 31 億,過去五年虧 53 億元》)
相比其他産品,第四範式的大模型更偏向于企業生産力。該公司表示,在 2018 年谷歌推出 BERT 之時,第四範式旗下範式研究院就開始關注并投入在這一技術中,GPT-3 出來後更加明确了方向,ChatGPT 對其的幫助就是确定性的投入更大了,第四範式正把 GPT 模型從産品推進到商業化市場中。
今年 3 月,第四範式公布了企業級(To B)AIGC 産品 SageGPT(式說大模型),主要解決垂直行業生産力問題。戴文淵稱,相比最初 1.0 版本,如今 " 式說 3.0" 增加了多模态、Copilot(創作工具)以及思維鏈 CoT,具有更強的推理能力,在學習大量數據和 " 攻略 " 後,能形成中間的邏輯推理步驟,從而做到拆分并執行複雜工作。
據第四範式 4 月 24 日提交的招股書顯示,ChatGPT 這類生成式 AI 大型語言模型(LLM)是一種通用 AI 模型,與此前第四範式聚焦的決策類 AI 屬不同技術體系,因此意味着 " 式說 " 屬于該公司第二個技術體系路線。該公司引述灼識咨詢稱,未來 AI 技術将不會是由通用 AI 模型主導,而是可能更加多樣化,當中通用 AI 模型(如 LLM)和專門的 AI 系統(如決策類 AI 模型)會就不同目的共存,底層技術及使用場景兩者有本質上差異,兩者在價值定位上更具互補性而非互相競争。
對于 GPT 是否會取代決策類 AI 軟件方案,戴文淵告訴钛媒體 App,從商業化角度來說,兩者都在其一個解決方案中,解決兩種問題。具體來說是根據客戶需求分爲策略和執行,如果企業策略、管理就用決策類 AI,而解決執行問題、數字化員工時用生成式 AI 技術(如 GPT)。" 這就是量變到質變的過程。量變是,有了生成式 AI 會變得更快,而在決策類 AI 指導下,企業能更好地完成它的‘質變’,兩者間是一個相輔相成的關系。"
據悉," 式說 3.0" 能夠處理視頻、圖像、語音、文本等形式的查詢及任務,把這些信息轉化成用戶軟件能讀得懂的指令,軟件輸出響應後,能将結果展示出來。
爲了表達 " 式說 3.0" 不是線上調用 ChatGPT,戴文淵在現場讓團隊切斷公網、訪問内網集群。随後,他演示了 " 式說 3.0" 的文生圖、對話、寫文章和寫代碼等能力。比如問 " 五一要去矽谷旅遊,有什麽推薦的地方 " 會反饋谷歌、斯坦福大學等景點信息。
不過,在輸出《流浪地球 4》劇本大綱以及生産 5nm 人工智能芯片步驟等問題時,式說存在一些邏輯和回答不清等。後來戴文淵解釋稱,這主要是沒有基于知識庫的對話理解,他強調語言組織能力是否好比回答正确與否更關鍵。
在現場,第四範式還請了三家客戶企業代表,上台演示與 " 式說 3.0" 合作的大模型應用落地産品。
其中在航空制造領域,第四範式幫助改造飛機數模軟件的交互形式,研發者上傳零配件圖紙并輸入文字要求,軟件就能幫助搜索相似的零件,或者提供零件裝配的建議;在醫療領域的随訪管理軟件上,醫生可詢問當天随訪時指标超标的病人信息,軟件便能理解醫生的要求,提供相關信息,而且大模型可在用戶關懷、業務績效、醫藥工廠的庫存管理等場景解決實際問題;在金融領域," 式說 3.0" 的問答形式可以準确解釋、說明金融産品和其帶來的風險措施。
金融客戶代表在演講中提到,他們更關心大模型在企業落地時面臨的挑戰,包括内容可信風險、數據安全風險和落地成本高昂,成本是其中重要的選擇理由。" 外面一個大模型訓練一次成本要 460 萬美金,不是我們這樣中小銀行能夠扛得住的。我們是小玩家,因此這部分使用成本要達到我們可接受的範圍内。"
戴文淵表示,由于新的交互形式的出現,企業軟件的開發效率變得更高。以前月級别的軟件開發時間,現在 GPT 潔面隻需要一個 " 對話框 ",大量語料都可以輸出,隻需改背後的數據、API 和内容,因此開發效率變成了天級别的,而且式說大模型還會 update 不斷更新。
當被問及與其他大模型的市場競争時,戴文淵坦言,大家的市場策略是不同的,尋找自身定位比競争更重要。
" 很長時間很多人問我一個問題,就是你們怎麽跟商湯競争。其實我創業到今天,從來沒有在一個客戶那裏碰到過商湯。我們把 AI 拿掉,可能是 salesforce,如果商湯把 AI 拿掉可能是海康威視。你說海康威視怎麽跟 salesforce(SAP)競争。其實大模型也是一樣的,未來會是一個非常寬泛的話題。很難說怎麽競争,但至少第四範式是在 AIGC 領域的定位比較清楚的。我相信很快大家都會找到自己的定位,而不是所有人都是競争對手。"戴文淵表示。
對于算力和美國制裁帶來的采購影響,戴文淵坦陳,在出口管制約束下,相對美國 AI 公司,中國公司在大模型上的相對劣勢便是算力成本,芯片無法進口。但他提到有兩大機遇,一個是 " 東數西算 " 戰略實施可節省計算成本,另一個是對 GPU(圖形處理器)的國産替代抱有信心。AI 視覺領域追求的是單卡計算速度,現在大模型更看重卡間并聯,國産 GPU 可以未來在存儲計算分配、帶寬調整等卡間并聯相關任務上革新。
戴文淵向钛媒體 App 強調,GPT 大模型成本比決策類 AI 成本更低、效果更好一些。前者訓練一次能落地到不同的場景當中,後者成本降低需要覆蓋很多生産、人力成本等,邊際成本不如 GPT 大模型更大、更有價值。但問及第四範式何時能盈虧平衡時,他沒有回應。
"AIGC 浪潮已經開始了。未來可能每一天都會給我們帶來很多的驚喜,包括我們自己也在享受着每天都有新的成果的出現。今天我們分享了第四範式在 AIGC 領域的盈利、願景、實踐技術,我們想做的‘式說’這種生成式 AI 技術可以重構起生産力,即所謂的 AIGS。而我們現在做到的其實隻是小小的一部分,并且每天會發現這件事比我們想象的會更大。在未來的日子裏面,我們也會全力以赴來實現願景。" 戴文淵在演講結尾稱。(本文首發钛媒體 App,作者|林志佳)
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App