圖片來源 @視覺中國
從狂熱追捧到回歸冷靜,人們對大模型看法正在悄然發生轉變。一方面,由于合規、監管等原因,通用大模型商業化尚需時日;另一方面,産業側才從金融、醫療等試點領域着手投入,效果上也并不能立竿見影。
于是,當瘋轉的螺旋逐漸變慢,不同的聲音逐漸描繪出一個真實的 " 大模型 " 圖景。
這其中,究竟是上 " 通用大模型 ",還是上 " 行業大模型 ",各家也都在經過一番考量後做出了選擇;而伴随大模型之争," 生成式 AI" 進入聚光燈下。不得不說,ChatGPT 無異于是人工智能行業發展進入新階段的一針強心劑,它将 AI 重新推向了時代中心。
通用大模型與行業大模型之争
ChatGPT 讓業界認識到了通用大模型的巨大能量,這才有了後面 " 百模大戰 " 的商界奇觀,無數投資人、創業者爲此夜不能寐,GPU 資源也一時變得 " 洛陽紙貴 "。
這其中,不乏一些行業頭部的技術公司被逼上 " 梁山 "。一位大模型業内人士就曾對钛媒體 App 透露其公司所處現狀:" 沒有大模型都不好意思出來講,現在做吧,趕了個晚集,說沒有又不好交代。" 所以他們隻能一邊對外界放出正在做通用大模型的消息,一邊内部加緊研發進度。
但通用大模型畢竟是一件費時費力的苦差事,OpenAI 将 GPT1.0 叠代到 4.0 用了 6 年,百度文心一言、智源悟道等業界反饋較好的通用大模型也都是從幾年前就開始着手訓練。因此如果在 AI 技術和數據等方面沒有基礎積累,想要在短期内實現通用大模型的商業化是非常困難的一件事。
再加上通用大模型天然需要公開數據做訓練,把自身數據投入通用大模型也意味着默認将數據共享。所以,一些對數據隐私要求高的行業,也不太可能在毫無準備的情況下接入通用大模型。
在這一境況下,行業大模型成爲業界在通用大模型之外," 退而求其次 " 且能較快享有大模型紅利的方案。360 集團創始人周鴻祎也曾直言:" 人工智能大模型未來機會在企業級增量市場,大模型是‘垂直化’是發展方向。" 某大廠技術高管也對钛媒體 App 表示。" 從我們在大模型的規劃上來看,持續叠代通用大模型,并以此繼續分層,進行行業垂直大模型訓練。"
不久前,在 2023 世界人工智能大會上,騰訊集團高級執行副總裁、雲與智慧産業事業群 CEO 湯道生也表示,企業的大模型應用需要綜合考慮行業專業性、數據安全、持續叠代和綜合成本等因素。基于行業大模型,構建自己的專屬模型,也許是企業更優的選項。原因是,行業大模型所需參數比通用大模型少,訓練和推理的成本更低,模型優化也更容易。
不過,钛媒體 App 也從以爲行業人士處獲悉,在一些情況下,通用大模型也不是垂直大模型的必要條件,也就說一家訓練行業大模型的平台不必須以通用大模型爲底座。" 如果定義的通用大模型是千億參數那種,那麽通用大模型不是行業大模型的必要條件。" 在一次交流中,一位行業大模型高管向钛媒體 App 表示。不過,他也表示,通用大模型雖然不是行業大模型的必要條件,但是訓練通用大模型的各類底層技術,如 Transformer 等,卻也是訓練行業大模型必不可少的要素。
不動辄 " 千億 " 參數," 撇清 " 與通用大模型的關系,垂直大模型的門檻也進一步降低,這給生成式 AI 的進一步發展提供了更多可能性。
大模型之外,生成式 AI 也值得關注
每當談及大模型,生成式 AI(Generative Al)就會如影随形。簡單來理解兩者的關系——大模型可以理解爲實現生成式 AI 的引擎,即生成式 AI 的能力由機器學習模型或者大模型提供,而生成式 AI 比大模型更上層,生成式 AI 可以根據所需場景可以決定調用哪種大模型,ChatGPT 是生成式 AI 的典型應用之一。
早在 2020 年,生成式 AI 就入選了 Gartner 新興技術成熟度曲線,2022 年,生成式 AI 被列入主要戰略技術趨勢之一,該技術已從創新觸發階段進入膨脹期望的峰值。Gartner 認爲生成式 AI 将成爲一種通用技術,其影響類似于蒸汽機、電力和互聯網。随着生成式 AI 逐漸落地,圍繞這一概念的炒作将會逐漸消退,對人和企業在日常工作和生活中影響将會增加。
圖片來源 @Gartner
全球雲計算巨頭亞馬遜雲科技也是将筆墨更多地放在了生成式 AI 身上,亞馬遜雲科技首席執行官 Adam Selipsky 曾接受 Bloomberg、CNBC 等媒體專訪時表示:" 生成式 AI 在聊天機器人和搜索上的應用優勢已經有目共睹,但這隻是衆多可能性的冰山一角。未來,生成式 AI 将爲各行各業帶來變革。" 他把生成式 AI 看做一次 " 突破性 " 變革,且有可能是自互聯網誕生以來最大的變革。
" 想像一下,在計算機以穿孔卡片爲交互界面的年代,隻有少數科學家才有能力使用計算機;當圖形界面和鼠标成爲人機交互界面,人人都可以使用計算機。"Adam Selipsky 表示。
那麽,生成式 AI 帶來的變革會體現在哪些方面呢?
可以看到,在汽車領域,已經有企業使用生成式 AI 合成數據用于自動駕駛訓練,加快訓練進程;在制造領域,生成式 AI 可以幫助分析大量物聯網遙測數據,進行預測性維護,減少生産線的停機時間。依托生成式 AI,Autodesk 與飛機制造商合作,成功完成了艙壁的部分設計,并推出了重量減輕 45% 的新設計。如果将這種航壁推廣應用到全球機隊,将可以節省相當于 93000 輛汽車油耗的燃油。
不過需要強調的是,Autodesk 所依托的生成式 AI 背後并非是某某大模型,而是以機器學習模型構建的 AI 驅動的設計工具。
所以,對與生成式 AI 的實現來說,大模型隻是一種選擇,未來也不會是以一個大模型爲主導。钛媒體 App 關注到,大多數企業在考慮接入大模型時,并不僅僅直接入一家大模型,而是選擇接入多家。那麽這多家大模型中,未來可能也不排除垂直大模型和通用大模型的通力合作。
以國内兩款軟件用友和 WPS 爲例,用友日前發布企業服務大模型 YonGPT,據钛媒體 App 了解,YonGPT 規劃接入的通用大模型底座包含智譜 ChatGLM、文心一言以及智源悟道天鷹等;WPS 此前推出了 WPS AI,據最新消息,WPS AI 在中國内地依托的通用大模型底座爲 MiniMax,其剛剛推出的海外版本則是由 OpenAI 和 PaLM2 提供大模型支持。
在生成式 AI 的世界中,不依賴一種大模型,而決定生成式 AI 是否成功的也并不隻有大模型。
不可否認的是,生成式 AI 的落地也多方面促成的結果,且圍繞生成式 AI 落地而出現的 " 次生 " 挑戰正在暴露出來。
生成式 AI 下 " 次生 " 挑戰
" 對着手機說‘如果貓跑到沙發上,提醒我’,那麽在貓跑到沙發上的時候,手機就會收到告警信息。" 視頻解決方案服務商山東中維世紀科技股份有限公司高級副總裁王正彬在一次演講中提到了智能家居的智能視頻檢測應用場景。
但就是這樣一個看似簡單的場景,除了背後的多模态大模型,邊緣端的網絡、計算也非常重要。" 像 ChatGPT 這樣的生成式 AI 應用中,如果網絡丢包率達到 1% 的時候,大模型訓練平台的性能就會掉到它峰值性能的 5%,也就是說 95% 都丢掉了。網絡能力對整個大模型平台的性能是非常重要的因素。"英特爾中國區網絡與邊緣事業部首席技術官、英特爾高級首席 AI 工程師張宇說道。
有預測認爲,随着 AI 需求的爆發,人工智能的在邊緣端的部署,将會比在數據庫當中高 3 倍,這也意味着邊緣端 AI 的落地是下一步人工智能發展的一大挑戰。
" 人工智能部署到工廠産線等邊緣端的時間成本和人力成本還是偏高,且邊緣人工智能的部署超過一半都是失敗的。"英特爾公司高級副總裁兼網絡與邊緣事業部總經理 Sachin Katti 日前談到大模型時代下的邊緣計算問題時表示。原因一方面是設備陳舊,邊緣計算資源不足;另一方面,如何利用他們自身獨特的數據來部署 AI 也非常關鍵。很多邊緣 AI 的部署會因爲這些挑戰止步不前。
同時,生成式 AI 的更好表現最終也需要依靠數據來支撐,目前業界一方面希望能保證生成式 AI 中的數據安全,一方面也希望能夠實現數據源能夠豐富可用。
這些問題的解決,也已經在逐步推進中。" 今天的大模型體系、AI 體系是強依賴數據的,是數據驅動的智能體系。這個體系對數據所需要的廣泛性和無偏差性要求非常高。假設數據偏差性非常大,很難有效支撐人工智能體系發展。" 螞蟻集團副總裁兼首席技術安全官韋韬曾表示,于是可以看到,目前已經有反向驗證 AI 數據安全的工具出現。
在開拓數據源上,不久前,深圳數交所聯合近 50 家單位成立 " 開放算料聯盟 ",共同發起機構包括了騰訊雲、華大基因、雲天勵飛、奧比中光、優必選、中國聯通廣東分公司、華傲數據等企業,深圳市人工智能學會等協會,國家超級計算深圳中心等智庫及研究機構。該算料聯盟成立的一個主要目的,就是圍繞高質量中文訓練數據和多模态訓練數據,協調數據要素、數據治理、訓練數據、數據标注、合成數據等相關标準制定,協助數據交易所增加大模型相關的新品類和新專區。
生成式 AI 在發展過程中所遭遇的挑戰并不能一文言盡,ChatGPT 引發的全球 AI 風暴也并不以 ChatGPT 而結束。在新人工智能世界被打開後,處于初級階段的大模型與生成式 AI 也暴露了諸多問題并抛出了一系列挑戰,但同時這給各行各業提供了探索和創新的機會。
行業競逐生成式 AI,這對人工智能甚至是人類的發展來說絕非是一件壞事。
(本文首發钛媒體 APP 作者 | 秦聰慧)
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App