圖片來源 @視覺中國
文 | 趣解商業,作者 | 張凱旌
歲末年終,大模型廠商們又秀了一波 " 肌肉 "。
2 月 1 日,此前在大模型領域一直保持 " 靜默 " 狀态的字節跳動終于有了新動作,其上線了 "Coze 扣子 "AI Bot 開發平台;與過往聊天機器人的形式不同," 扣子 " 更像是 2023 年 11 月 Open AI 發布的 GPTs,可以讓用戶通過聊天、調用插件等方式,創建個人定制版 Bot,實現 "0 代碼 " 開發。
圖片來源:微博截圖
除了字節下場外,獵豹移動 CEO 傅盛創立的獵戶星空也在 1 月 21 日發布了自己的大模型 Orion-14B;傅盛強調,在企業應用場景中,獵戶星空大模型在結合企業私有數據和應用時,即可實現千億參數級别的模型效果。
而諸如科大訊飛、三六零等在 2023 年就第一時間搶灘大模型的廠商,如今則正迅速叠代;前者在近日發布了星火大模型 V3.5,後者則上線了大模型搜索 App"360 AI 搜索 "。
就在不久之前,手機廠商也紛紛湧入了大模型賽道。1 月 10 日,榮耀發布了自研的 70 億參數端側 AI 大模型 " 魔法大模型 ",自此,華爲、小米、OPPO、vivo、榮耀五家國産主流手機廠商在大模型領域齊聚。同時,大洋彼岸的蘋果據傳也正在測試在 iOS 18 中引入生成式 AI 功能。
" 百模大戰 " 似乎并沒有随着時間的流逝而偃旗息鼓,反而是愈演愈烈。廠商們如今都打着怎樣的算盤?2024 年的大模型賽道會迎來新的重大變革嗎?
01 大廠湧入,賽道擁擠
ChatGPT 的出現并非毫無征兆。
創造它的 OpenAI 早在 2015 年便已成立,并在 2018 年就推出了初代生成式預訓練模型 GPT-1,這也是 ChatGPT 最初的原型。
在此之前,業内的 NLP 模型(自然語言處理)主要是基于針對特定任務的大量标注數據進行訓練,能力有限。
GPT 在自然語言推理、問答任務和常識推理等方面取得了突破,爲此它也獲得了微軟 10 億美元投資。随後,從 GPT-1 到 GPT-2,到 GPT-3,短短 2 年時間裏 GPT 的能力不斷提高。
圖片來源:OpenAI 官網截圖
2022 年 11 月 27 日,随着由 GPT-3.5 修改而來的人工智能對話聊天機器人 ChatGPT 的推出,這個一直在小圈子走紅的研究成果,才第一次爲大衆所認識。能聊天、畫畫、寫文案、編代碼,強大的功能,使得 ChatGPT 一經發布迅速走紅,5 天時間注冊用戶數超過百萬,兩個月時間月活突破 1 億,成爲史上增長最快的消費者應用。
消息傳至國内,一石激起千層浪。人工智能竟然已經發展到如此地步了?震驚之下,淘寶上售賣 ChatGPT 賬号甚至都成了一門生意。與此同時,看到巨大商機的各界大佬們,也紛紛下場,表态要盡快推出自己的大模型。
從 2023 年的 3 月到 9 月,各個互聯網大廠在該賽道争先卡位。從百度的大語言模型 " 文心一言 "、360 的智腦大模型,到阿裏巴巴的 " 通義千問 " 大模型、科大訊飛的星火大模型,再到騰訊的混元大模型,國内傳統的三大互聯網巨頭 "BAT" 悉數下場。
此外,華爲、京東、商湯科技、網易有道、昆侖萬維(300418.SZ)等等都陸續推出了大模型産品,甚至連移動、聯通、電信三大運營商,長虹等家電生産企業,清華、複旦、中科院等科研院所和高校,都發布了各自的大模型。
圖片來源:華爲雲 AI 公衆号
2023 年 5 月的中關村論壇上,專家口中中國 "10 億級參數規模以上 " 大模型的發布數量尚爲 79 個;而據 GitHub 的統計數據,到 2023 年底國内已經發布的大語言模型接近 300 個。" 百模大戰 " 早已不是虛言。
不過相比當初外賣界的 " 百團大戰 "," 百模大戰 " 對資金的需求更爲苛刻。
根據 NVIDIA 官方信息,在訓練底層模型階段,訓練一次 1750 億參數的 GPT-3 需要 34 天、使用 1024 張 A100 GPU 芯片,而爲了維持日常推理,OpenAI 至少需要 3.24 萬張 A100;以此推算,ChatGPT 僅硬件成本就超過了 8 億美元。
昆侖萬維集團 CEO 方漢更是公開表示," 沒有 2000 張 A100 的卡,實驗都做不了 "。爲此,海天瑞聲、因賽集團等 "AI 概念股 " 甚至接連發布定增預案,募集資金用于訓練大模型。
圖片來源:罐頭圖庫
此時,如何在縮小與 ChatGPT 差距的同時,盡快找到應用落地的方向,并實現自我造血,成爲了 " 百模大戰 " 中,每一位參與者都要面對的問題。
02 大模型,有何應用場景?
從商業角度分析,大模型帶來的機遇,可以概括爲成本減少效率提升、原有市場需求再擴大、創造新的市場需求三大類。
大模型超強的人機對話、圖文及音視頻生成能力,不但讓其在傳統客服場景中獲得了廣泛應用,對于遊戲、影視制作等也産生了深遠影響。
阿裏、美團的在線智能客服算法,以及中國移動的 " 九天大模型 "、中國電信的 TeleChat 大模型等,都屬于此類産品,将應用場景直接鎖定在了智能客服、智慧政務等方面。在 2023 年的亞運會上,科大訊飛與中國移動聯合推出了基于星火大模型的 5G 新通話,接完電話之後,申請服務,會即刻轉成文字、生成紀要、生成待辦事項。
遊戲、影視制作方面,導演陸川曾在采訪時表示," 用 AI 畫電影海報,15 秒出來的效果比專業海報公司做一個月的還要好。"
原有市場需求再擴大,則體現在對于傳統業務的升級上,這也是大模型應用最廣泛的領域。
以傳統的搜索引擎爲例,接入文心一言後,在百度搜索框裏輸入問題,給出的可以不再是鏈接,而是一個更确定的答案。以此爲基礎,百度地圖、網盤、文庫等應用都能通過接入大模型進行重構。
旗下業務衆多的騰訊,對騰訊雲、騰訊廣告、騰訊遊戲、騰訊會議等多個業務和産品,也已完成了接入騰訊混元大模型的測試,并取得了初步效果。
圖片來源:騰訊混元官網截圖
此外,在傳統的教育、醫療、汽車等領域,大模型也獲得了廣泛的應用。
接入訊飛星火大模型後,科大訊飛的學習機實現了 AI 一對一輔助教學、中英文作文批改、口語陪練等功能;百度推出了産業級的醫療行業大模型 " 靈醫 ";華爲雲盤古大模型的賦能,則讓問界新 M7 在智能駕駛領域 " 遙遙領先 ",兩個月大定突破 10 萬台。
在創造新的市場需求方面,AI 超級助理、AI 機器人等需求也被不斷創造出來。前者,包括文心一言、訊飛星火、通義千問等在内的各家通用大模型都有相應産品,它們大都能理解用戶的語言語義,并具備圖像理解能力,可以通過調用軟件 API,使用各種各樣的工具來幫助用戶完成任務;而後者則已有包括優必選、追覓、宇樹在内的不少于 10 家機器人企業,展出過相關産品。
圖片來源:通義官網截圖
不過,在一片欣欣向榮背後,也存在隐憂。比照各家大模型的應用不難發現,不管是提高效率還是擴大需求,市場上絕大多數的應用,實現的功能都較爲雷同。
以 AI 學習機爲例,除了科大訊飛有相關産品外,接入子曰大模型的網易有道、接入 MathGPT 的好未來、接入銀河大模型的作業幫,以及接入文心一言的百度、接入 360 智腦的 360,都有類似的産品在售。功能方面,各自宣傳的也都大同小異,AI 一對一輔導、全科 AI 作業助手、虛拟人口語教練等,站在消費者的角度,幾乎很難體會到其中的差别。
盡管各家都能拿出一堆的排名榜單來論證,自己的大模型得分更高、能力更強;但體現在實際應用中時,那百分之幾甚至是千分之幾的差别,還是讓人不得不産生疑惑:我們真的需要這麽多大模型嗎?
03 2024 會出現 " 殺手級應用 " 嗎?
盡管市場中的大模型讓人眼花缭亂,但行業對大模型發展的趨勢還是形成了一定的共識。
百度創始人李彥宏就曾表示:"人類進入 AI 時代的标志,不是産生很多的大模型,而是産生很多的 AI 原生應用。"360 創始人周鴻祎也在今年年初談及大模型發展趨勢時稱,2024 年将成爲大模型應用場景之年,會出現 " 殺手級應用 "。
這也意味着,大模型與 C 端用戶的距離會越來越近。
字節的 " 扣子 " 平台就是一個例子。據 " 趣解商業 " 了解,其有着無限拓展的能力集,用戶可以通過添加插件的方式,來不斷強化自定義 Bot 的能力;此外,用戶還能将本地文件上傳到 Bot 的知識庫中,供其學習;創建出來的機器人,還能部署在不同的社交平台和應用程序上。
圖片來源:扣子官網截圖
這等于是給用戶提供了自己開發聊天機器人的機會,讓更多人能參與到 AI 生态的建設中。
與此同時,大模型也正在經曆軟件、硬件一體化協同的過程。
在這方面,智能手機廠商無疑是業界的代表。據 " 趣解商業 " 不完全統計,在國産智能手機中,目前華爲 Mate60 Pro、小米 14 Pro、vivo X100 系列、OPPO Find X7 系列、榮耀 Magic6 系列等手機都已搭載大模型。
這些大模型除了能讓 AI 助手變得更爲智能外,還有一個重點的應用領域是手機相冊。原來想消除照片中的其他遊客,隻能用 PS,且考驗手法和技術;現在直接應用 AI 抹除功能,就能一步到位且幾乎沒有破綻。
類似的還有美圖公司(1357.HK)自研的 AI 視覺大模型 " 奇想智能 "。其已與三星達成合作,用戶可以在 Galaxy S24 系列手機上體驗 AI 圖像編輯功能;不僅可以 " 智能 p 圖 ",還能通過用戶給出的圖片進一步生成 "AI 畫風 "。
與手機對标的場景是 PC(電腦)。1 月,聯想已經發布了 AIPC 産品,其在内嵌大模型後,有更強的算力支撐能力、人機交互更爲智能、應用生态也更加開放。
而金山辦公(688111.SH)推出的 WPS AI 就是可以在 PC 平台上應用的軟件産品。其将重點放在了智能文檔上,可以幫用戶輕松創作辦公所需的文本、PPT,還能自主消化 PDF 等文件資料,并解答有關這些資料的問題。
此外,教育也是一個重要的應用場景。科大訊飛、好未來、作業幫、網易有道等廠商都将大模型融入 AI 學習機中,教育類學習平闆電腦的銷量更是在 2023 年直線上升。而且基于産品的叠代,學習平闆的價格還在不斷走高。
深度科技研究院院長張孝榮認爲,大模型未來可能會朝專業化與個性化、低門檻化的方向發展。模型的功能會更加細分,針對特定領域或特定需求進行優化;同時通過提供更友好的界面和更便捷的接口,降低使用難度,讓更多的人參與到基于大模型的開發和研究中。
而且由于算力所限,大模型可能更多地部署在雲端和邊緣端;這樣可以降低計算資源和存儲資源的消耗,提高模型的響應速度和可用性。
但無論是哪種趨勢,都要與實際成本相結合;否則隻是一味投入,顯然難以爲繼。
三六零(601360.SH)在 2023 年上半年,盡管新興業務 "360 智腦 " 創造了近 2000 萬元營收,但在 9.1 億元的總收入中,占比不過 2.1%。
科大訊飛(002230.SZ)2023 年預計扣非淨利潤同比下降 71%-81%,主要原因就與公司在自主可控平台上加大認知大模型研發投入有關。
除此之外,如何讓用戶更好地理解大模型的決策過程和結果,提高其信任度,也是一個關鍵的問題。
04 中外大模型差距在哪?
國内大模型産業如火如荼,美國則更甚。根據《中國人工智能大模型地圖研究報告》,全球累計發布的大模型中,中美兩國大模型數量占近 80%。早在 2023 年 5 月,美國 10 億級參數規模以上的基礎大模型就已突破 100 個。
除了廣爲人知的 ChatGPT 外,美國具有代表性的通用大模型公司還包括 Anthropic、Cohere 以及 Google 等。
其中,Anthropic 被稱爲 "OpenAI 勁敵 "。其研發的聊天機器人 Claude 能一次性總結約 7.5 萬個單詞,比 ChatGPT 更适合處理長對話和内容、對大量文檔進行深入分析,而且具備更快的平均響應時間。
Cohere 的特點則是其差異化的定位。不同于 OpenAI,其堅定選擇了 toB 路線,提供靈活性存儲和資料隐私保護路徑,強調安全性、隐私及定制化服務。
至于 Google,最新的情況是推出了 AI 模型 Gemini,特點是多模态處理和對複雜邏輯的理解能力。在行業标準 MMLU(多任務語言理解)基準測試中,Gemini 是唯一一個成績超越人類專家測試結果的 AI 模型。
北京市社會科學院研究員王鵬認爲,中美大模型的差别主要體現在融資水平、基礎大模型發展水平和應用層發展水平三個方面。
據不完全統計,2023 年上半年,美國 AIGC 一級市場中,矽谷在人工智能領域融資總金額約 140 億美元,占世界總融資金額的 55%,平均輪次融資金額爲 3.3 億美元。同期國内人工智能領域則要謹慎得多,投資事件數量同比下降 49%,涉及總金額 61.74 億元,同比下降 62%。
而在基礎大模型發展水平方面,國内大模型還存在數據總量缺乏、算力資源缺乏、場景滲透率有限等問題。畢竟從公開數據量上看,英文數據本身占主導優勢,美國還在采取多種方式限制中國獲取算力的核心資源。
至于應用層方面,中國同樣處于跟随狀态;其中在辦公、金融及醫療領域落後美國較爲明顯。
針對衆多國内廠商都有宣稱自家大模型已經超越 GPT-4 的情況,張孝榮認爲:"從理論上說,某些廠商有可能在局部領先于 GPT4,但考慮到雙方在算法、算力和數據資源等方面的投入,國内模型全面超越 GPT4 的可能性比較小。"
在他看來,需要正視國内外大模型的差距,這涉及到技術、人才、資金等各方面的因素。
好消息是,中國有着超大的市場規模以及豐富的應用場景,爲大模型的落地應用提供了廣闊的空間和條件。而且越多的數據、場景,越能讓大模型更實用。這讓中國在底層研發技術上略遜于美國的情況下,依然具備趕超美國的機會。
但無論中國還是美國,在大模型這條賽道上都還有很多難題待解。最典型的就是輸出結果可信性不足、穩定性不強、以及安全性等問題。
對于人和 AI 來說,這都将是一個長期的學習過程。