圖片來源 @視覺中國
文 | 壹 DU 财經
大模型的風在吹了半年後,終于有了新方向。
7 月 7 日,在 2023 世界人工智能大會(WAIC 2023)上,由國家标準委指導的人工智能标準化總體組宣布,我國首個大模型标準化專題組組長由上海人工智能實驗室與百度、華爲、阿裏等企業聯合擔任。
對于首批入選的 " 國家隊 " 陣容,外界并不意外,畢竟大模型的發展,需要靠技術實力格外雄厚的玩家引領。而在國家明确他們的地位及任務後,國内大模型市場的風向,開始有了新變化。
狂飙半年,行業迎來 " 國家隊 "
今年以來,大模型一路狂飙,速度超過了以往任何一項技術的發展進程。如果說在今年一季度,各個玩家蜂擁至大模型的入口,還在讨論 " 要不要做 " 的問題,到了二季度時,各家已經進化到具體 " 怎麽做 " 的問題上來。
而這樣的熱鬧場景,在 WAIC 2023 上迎來了高潮。這屆大會超 400 家企業參展、30 多個大模型集中亮點,展區面積達到了 5 萬平方米,創下了曆屆之最。
這場熱鬧的大會,不少人因爲沒有提前預約而無法進入大會現場。在被行業人士稱爲 " 規格 " 很高的大會上,網紅馬斯克、圖靈獎三巨頭之一的楊立昆、華爲輪值董事長胡厚昆、香港中文大學教授湯曉鴿,以及學界、創業界的大佬們紛紛到場。
展廳内,大模型時代、生成式 AI、通用人工智能,這些在半年前還很陌生的詞彙,如今成爲展廳裏随處可見的标志。
當然,大會現場的 30 餘家大模型的玩家們,也并沒有讓外界失望,紛紛給出了自己對于大模型的解答。尤其是 " 國家隊 " 成員的動作,更是令外界矚目。
比如百度,作爲國内首家宣布 All in 人工智能的廠商,其在大會現場的展廳格外吸引人。當然,在這個重要的場合,百度自然會展出讓更多人能體驗到的 " 鎮館之寶 ",這個被稱爲文心一格的産品,可以讓進入展廳的觀衆實現 P 圖自由。
華爲則将其 " 全球最快 AI 訓練集群 "Atlas 900 PoD A2 搬到了現場。華爲副董事長胡厚崑稱,使用 Atlas 900,人們隻需 59.8 秒就可以完成典型神經網絡 ResNet-50 在 ImageNet 數據集上的訓練,在同等精度下比第 2 名快 15%。" 這相當于在短跑賽場上頭名撞線,然後喝完一瓶水才看到第二名跑到終點。" 無疑,華爲這場硬件端基礎算力的實力大秀,使得行業人士和觀衆将視線從大模型的繁雜移至硬件端的比拼。
在阿裏雲論壇,阿裏雲 " 通義家族 " 再添 AI 繪畫模型 " 通義萬相 ",據稱,該模型可輔助人類進行圖文創作,未來可應用于藝術設計、電商、遊戲和文創等應用場景。阿裏雲智能集團 CTO 周靖人在現場表示,這是阿裏雲大模型全面掌握多模态能力的關鍵一步,未來這一能力還将逐步向行業客戶開放。
" 有錢、有人、有技術、有場景 ",這是大廠做大模型先天具備的優勢,同時也是不少初創企業很難填平的鴻溝,甚至有人在現場直接指出,中國的大模型落地,隻會在五家大廠之中,即 BAT+ 華爲 + 騰訊。
但巨頭們要怎麽做?下一步會走向何方,這是一個很大的命題。
抛棄概念與情懷,巨頭紛紛專注于場景落地
今年的人工智能大會,大模型成爲當之無愧的頂流。
阿裏通義、百度文心、華爲盤古等國家隊紛紛亮出自己的硬實力,同時,訊飛星火、商湯日日新、網易伏羲等 30 多個垂類大模型也沒有輸掉氣勢,在各自的領域裏埋頭苦幹。
但從現場的情況來看,他們似乎已經摒棄了大而空、講故事、講情懷的做法,轉而開始專注于講落地場景和案例。這是大模型前進的必由之路,同時也極有可能成爲下一階段的重頭戲。
在大會上,華爲雲盤古大模型 3.0 正式發布,引來不少行業人士圍觀。更令行業印象深刻的在于,華爲常務董事、華爲雲 CEO 張平安所言——盤古大模型很忙,忙着做事,沒有時間作詩。而作詩,正是此前半年發布大模型的玩家們最愛幹的事。
在張平安看來,華爲希望盤古大模型可以幫助各行各業,如金融、政務、礦山、氣象等,而非專注在語言大模型層面。據其透露,截至目前,盤古大模型已經在氣象、醫藥研發、電力等領域落地,并交付了多個千億參數大模型。
同樣把場景落到實處的還有百度。百度作爲較早入局的玩家,早在四年前即發布文心大模型,隻是當時行業對于大模型的關注度不夠,以至于沒有激起太多水花。但對于百度而言,文心大模型是先行業一步的超前布局。如今,這個前瞻的産品也收獲頗豐。
在 WAIC 2023 現場,百度首席技術官王海峰稱,現在百度已經升級到文心大模型 3.5 版本,較之此前的版本,效果提升 50%、訓練速度提升 2 倍,推理速度提升了 30 倍。在成本上,更是降到過去的 10%。
" 把促進中國大模型生态的繁榮作爲首要目标,向大模型創業公司提供全方面的服務 "。阿裏雲 CTO 周靖人如此說道。很明顯,這延續了阿裏雲提出的 MaaS(模型即服務)概念。
在大模型領域最晚入局的騰訊,最近 20 天内動作不斷。6 月 19 日,騰訊首次公開透露對大模型的思考;6 月 26 日,首次披露自研星脈高性能計算網絡;在 7 月 7 日 WAIC 2023 上,騰訊雲副總裁、騰訊雲智能負責人吳運聲對外公開了騰訊在大模型應用創新的成果,并稱,騰訊雲行業大模型能力已應用到金融風控、交互翻譯、數智人客服等場景中,提升了智能應用效率。
當然,細分領域的大模型也展現出旺盛的生命力。曠視科技聯合創始人、CTO 唐文斌在接受媒體采訪時說道:" 應用落地是衡量大模型價值的唯一标準,曠視科技會從視覺大模型向通用多模态大模型進軍。"
專注場景落地,切實爲企業用戶提供降本增效的方案,成爲當下大模型玩家集中發力的點。而未來,大模型早已從 " 做與不做 ",真正邁進了 " 做得怎麽樣 " 的問題。而這正是大模型之争的下一步。
參與未來之争,先回答這四個問題
雖然大模型很火,但從開局到推向市場,中間還有很遠的一段路要走。在此過程中,很多難點已然暴露出來。
不過,在壹 DU 财經看來,大模型的未來之争,多半會在四個緯度展開。即:技術、人才、資金以及商業化落地。
首先看技術層面。毫無疑問,人工智能是當前最爲先進的技術之一,在技術層面,其所需要的積澱不可能在短時間内補齊。" 大 " 算力、" 大 " 數據、" 大 " 模型是目前大模型的基本特征,同時也是大模型的産業化落地面臨的挑戰,目前來看,數據規模雖大,但數據質量參差不齊。其次,模型的體積大,訓練難度更高,第三是算力規模大,對硬件性能要求會更高。
這也意味着,沒有足夠的資金作爲支撐,很難組建這樣一個超強的戰隊。一位營銷雲創始人與壹 DU 财經溝通時曾提到:" 從 3 月份投入做行業大模型以來,整體資金投入非常大,甚至超過了公司成立到做大模型之前的總和。" 不過,他也提到,如果做成了,對于公司的未來十年發展,絕對是定心丸。
在此之前,不少行業人士就曾提出 " 大模型是大廠燒錢的遊戲 "。這種說法并非毫無道理。
雖然大模型很火,但全球範圍來看,資本卻未跟上技術複蘇的節奏。研究公司 PitchBook 的數據稱,今年前六個月,全球風險投資資金幾乎減少了一半,下降 48% 至 1739 億美元,交易數量也下降了 19%。
在中國,截至今年 6 月底,有十幾家大模型初創公司獲得融資,在已經公布融資額的企業中,融資規模最大的是 MiniMax,今年 6 月獲得騰訊公司超過 2.5 億美元 A 輪融資;光年之外在被美團收購前,也獲得了 2.3 億美元的天使 + 輪融資。
再來看大廠的投入情況,此前,钛媒體的統計數據頗能說明問題,2022 年,華爲在研發費用上投入爲 1615 億元,成爲國内研發投入最多的企業;其次是騰訊,雖然低了不少,但也保持在 614 億元的水平,阿裏排在第三,研發費用爲 555 億元。公開資料顯示,百度作爲較早入局人工智能的玩家,過去十年,其在 AI 領域的投入超過 1000 億元。這樣的投入規範,顯然不是一般企業可以比拟的。
有技術、有資金,大廠們對于人才的吸引力相對更強。今年年初,各家開始了瘋狂的人才搶奪戰。百度以 25-40K 的月薪招聘 AI 大模型算法工程師,更闊氣的阿裏以 40-70K 的月薪招募大模型訓練及算法工程師。
在某招聘平台上搜索關鍵詞 " 大模型 " 後,會發現,一些企業願意給到 2023 屆畢業生 15-25K 月薪的待遇。同時,一些垂直賽道的企業也參與了這輪搶人大戰。比如某貿易公司招聘的醫療大模型産品經理,薪資範圍爲 25-50K,某遊戲公司招聘語言大模型的算法工程師,也給到了最高 50K 的薪資。甚至中國電信招聘的大模型平台産品經理年薪可以達到 84 萬的水平。
水漲船高的人才、技術以及資金,無不催促着大模型的玩家們盡快落地、盡快商業化,畢竟,按照商業規律,最終這些投入需要産出回報,才有價值。
但大模型的落地成本,同樣是各大玩家需要跨過的檻。曾有行業人士估算,大模型訓練一次的成本極高,達到了 200-12000 萬美元。這也意味着,AI 大模型的商業化落地,可能還得回到成本核算這件事上。
結語
站在當下看大模型,整體很像 1998 年的互聯網,初于起步階段,泡沫很大,機會也很大。在這種情況下,真正有實力的好公司,未來的成長性會更好,價值也會越來越大。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App