" 通用大模型關乎國運之争 " ……
" 人工智能 +"首次出現在政府工作報告中,并直接上升爲一種行動 。
雷軍劉慶峰等代表委員都将人工智能納入到自己的建議之中;
又是一年兩會進行時,AI 大模型受到前所未有的關注。
彼時在大洋彼岸的另一邊,GPT-4 正被最新大模型全面超越,Sora 新視頻持續驚豔網友。
一時間,關于國産通用大模型未來發展、中美之間差距還有多少的話題再次引人注目。
既如此且先來看看,兩會都聊了啥?或許能從中找到答案。
人工智能火爆兩會
與開展 " 人工智能 +" 行動相呼應的是,20 多位全國人大代表或政協委員都談到了大模型相關,覆蓋到從底層數據算力、模型層以及應用層的方方面面,爲當前正面臨的挑戰建言獻策。
通用大模型又成爲這其中的關鍵詞。這樣的盛況,以往并不多見。
在具體建議中,可以看到大概有三個方面:技術瓶頸、未來發展以及應用落地。
技術瓶頸:數據、算力和産業生态
當前國産大模型技術瓶頸還有哪些?包括科大訊飛董事長劉慶峰、知乎創始人周源、京東集團技術委員會主席曹鵬、中科院計算機所研究員張雲泉等在内都發表了自己的看法。
知乎創始人周源談到了數據方面的挑戰,他認爲對大模型數據采集進行監督和審查。
京東集團技術委員會主席曹鵬、中科院計算機所研究員張雲泉等在内都談到了突破算力瓶頸,曹鵬鼓勵國産算力軟硬協同,張雲泉提出了集中 AI 芯片研制、設立智能算力發展專項組等幾個方向的建議。
而科大訊飛董事長劉慶峰則從算力、底座平台、源頭技術研發等維度介紹了我國發展大模型存在的短闆,并建議制定國家《通用人工智能發展規劃》,來縮小中美通用人工智能産業的差距,打造我國的比較優勢。
未來發展:教育人才和政策法規也成關注焦點
技術之外,教育、人才建設、政策法規等方面也成爲了代表們的關注焦點。
小米創始人雷軍提出了三項人才相關的建議:從義務教育階段普及人工智能素養教育;大力推進高校人工智能相關專業的建設;支持大型科技企業和教培機構培育人工智能應用型人才。
還有一些法律界人士,比如金杜律師事務所高級合夥人張毅,提出推進《人工智能法》的出台。
應用落地:如何賦能千行百業?
值得一提的是,此次還有來自影視、體育、農村、養老、制造、文旅等各行業代表也都參與到對于人工智能發展的讨論之中。
比如 Sora 對影視行業的影響,演員靳東在接受采訪時談到一些服務型的崗位可能會被替代,但短時間内,人工智能很難替代影視等創作行業。
還有像美的副總裁鍾铮、拈花灣文旅董事長吳國平、天能控股集團董事長張天任提到了人工智能在制造業、文旅、養老等行業的應用。
……
可以看到的是,大模型毫無疑問地成爲此次兩會的焦點。在二十多位人大代表或政協委員的提案中,其實也能總結出當前國産大模型的發展縮影:技術挑戰仍在,人才政策得跟上,應用發展要加速。
中美差距還有多大?
ChatGPT 的出現,國内掀起千模大戰,部分玩家的大模型在一年時間實現了對标 GPT-3.5 的實力,部分能力超過了 GPT-4。
而 Sora 橫空出世,僅需通過文本即可自動生成 1 分鍾視頻,給視頻生成領域帶來了颠覆,其展現的性能對同類産品實現了碾壓……
于是乎,關于中美之間的差距是否進一步加大再次引發熱議。數據、算力、人才培養和投入成爲這當中讨論的焦點。
但中美差距具體還有多大?始終沒有什麽定論。
此次兩會上,科大訊飛董事長劉慶峰首次給出了定量描述——
1-2 年,追平。
爲什麽會是這個數字?劉慶峰做了進一步解答。
他認爲中美博弈的 " 主戰場 " 就是在通用底座能力上持續進行對标。而 Sora 正是基于 GPT-4/4V 的通用大模型底座能力所延伸出來的特定領域的成功實踐。
同樣延伸的還有像 DALL-E3、Whisper。
他還以訊飛星火大模型爲例,預計 6 個月内可達到 GPT4/4V 當前最好水平。但随着 GPT-5 的發布," 這個差距可能會被拉到一年以上 "。
因此他也強調稱,這也會是一個你追我趕的動态過程。
在劉慶峰這一推論中,在人工智能領域,将通用大模型推至到一個高點,成爲中美之間差距的核心競争點。
也有代表此次在兩會上表達了類似的觀點:通用大模型的發展,已不是單純的科技之争,更是國運之争,影響深遠。
過去一年可以看到,通用大模型已然成爲業内玩家的發展共識。
在模型層,關于長文本處理、多模态、邏輯推理、數學編碼等技術突破,以全方位提升通用大模型的理解能力。基礎設施層,自主可控算力生态也構建開來,國産算力軟硬協同來支撐大模型創新和應用。
當然最明顯感知的發展變化,還是應用層的全面開花。
來自醫療、教育、廣告營銷、制造等各個行業領域的傳統玩家,基于通用大模型底座平台以及行業數據,得以讓大模型在自身領域加速應用。
千模大戰之中,絕大多數也都是行業和垂直領域大模型。而如果沒有通用底座大模型的支撐,行業大模型的成效将無法持續進步。
因此,中國必須要有自主可控、對标國際一流水準的通用底座大模型。
這當中最具代表的踐行者就是科大訊飛。
過去一年,他們有兩個進展值得關注——
一個是中國首個支持萬億浮點參數的國産化算力平台 " 飛星一号 ",聯合華爲實現國産算力的自主可控。
另一個基于該平台發布訊飛星火 V3.5,整體效果逼近 GPT-4 Turbo,并初步形成大模型産業生态。
基于算力和持續升級叠代的通用大模型,他們在醫療、教育、工業等場景中有了深度應用,已率先構建出行業領先的大模型産業生态——
截至今年 1 月,訊飛星火純用戶 2400 萬,基于訊飛聽見、訊飛星火 APP、訊飛輸入法等應用,星火已累計賦能億萬用戶。大模型開發者生态積累 37 萬開發者數量,其中企業開發者數量爲 24 萬……并從中以此形數據閉環,自驅動大模型的叠代和落地。
過去的發展成績表明:以科大訊飛爲代表的通用人工智能國家隊在推動大模型的落地,我們有基礎,也有自身的場景和數據優勢。但同樣也要客觀看到差距、正視差距,縮小中美底座大模型的差距。
全球競争更加激烈,通用底座呼之欲出
2024 年剛開年,以天爲單位的 AI 新進展再次讓全球無眠。
颠覆視頻生成的 Sora、全面超越 GPT-4 的 Claude 3、還有 Stable Diffusion 3 的發布,而在産業鏈上,英偉達正式突破 2 萬億美元震驚股市……
顯然,全球競速沒有放緩,反而更緊迫了。
但同去年 ChatGPT 剛出現時百模大戰千模大戰的各家探索不同,今年國内卻顯得冷靜許多。因爲有關技術趨勢的共識已經再明顯不過:
多模态融合,包括語音、圖像、視頻等多個模态融合已成爲國内外科技大廠大模型升級和叠代重點;
Scaling Law 反複被驗證,大模型的不同流派走向統一;
軟硬件一體,産業鏈上下遊共建的通用底座,更加呼之欲出。也隻有通用底座,才是綜合實力、長治久安、基業長青、支撐千行百業 "AI+" 的基石。
有意思的是,這樣的洞察,也在兩會上也被提及出來了。
劉慶峰給出了全面系統的建議。
他建議在 2017 年《新一代人工智能發展規劃》的基礎上,系統性制定國家《通用人工智能發展規劃》,以頂層設計來推動通用人工智能的發展。
與此同時,相關工作也要同步展開,爲此劉慶峰給出了九點建議。
首先第一點,聚焦通用大模型 " 主戰場 ",整合各方資源,持續加大投入。
比如包括以專項的形式在未來 5 年持續支持研發攻關、支持算力基礎設施建設、推動工業和民生等領域的大模型應用等。
随後,就是加強源頭技術布局,圍繞通用人工智能相關領域,布局戰略性、前瞻性基礎研究,堅持以源頭核心技術突破來推動颠覆式創新的探索。
除了大模型技術外,還要加快腦科學與類腦智能、量子計算以及推動 AI for Science 的發展。
更爲具體的建議還有:
建議加快形成以國産大模型爲核心的自主可控産業生态。
建議推動國家級高質量訓練數據開放和共享,支持國家戰略科技力量以揭榜挂帥形式優先、低成本使用。
建議出台更加客觀、公正、可信的評測方法,推動大模型在行業領域應用的健康發展。
除此之外,他還強調了人才培養、法律法規以及倫理人文研究方面的重要性。
尤其是人才培養,他不僅強調了頂尖的創新人才、應用型人才的培養,而且建議加快推廣人工智能通識教育,賦能基礎教育、職業教育和高等教育全學段,并且建議設立國家人工智能學院。
對于未來可能會被人工智能大量替代的行業和崗位,他認爲應該研究新型人才能力素質模型和培養方案。
這樣的洞察和建議,之所以系統和全面,一方面是訊飛本身是人工智能國家隊,懂行。另一方面,常年的人工智能産業深耕,也讓它對産業需求有更深的洞察。
透過此次兩會上各位行業代表們的觀點,可以看到社會的共識是:
通用大模型是必經之路。
從全球發展來看,實現算力、産業生态的自主可控,才能保證大模型的持續叠代和應用,在全球競争态勢下才能占據一席之地,擁有話語權。
民生社會層面,以大模型爲代表的新質生産力,正成爲支撐社會發展的新型基礎設施。從技術研發到商業落地,這條發展路線上一以貫之的最終目标,都是爲各行各業提質提效。
所以即便現在差距仍不可忽視,但包括國産大模型的核心玩家,已經初步探索出了一條自主可控之路,賦能到各行業,這也是大模型的真正價值所在。
從" 互聯網 +"到" 人工智能 +",新質生産力機遇,未來可期,中國可期。
— 完 —
點這裏關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~