早在 ChatGPT 出現時,有很多人也讨論過 "ChatGPT 爲什麽沒有首先出現在中國 "。而當我們還在困擾爲什麽國内大模型沒有 GPT4 好用的時候,Sora 來了。
從通用人工智能(AGI)視角看,這意味着我們與 OpenAI 的差距又被拉大了。
中國人工智能發展的制約因素是什麽?當前的發展到底處于第幾梯隊?2023 年下半年,我密集調研了十幾家人工智能企業,來寬泛地談談我自己的看法。
算力
算力是人工智能競争的核心,算力的背後是芯片。
Meta 一家公司已經有 50 萬塊 GPU,微軟也有幾十萬塊,而且兩家公司還在不斷采購。國内所有的人工智能公司加在一起,可能有 50 萬塊左右,所以在算力的存量層面,我們跟國外的差距很大。
芯片又分爲芯片設計和芯片制造。中國的芯片設計能力在全球應該可以劃分到第一梯隊。在傳統的 CPU 和 GPU 領域,與國外幾乎沒有差距。在人工智能芯片的細分領域,比如半定制化的 FPGA、全定制化的 ASIC、類腦芯片等領域,已經有個别很優秀的公司極度貼近甚至部分超越國際頂尖水平,但頂尖公司的數量和生态,總體上與國外發達國家還有不小的差距。
在芯片制造環節,面臨卡脖子。
從制程上看,90nm 以上制程的芯片,技術上我們已經幾乎可以完全自主。有消息說,2023 年下半年,28nm 的國産(後道封裝)光刻機也已經交付芯片制造廠商。但也有消息說,仍然正在研發,還沒有交付。
即使已經交付芯片制造商,在一切順利的情況下,參考阿斯麥(ASML)和台積電的經驗,從安裝完成、調試到可以穩定生産,至少需要 2 年的時間。考慮到這是中國首台全國産的 28nm 光刻機,以及光刻機的高度複雜性,所需時間大概率會更長。
|荷蘭光刻機巨頭阿斯麥公司(ASML)總部
特别需要注意的是,光刻機完成實驗室階段的研發和在廠商完成産業化生産是完全不同的兩個概念。
在研發階段,隻要成功流片,就算是研發成功,但在實際的産業應用階段,要求在保證良率和産能的情況下,能夠安全穩定地持續運營,這個過程是很難的。
所以,光刻機從實驗研發到正式投産,花費十年八年都是很正常的。即使 ASML,前幾款光刻機,從研發成功到正式投産,也在 5 年以上。
至于 28nm 以下的芯片制造,必須還要依賴國外的光刻機。
當前全球的光刻機市場被荷蘭阿斯麥(ASML)、日本尼康(Nikon)和佳能(Canon)三大巨頭壟斷。尼康的光刻機集中在中高端區域,佳能則集中在低端區域。
至于 2023 年某廠商成功制造 5nm 的芯片,業内普遍推測,芯片自主設計是沒問題的,但在制造環節,使用的還是國外的設備,區别無非是 ASML 的還是 Nikon 或者 Canon 的。
光刻産業鏈具有極度複雜性。光刻機的制造研發絕不是某一個企業能夠單獨完成的(包括 ASML 也不是一家就能造 DUV 和 EUV,很多核心零部件都要進口),需要很多頂尖的企業相互配合才可以完成。
光刻産業鏈的高度複雜性主要體現在兩點:
一是作爲光刻核心設備的光刻機組件複雜,包括光源系統、照明系統、物鏡系統、浸入式系統、雙工件台等在内的組件技術全球隻有極少數幾家公司能夠掌握。比如物鏡鏡片被德國企業蔡司(ZEISS)壟斷。
二是與光刻機配套的光刻膠、光刻氣體、掩膜版等半導體材料和塗膠顯影設備等同樣要求很高的技術含量。比如,寬譜 g/i/h 線光刻膠基本完成國産替代,但高端 KrF、ArF 和 EUV 光刻膠基本被美國和日本的企業壟斷,韓國企業占一點比重,中國大陸基本依靠進口。
現在的問題是 ASML 被限制向中國出口最新的光刻機,英偉達(NVIDIA)被限制向中國出口最新的芯片。
雖然我們還可以買到性能受限的 " 特供版 " 芯片,但限售既限制了企業的算力獲取,又拉高了算力成本,而且擾亂了企業的研發預期。
短期來看,部分企業有儲備算力可供使用,而且現在也沒有到單純拼算力的地步,算法依然有很大的優化提升空間。但長遠來看,僅從技術的角度,人工智能競争的本質還是算力的競争。
盡管當前我們已經加大在半導體領域的研發投入,但短期内中國在芯片制造領域取得颠覆性突破的困難還比較大,所以未來在算力競争層面,無論是國家還是企業,都要提前做好各方面的應對準備。
|2006 年全球首台 EUV 光刻機原型
數據
數據是重要的基礎性戰略資源,高質量數據對人工智能的重要性無需贅言。
中國是世界上數據最豐富、也是最重視數據的國家之一,将數據的重要性提升到了前所未有的高度,專門設立了國家大數據局,并出台了系列法律法規和行業規範。
" 數據二十條 " 針對數據要素與其他生産要素的不同特點,構建起 " 四梁八柱 " 的主要架構,從數據産權、流通交易、收益分配、安全治理四方面初步搭建了中國的數據基礎制度體系。
當然,數據二十條隻是綱領性文件,未來許多更具體的内容需要不斷探索發展。數據交易所的建設效果如何,還有待觀察。
就目前來看,至少存在三方面的問題——
第一是優質數據太少,很多企業需要花大成本重新清洗和标注數據。所以經常有人開玩笑說:人工智能,有多少人工就有多少智能。
第二,數據的灰色交易問題。有的行業或者企業可以更優先拿到部分受限的數據,由于數據複用的邊際成本極低,所以很多企業就通過不合規的渠道以很低的價格買賣數據,導緻不公平競争。
第三,數據的保護和治理水平還有待提高。數據中敏感信息多,許多數據内容多層次多元化,可能承載了需要保護的個人信息和商業機密,即使匿名化和去标識化,也有可能被挖掘出來。
資本
如果隻看 ChatGPT 的技術路線的話,其實是一個大力出奇迹的過程。
很多公司都曾經實驗過這一技術路線,但都受限于算力成本和數據量,在做了一段時間後就放棄了。
不僅是國内的很多公司沒有做出來,Google 也沒有做出來。隻有 OpenAI 不斷地堆算力、堆數據,最終實現了由量變到質變。所以,ChatGPT 的成功具有一定的偶然性。
但偶然中又蘊含着必然。僅就人工智能領域來說,中國好像并沒有做出太傑出的原創性貢獻。AlphaGo,ChatGPT 是國外先出現的,智能音箱、智能駕駛、人臉識别,都是人工智能的工程應用,也不是中國的原創。
有很多人說,國外有成熟的投融資體系,所以可以支持 OpenAI 不斷燒錢。
确實,原創性的科技創新投入大、周期長、成功概率低。OpenAI 的資金密度、人才密度都很高。而中國的多層次資本市場仍不夠健全,尤其是 VC 和 PE 市場建設比較滞後。未來還是需要花大力氣完善。
但我覺得這不是根本原因。
一般的中小公司很難獲得如 OpenAI 那麽多的融資,但如果我們仔細統計,在 2022 年 ChatGPT 橫空出世以前,中國有不少公司的融資額是比 OpenAI 還多的,但我們還是沒有做出 ChatGPT。
所以投融資很重要,資本市場很重要。但融資額多少不是創新成功與否的決定性因素。
人才
颠覆性技術創新的核心要素是 " 人 "。
如果讓我們回顧一份具有世界影響力的科技創新者名單,可能會包括 Bill Gates、Zuckerberg、Sam Altman、 Elon Mask 等等。
中國人口基數這麽大,我們缺的不是 Altman 和 Mask 這樣的種子,缺的是讓這些種子從生根發芽到長成參天大樹的土壤。
深層次反思是需要勇氣的,而且很不讨喜。當大家都沉浸在熱烈的人工智能浪潮中,沉浸在中國人工智能處于世界領先行列的喜悅中,我非說我們這裏不行,那裏有短闆,就很容易挨罵。
但我們的人才培養模式确實有問題。
高校是我們人才培養最重要的載體。但我們的高等教育培養的大部分是落後于實踐的人才。我們高校的環境鼓勵的是 " 邊際創新 " 而不是 " 原創性成果 "。我們的社會容不下坐幾年十幾年冷闆凳的人才。
第一,高校都想做大,做綜合類高校,開設最熱門的學科,盡可能招更多的學生。因爲學科建設、學生規模與能獲得的經費支持直接相關。
最顯著的一個表征就是,各類 "xxx 學院 " 都争相想改名成 "xxx 大學 "。高校的數量要适應當地的經濟發展程度和人口規模。有的省份經濟發展水平比較高,人口規模也很大,但優質的教育資源不足,在能保障教學質量的情況下,可以考慮擴大供給,但學科設置不能脫離自己的比較優勢。
前幾年金融學是熱門學科,所以很多學校就競相設置經管學院、經濟系。我知道有的專科院校,竟然也設置了諸如 " 金融工程 " 之類對師資力量要求很高的學科。這種情況下培養出來的人才,隻是虛有其表。
據不完全統計,截至 2023 年,全國有 440 所高校建立了人工智能本科專業,有 1016 所職業院校備案了人工智能技術服務(應用)專業。
人工智能也是一個對師資力量要求很高的學科,如果專科院校開設人工智能專業,必須要找準自己的定位,穩紮穩打,側重于應用開發和改進、應用測試、數據處理、産品運維、商務推廣、産品銷售、售後服務等實用技能型人才培養,與本科和研究生進行差異化競争。
第二,人工智能對硬件和軟件的要求都很高,高校的算力和數據資源、師資力量、課程設置和傳授的知識落後于行業實踐,背後是産教融合的問題。
一方面,大部分高校的算力和數據資源其實難以滿足大模型的教學和研發需求。另一方面,無論是老師的教學能力還是課程設置,都落後于行業一線。這兩方面的問題不僅在人工智能行業存在,在各行各業都存在。
我們在調研中,多家企業都反饋,招聘的算法類應屆畢業生至少都要花費 1~2 年重新培養,而工作 2 年的員工離職率最高,所以有的企業選擇不再招聘應屆生,而直接高薪挖人,這就加劇了行業内卷。
集成電路企業對人才的要求更高。由于芯片設計的複雜性,從業 5 年才算上手,從業 10 年才算成熟人才。現在高校培養的大部分是通用型的傳統集成電路設計人才,難以适應全定制和半定制化人工智能芯片的設計要求。
所以業内現狀是,領軍人才、成熟技術人才供不應求,而應屆生和 " 轉碼 " 人才又存在過剩。
而在産學研方面,具有一定規模和技術實力的大企業數量有限,專精特新等中小型科技類企業具有技術優勢,但由于很難給高校帶來立竿見影的資金和就業支持,用人需求和技術優勢,都難以觸達高校。
美國頂尖大學的教授,除去必要的上課時間,其它時間可以到企業的實驗室工作,因此了解産業界的真實需求。國内也有相應的産學結合制度,比如在企業設立院士工作站等等,但這個制度的效果還不夠好,具體原因比較複雜。很多科研人員一輩子都沒有下過工廠。
國内還有一個很不好的習慣:很多科技成果是爲了轉化而轉化,也就是基于已經擁有的技術或者解決方案來開發新的應用場景,這就導緻很多研究不僅沒有解決已經存在的重要問題,反而又創造出新的問題。
長期以來,中國教育重傳承、輕創新,重标準化教育、輕個性化教育,重知識吸收、輕價值塑造和創新創業,同時中國創新人才教育模式較單一,缺乏多元化投入機制,培養颠覆性技術創新型人才面臨困難和挑戰。
第三,科研工作者的職稱考評壓力很大,而職稱考評是有量化标準的,大部分是 " 課題 + 論文發表 "。近幾年越來越卷,職稱考評的标準越來越高。
一位來自知名雙一流高校,在我看來很有才華和前途的年輕副教授跟我說:" 我也想把所有的精力投入到科技創新中去,我的學院領導也已經是非常開明的領導了,不要求我每年發多少篇論文,支持我和團隊花幾年的時間搞一個大項目。但是他要求我承諾未來一定要做出什麽樣的成果。我隻能承諾我全力以赴,但我怎麽能預先确定科技創新的成敗呢?"
當前的問題在于,無論是部委課題還是基金課題,大部分的研究期限很短,且必須承諾結題成果,這似乎可以保障科研質量,避免科研經費被浪費,但這同時導緻學者隻申請有把握能在短期内達标結題的課題,實際上限制了院校和學者進行基礎研究的攻關熱情。
這就導緻,中國在人工智能領域的頂刊論文數量超過美國,但實際上大多數是對國際前沿理論的邊際改善,産業應用價值較弱。
現在國家也在轉變科研方式,比如指定或者征集重大問題、延長項目周期、增大重點項目投入。在科研考評體系方面,推進 " 破五維 "。
一方面,像中國自然科學基金就有一整套匿名評審機制和同行評價制度,大家的認可度還比較高。除了項目評價,高校在選人方面也應該增加同行評價的比重。有的博士甚至一篇論文都沒有,也可以在國外拿到教職。國外在選人時,更側重評價一個青年學者的潛力,哪怕你還沒研究出真正的成果,但我隻要能判斷出你研究的問題本身重要,就能評價一個人的科研品味。
國外本質上更注重一個人的内涵和科研潛力,但國内習慣用公式一樣的指标來判斷一個人,最後就導緻所有的青年學者趨同,适應評價規則的同時,也扼殺了科研潛力。
現在已經有很多學校把招人的權力下放到了院系,但院系仍然沿用既往的選才制度。
" 破五維 " 的效果不及預期,而且如果真的 " 破五維 " 之後,尚未建立起一套新的标準,可能會導緻更多的問題。原因既包括既得利益格局的桎梏,也包括面臨公平問題和輿論壓力。
另一方面,就目前來看,指定或者征集重大問題、" 揭榜挂帥 ",是一種很好的措施,抓住了當前最迫切的問題,顯著推進了問題的解決速度,是急國家之所急。但這更多的是促進了工程應用問題的解決,而不是真正意義上的 " 颠覆性創新 "。
重大項目方面,雖然延長了項目周期、增加了項目額度,但這些重大項目還是主要集中在院士、教授手中。
但很多人評爲教授、院士之後,實際上已經不再關注學術前沿,反而成了學術資源的主要提供方,成了一個巨大的利益焦點。院士手上的錢用不完,天天想着怎麽花錢,而年輕的科學家找不到錢,無錢可用。所以,科學家共同體内部也需要一些機制來變革。
客觀地說,經過多年的發展,綜合來看,中國高校的師資力量、人才培養質量已經并不明顯落後于西方發達國家。尤其是在人工智能領域,各國(包括美國),都存在頂尖人才短缺的情況,美國業界甚至采取 " 殺雞取卵 " 的方式用高薪從高校挖教授。
中國部分高校開設的人工智能課程,在授課内容、方式、人才培養質量上已經達到了世界頂級水平。這與國家的重視有很大的關系,也與我們的激勵制度導向有關。比如我們設立的青年長江學者,就很重視對教學的考核。學校對優秀教學教師的獎勵力度也很大。我們有理由對中國人才培養的未來飽含希望。
環境
第一,中國人的生活壓力其實很大,整個社會環境比較急功近利,對科技創新的要求非常苛刻,個人的容錯率非常低。
社會環境對基礎創新非常重要。其一,基礎研究短期很難出成果,無論是上級監管部門,還是科研院所,都很難承擔這種 " 隻燒錢但看不到成果 " 的考核壓力;其二,公衆的科學素養也有待提高,大家對很多研究領域的認知不到位,迫切的期待科學家短期做出重大成果,如果長時間不出成果,機構和個人都很難承受輿論壓力;其三,個人收入、職業發展與科研成果挂鈎。如果你想在高校 / 科研院所獲得還說得過去的收入,得到學校和社會的認可,那你必須在有限的時間内把有限的精力投入到漫長的論文發表的事業中去。而且我們很多課題和 " 帽子 ",都限制了申請者的年齡。這就導緻大家隻在前人的基礎上進行有效的邊際創新——因爲這是 " 性價比 " 最高的方式。
所以,我們要花大力氣提升大衆的科學素養,社會上要有一種正确的風氣,不要一窩蜂,好像重視一個科學家,某個領域的科學研究就要有重大的突破,如果科學家失敗了,就覺得這個人有問題或者怎麽樣。
第二,營商環境還有提升空間。
我們過去很長一段時間内,都非常重視營商環境的建設,取得了很大的成效。無論是在國際組織還是國内組織編篡的各類營商環境國别榜單中,排名和評分都有顯著的上升。
人工智能技術的發展對未來很多行業可能産生颠覆性影響,世界很多國家都将人工智能技術放在了戰略重要性的地位,中國也是如此。
在這個背景下,中央政府、各部委不可謂不重視,出台了很多支持政策。各地方政府對人工智能的支持力度不可謂不大,隻要頭部企業願意落戶,要地給地、要錢給錢、要人給人,堪稱全方位無死角的支持。
但我們對惡意負面輿情的治理力度還不夠。有很多所謂的網絡 " 大 V" 依舊很活躍,受衆還很廣。
惡意的負面輿情對企業的社會名譽影響很大,甚至擾亂企業的正常經營,對上市公司的影響更大。人工智能行業很有意思,大多數企業都是民營企業。在這種情況下,我們更應該重視惡意攻擊民營企業和民營企業家的行爲。
我當然知道,輿論不可能也不該禁絕,有時候輿論還是弱者維護自身權益的武器,正常的負面輿情對企業也是一種監督。所以我們要抓大放小,對打着愛國旗号,但實質上攻擊企業正常經營行爲、造成重大社會影響的惡性輿情和謠言要尋根問底,發現一起,懲治一起。最好是公開執法,一方面是保障執法的公開公正,另一方面是可以震懾宵小,以儆效尤。
總結
一位科技企業的資深技術專家和管理者曾經跟我說,中國的人工智能其實準确來說應該叫做 " 人工智能的工程應用 ",我們經常有種幻覺,很多技術我們應用得很好,我們就誤認爲我們掌握了某種技術。
在應用場景方面,不客氣地說,中國的人工智能可以說是冠絕全球,一騎絕塵。
但對技術的應用隻是 "1 到 100"。"1 到 100" 很重要,但 "0 到 1" 更重要。比如,你肯定比牛頓懂得多,但你跟牛頓誰偉大?
客觀上來說,國外在人工智能方面可能确實有先發優勢。二十世紀三個偉大的發現,無線電、計算機和互聯網都出現在美國,一個重要原因就是它的基礎、應用以及開發研究都非常強大。
但我們有很多機制、體制,甚至文化方面的因素,限制了我們 0 到 1 的創新。
在人工智能領域,尤其是在芯片制造等基礎層,我們真正距離擠入世界頂尖梯隊還任重道遠。
但隻要我們保持戰略定力,實事求是、腳踏實地、一步一個腳印,我們就有一萬個理由對未來充滿希望。
No.5663 原創首發文章|作者 賈銘