颠覆性研究正在衰落,人類重大科技進步正放緩。
上述觀點來自本周 Nature 封面文,主标題:NET LOSS ( 淨虧損 ) ,頗為醒目。
文章作者認為,盡管近幾十年來創新和科學研究呈爆炸式增長,但是,知識的增加并未帶來重大進展。
通過分析過去 60 年來 4500 萬篇論文及 390 萬項專利數據,作者發現,這些研究對現有科技的颠覆性越來越少。
他們進一步指出,此種現象可能預示着——科學技術的性質發生了根本轉變。
目前,該觀點及内容已被經濟學人、福布斯等主流媒體介紹,推特、Reddit 及 Hacker News 上亦有不少關注。
所以,這個結論是怎麼得出的?
答案還得從研究本身裡找。
如何判斷論文開拓性?
研究主要通過兩類方法,來衡量論文創新程度的變化。
第一種方法是根據論文引用情況判斷。
這種方法會将新研究分成兩類。
一類在現有理論基礎上實現突破,本質上鞏固了已有研究理論(Consolidation);另一類則是颠覆已有理論,本質上是開拓性的新工作(Destabilization)。
舉個栗子,DNA 雙螺旋結構和密度泛函理論(DFT,Density Functional Theory)都獲得了諾貝爾獎。
如果按上面的方式進行分類,DNA 雙螺旋結構顯然是颠覆性的研究,因為它否定了生物界權威鮑林的 " 三螺旋結構 " 研究。
但密度泛函理論,卻是建立在之前研究的基礎上提出來的,與 DNA 雙螺旋結構的開拓性程度并不相同。
如何判斷一篇論文更具開拓性?
作者們采用了一種叫CD 指數的方法(CD index)。
如下圖,黑色代表目前待判斷的研究,白色代表前人的研究,灰色是後來的新研究,CD 指數範圍在 ± 1 之間。
如果一篇論文(黑色)是基于已有研究做出改進,那麼新研究(灰色)在引用這篇論文時,肯定也會引用前人的研究(白色),CD 指數為負:
反之,這篇論文颠覆了之前的研究,那麼新研究都會以這篇論文為基底,而不會再去引用之前的研究,CD 指數為正:
所以,雖然 DNA 雙螺旋結構和密度泛函理論的論文引用量都非常大,但它們的 CD 指數卻分别是 0.62 和 -0.22。下面這張圖顯示了論文和專利 CD 指數的分布:
第二種方法,則是通過論文中的詞彙多樣性來判斷。
一方面觀察論文中出現新詞的情況。
注意,這裡的造新詞并非老詞新造(給已有的定義換個說法),而是新出現的、在後來的論文内容和标題中會重複使用的詞彙。
另一方面統計與 " 創造 " 相關的動詞數量。
例如,與創造、發現相關的動詞通常包括 produce、form、prepare 和 make,類似的還包括 determine、report 以及 measure 等。
與之相反,偏向改進、優化乃至應用一類的動詞,則包括 improve、enhance、increase,以及 use 和 include 等等。
作者們采用這兩種方法,分别計算了 4500 萬篇論文和 390 萬項專利的 CD 指數和詞彙多樣性。
仍然有新突破出現
具體來說,研究得出的結論如下。
先看創新性随年份的變化。如下圖,從 1945 年到 2010 年間,左側各年份論文平均 CD5 指數(統計時間範圍為論文發表後 5 年)有明顯下降。不同領域降幅略有不同,社科為 91.9%,物理為 100%。
技術專利創新性也呈下降趨勢。根據美國國家經濟研究所(NBER)數據,從 1980 年到 2010 年間,計算機與通信領域 CD5 降幅達 93.5%,藥物與醫療領域降幅為 96.4%。
從 " 語言措辭 " 變化中也能看到相關迹象。
在 1945-2010 年論文中,其内容所使用的獨特詞彙及新造詞彙均呈下降态勢。
有意思的是,措辭上 50 年前後論文中 " 創新性 " 的相關動詞的出現頻率也更占主導,排在前面的高頻動詞包括:産出、報告、确定、測量……
與之對應,2010 年論文,排在前列的高頻動詞為:基于、改善、聯系、增強……
上述動詞同既有科學發現成果的 " 聯系意味 " 更強。
同樣的情況,也發生在專利内容統計中。
△ 1950 年及 2010 年論文每百個動詞中的高頻詞統計
但值得明确的是,盡管論文創新性的比例在下降,但從絕對數量看,創新成果産出量趨于穩定。
如下圖所示,左側針對 1950-2010 論文統計,右側針對 1980-2010 專利數量,不同顔色的線條,代表了不同 CD5 指數區間。
能看出,盡管藍色線條随年份變化快速上升,但該部分代表創新性較弱的論文及專利數。相對而言,高創新性的論文及專利,絕對數量趨于平穩:
數據統計外,本文作者也列舉了一些近年重大突破,諸如引力波、新冠疫苗。
他們指出,整體的創新性下降并不能讓我們忽視許多高創新性的研究成果及發明。
那麼,是什麼導緻了整體創新性的下降?
研究者推測,該趨勢與各研究領域的知識增長相關。
為此,他們統計了數十年論文及專利的引用多樣性、自引均值、被引作品平均年份。
結果顯示,無論論文還是專利,幾十年來引用多樣性在下降,自引均值上升,且引文中平均發表年份也在增加。
通過上述統計結果,研究者推斷,科學家與發明家們更多依賴熟悉的現有知識技術,且這些知識高度同源。
這可能導緻創新性成果的不足。
目前,這項研究引來了不少相關從業者及科技愛好者的關注。
一位生物醫學家認為這毫不驚訝,并表示研究内容挺有意思。
還有網友認為,資本也是導緻上述現象的一大因素。
他補充道,在過去 50 年中,更多資金從産出颠覆變化的基礎研究,轉向收益直接可見的應用研究。
對此,你怎麼看?
論文地址:
https://www.nature.com/articles/s41586-022-05543-x
參考鍊接:
https://pubsonline.informs.org/doi/epdf/10.1287/mnsc.2015.2366