搞科研的最新姿勢,被一位華人小哥解鎖了——
告訴 AI 你的研究目标,再把數據集 " 投喂 " 進去,完事。
這就是來自伯克利的博士生 Zhong Ruiqi 等人的最新研究,把從海量數據集中繁瑣的 " 取證 " 過程,統統交給GPT-3來解決:
他們還發現,這種用 AI 搞科研的方法不僅效率高,而且還能得出人類沒有想到的 " 意外驚喜 "。
讓 GPT-3 幫你搞科研
那麽小哥他們爲什麽突發奇想地要用這種方式搞科研呢?
這是因爲他們發現,對大型語料庫做深入的挖掘确實能得到一些有用的結果,但這個過程要是讓人類來搞,那簡直就太費時費力了。
因此,他們便決定把這個繁瑣的過程交給 GPT-3 來處理,并把這個任務命名爲"D5":
Goal Driven Discovery of Distributional Differences via Language Descriptions.
通過語言描述,實現目标驅動的分布式差異的發現。
"D5" 任務的過程,簡單來說就是兩個動作:
輸入研究目标
輸入兩個語料庫
例如在上面這個案例中,小哥先是給 AI 輸進去了兩個語料庫:
語料庫 A:服用藥物 A 後患者的反應報告
語料庫 B:服用藥物 B 後患者的反應報告
然後再向 AI 确定自己的研究目标,即 " 我想了解一下藥物 A 的副作用 "。
在 AI 收到任務後,立刻開始執行分析工作,最後得出了它的結論:
語料庫 A 中的樣本,有更多的患者會提到 " 妄想症 "(paranoia)。
不過試想一下,若讓人類科研人員做這項工作,光是了解語料庫 A 和 B 就需要花費大量的時間,更别提還得進一步做對比分析等工作了。
而 D5 任務之所以能夠做得如此絲滑,是因爲小哥他們在此背後還做了不少工作。
例如構建 OpenD5 元數據集,它包含符合 D5 任務的 675 個開放式問題,所涉及領域涵蓋商業、社會科學、人文科學、健康和機器學習等。
并且每個開放式問題都會對應一個語料庫對兒(語料庫 A 和語料庫 B),平均有 17000 個樣本。
小哥還把每個語料庫中的 50% 作爲研究部分,另外 50% 則是拿來做驗證。
基于此,小哥他們再構建了一個 "D5 系統 ",它的工作原理和人類從數據庫中獲取發現類似,分爲兩個階段,即創造性地提出一個假設,再在數據集上嚴格驗證這個假設。
按照這種思路,研究人員接下來用 GPT-3 做了次實驗。
他們先是向 GPT3 展示研究目标和每個語料庫中的一些樣本,然後讓它提出一個假設列表。
最終實驗發現,GPT-3 可以使用目标描述來提出更相關、更新穎、更有意義的假設。
也正因爲 OpenD5 數據集所涵蓋的領域衆多,因此小哥表示他們的 D5 系統具備應用範圍廣的特點。
也存在一些缺陷
但對于這套 D5 系統,小哥也直言不諱地道出了它的缺陷。
例如,若是語料庫中含有較多的俚語、俗語或者帶有情緒的詞彙,那麽 AI 所給出的 " 發現 " 就會存在偏差。
簡而言之,就是 AI 對于特定情況的詞彙或描述産生了錯誤的理解和分析。
除此之外,小哥也表示更靈活的語料庫、更具擴展性的系統,也是他們在未來重點研究的方向。
不過似乎這項研究讓小哥也是興奮不已,畢竟離他 " 構建一個用 AI 稿科研 " 的夢想更近了一步。
參考鏈接:
[ 1 ] https://arxiv.org/abs/2302.14233
[ 2 ] https://twitter.com/ZhongRuiqi/status/1631109680859865089?s=20
— 完 —
CCF 移動機器人抓取和導航挑戰賽
開啓注冊報名
由中國計算機學會(CCF)主辦、CCF 智能機器人專委會承辦的首屆"CCF 移動機器人抓取和導航挑戰賽 "已開啓注冊報名。比賽将評估智能機器人在家居場景下的場景理解、導航和抓取能力,最高獎金 1 萬美元!
報名截止到 6 月 20 日,歡迎各高校、機構的研究者報名參賽。
點這裏關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~