圖片來源:李飛飛社交媒體
藍鲸新聞 10 月 14 日訊(記者 朱俊熹)當瑞典皇家科學院宣布将 2024 年諾貝爾物理學獎授予兩位 AI 先驅後,不僅公衆大爲震驚,連獲獎的 "AI 教父 "Geoffrey Hinton 本人在接到獲獎通知時也不敢相信,直言 " 我怎麽确定這不是一個詐騙電話 "。
并非所有人都認可這一授獎,有計算機科學專家表示," 諾貝爾獎委員會不想錯過這波人工智能的熱潮,所以巧妙地通過物理學的渠道把 Geoffrey Hinton 推了上去。" 諾獎委員會還在社交媒體上發起投票:你知道機器學習模型是基于物理學方程嗎?結果過半的人選擇了 " 不知道 "。
在短暫的驚訝後,AI 行業内便開始了慶祝。Geoffrey Hinton 的衆多學生、前同事、同行紛紛爲兩位獲獎者送上祝福。其中,同樣在人工智能領域立下開創性貢獻的 "AI 教母 " 李飛飛在社交平台 X 上表示," 這真是令人無比興奮!AI 的深遠影響才剛剛開始。"
AI 正逐漸成爲多學科交叉的領域。如果說 Geoffrey Hinton 是從心理學跨界進入 AI,在研究神經網絡時還參考了一些物理學原理,那麽李飛飛的經曆與物理學的關聯則更爲明顯。無論是早年求學,還是如今下場創業,她的人生軌迹中時常出現 AI 與物理學的交彙,而她對 AI 發展的貢獻同樣偉大,還間接幫助了 Geoffrey Hinton 的項目。
如今,Geoffrey Hinton 對 AI 的研究已經得到諾貝爾物理學獎的承認,那麽我們有理由期待,在未來幾年内,李飛飛也可能會與這個全球最重要的科學獎項發生更直接的聯系。
更像物理學家的 "AI 教母 "
李飛飛身上跟着很多頭銜:斯坦福大學計算機科學系教授、斯坦福以人爲本人工智能研究院院長、美國國家工程院院士、前谷歌副總裁……但她曾在公開場合表示,比起工程師,她覺得自己更像一位物理學家。
16 歲時,李飛飛跟着父母從中國移民到了美國。原本的高知家庭一下陷入經濟上的困頓,必須依靠繁重的體力勞動爲生,還未成年的李飛飛也得去餐廳刷盤子補貼家用。高中畢業後,普林斯頓大學向李飛飛發來了全額獎學金,她最終決定前往并主修物理學專業。
在本科期間,李飛飛着迷于閱讀物理學家的傳記。她發現,愛因斯坦、薛定谔、玻爾等偉大的人物到了職業生涯晚期時,都開始轉向探讨人類的精神世界和生命奧秘。這讓原本堅定走物理學道路的李飛飛突然對自己的追求産生了懷疑,不自覺地追随先驅的腳步開始思索生命的意義這類命題。
" 對我來說,人類生命的基本問題就是智能。帶着這樣的探尋目光,我步入了神經科學的世界。在幾次神經科學領域的實習經曆中,更加确定了對智能的熱愛。于是,我從硬核的原子世界、物理世界,轉向了對智能的探索。" 李飛飛後來在一檔播客節目中提到。
到了碩博階段,李飛飛決定轉到加州理工學院攻讀人工智能和計算神經科學。也是在那一時期,她選擇将計算機視覺作爲研究方向。現如今行業已經知道數據、算力、算法是 AI 的三大基礎,而計算機視覺相關的圖像數據正是最重要的數據分類之一,這一領域當時尚屬冷門,計算機能夠識别的物體種類極其有限。而業界大多觀點認爲算法才是計算機視覺的核心,李飛飛卻意識到要想讓機器認知到更大的世界,或許還需要一個龐大的數據集。
計劃創建大規模圖像數據集的李飛飛很快遭到了同行勸阻、人手不足、缺乏經費等多重困難。她和團隊最終依靠亞馬遜衆包平台,将海量的圖片标注工作分發給全世界近 5 萬名人員,才将項目完成時間從 19 年大幅縮短到兩年半。2009 年,日後影響整個 AI 行業發展的 ImageNet 數據集正式面世。初始版本共包含 320 萬張标記圖像,分爲超五千個類别,之後進一步擴展至 1500 萬張圖像。
但 ImageNet 數據集并沒有立刻獲得行業内的廣泛關注,李飛飛爲此還組織了大規模圖像識别挑戰賽,希望能提升 ImageNet 的名氣。而轉折點就發生在 2012 年舉辦的第三屆比賽上,也是在那時,李飛飛和 Geoffrey Hinton 的道路産生了交集。
那屆 ImageNet 比賽上,Geoffrey Hinton 和他的兩位學生 Alex Krizhevsky、Ilya Sutskever 設計了一種新的神經網絡算法 AlexNet,以高達 85% 的識别準确率奪得了當年 ImageNet 挑戰賽的冠軍,創下了計算機視覺領域的世界紀錄。AlexNet 基于 80 年代就已提出的深度卷積神經網絡,但當時這套算法被業界視爲 " 老古董 ",直到經過 ImageNet 數據集訓練後才重獲關注。AI 領域的深度學習革命也自此開啓。
擔心 AI 失控的 AI 先驅
時間來到 2015 年,Geoffrey Hinton 的學生 Ilya Sutskever 與李飛飛的學生 Andrej Karpathy 出現在了同一個名單上:OpenAI 的聯合創始人。
創立初期的 OpenAI 是一家非營利性組織,以構建安全且有益的通用人工智能爲使命。Ilya Sutskever 擔任首席科學家一職,Andrej Karpathy 則是研究科學家,兩人都推動了 OpenAI 在深度學習領域的發展。Ilya Sutskever 更是領導了從 GPT-1 到 GPT-4 等多個大語言模型及 ChatGPT 項目的研發,爲 OpenAI 的崛起做出了巨大貢獻。
今年 2 月,Andrej Karpathy 率先離職,轉爲創辦一家 AI+ 教育公司。主導了去年 OpenAI" 宮鬥 " 的首席科學家 Ilya Sutskever 也于 5 月宣布離職,啓動自己的創業項目。
造成 Ilya Sutskever 與 OpenAI 首席執行官 Sam Altman 之間矛盾爆發的關鍵在于,Sam Altman 急于推動商業化,而 Ilya Sutskever 更擔心 AI 技術的安全與風險,于是在去年年底聯合董事會 " 罷免 " 了 Sam Altman。但那場震驚全球 AI 業界的風波以 Ilya Sutskever 的妥協告終,Sam Altman 很快便重返公司。自那之後,OpenAI 頻繁出現高管人事動蕩。截至目前,原來的 11 位創始團隊成員僅剩 3 位。
本月初,OpenAI 完成了新一輪 66 億美元的融資,推高公司投後估值達 1570 億美元。作爲融資條件,OpenAI 需要在兩年時間内轉型爲一家營利性企業,不再由非營利性董事會控制。這再度引發了對 OpenAI 是否會将商業追求淩駕于安全性之上的擔憂。
作爲 Ilya Sutskever 的老師,Geoffrey Hinton 在發表諾貝爾獎獲獎感言時也力挺學生,稱 " 我特别爲我的一名學生解雇了 Sam Altman 而感到自豪 "。這位 AI 泰鬥還對人工智能可能造成的威脅發出警告,擔心比人類更智能的系統或将最終掌控一切。就在去年,時任谷歌副總裁的 Geoffrey Hinton 宣布從谷歌離職,理由是想要不受約束地談論 AI 的風險,并表示對自己一生的工作感到後悔。
與 Geoffrey Hinton 相似,李飛飛也經常在各種活動中呼籲關注 AI 可能引起的社會災難風險。去年李飛飛出版自傳時,Geoffrey Hinton 在推薦語中寫道," 她對自己幫助釋放的 AI 技術的巨大潛力和危險提供了緊急而清晰的描述。在這個關鍵時刻,我們迫切需要她來呼籲人們采取行動,共同承擔責任。"
2017 至 2018 年期間,李飛飛曾擔任谷歌雲 AI 首席科學家。她稱這段經曆 " 刷新了自己的認知 ",讓她看到 AI 技術的社會意義。除了能夠推動社會的發展,AI 也可能帶來侵犯隐私、虛假信息、取代人力等負面影響。因此從谷歌離開,重返斯坦福後,李飛飛推動創辦了斯坦福以人爲本人工智能研究院。這所機構希望能充當政界與科技界間的溝通橋梁,推動 AI 研究、教育、政策等方面的發展,以造福全人類。
但是,李飛飛和 Geoffrey Hinton 這兩位先驅在面對一項 AI 監管法案的态度上卻出現了分歧。作爲美國首批最重要、最嚴格的 AI 法規之一,加州 SB 1047 法案旨在對功能強大的前沿 AI 模型進行安全測試,将波及 OpenAI 等在加州部署業務的 AI 企業。
Geoffrey Hinton 與衆多 AI 從業者對此聯名表示支持,稱前沿 AI 公司合理防範大模型可能的危害是可行且适當的,SB 1047 法案代表了向前邁出的重要一步。李飛飛則單獨撰文稱,她并不反對人工智能治理和立法,但 AI 政策必須促進開源開發,提出統一且合理的規則,建立消費者信心,而 SB 1047 未達到這些标準。
當地時間 9 月 30 日,加州州長 Gavin Newsom 正式否決了 SB 1047 法案,認爲該法案可能過于寬泛,會給 AI 公司帶來負擔。他還補充道,将會與包括李飛飛在内的多位專家合作,爲加州制定可行的 AI 模型防護措施。
瞄準三維物理世界的空間智能
今年 5 月,斯坦福官網上李飛飛的個人介紹頁面顯示,從 2024 年初到 2025 年底處于 " 部分休假 " 狀态。在職業社交平台領英上,她的最新履曆也變爲 " 新手 ",從 1 月起開始全職做一些 " 新事物 "。
不久後,李飛飛的新事業就得到了解密:一家專注于空間智能的 AI 初創公司。李飛飛是其聯合創始人兼首席執行官。團隊規模并不算大,公司現有 24 人,包括李飛飛在斯坦福的學生和多位華人科學家。
盡管尚未發布任何産品或技術的突破,李飛飛這家名爲 World Labs 的初創企業卻在短短幾個月内迅速成爲新的獨角獸。World Labs 官網顯示,公司已籌集到超過 2.3 億美元的資金。領投方爲矽谷知名風投機構 Andreessen Horowitz、NEA 和 AI 風投基金 Radical Ventures,其他投資者包括 Adobe、AMD、英偉達等大公司,以及 Geoffrey Hinton、Andrej Karpathy、谷歌首席科學家 Jeff Dean 等個人。
李飛飛曾多次解釋她所選擇的空間智能這一創業方向。在她的研究生涯中,視覺智能一直是其熱情所在。但現在她認爲,僅僅看見是不夠的,真正的看是爲了更好地行動和學習。而空間智能就是從二維進入到三維,在物理世界中進行感知、理解和交互。
在一場 TED 演講中,李飛飛展示了一張 " 貓伸出爪子要把裝有牛奶的杯子推下桌子 " 的圖片,來闡述空間智能的工作原理。她解釋稱,在看到圖片的一瞬間,人類大腦就會開始分析玻璃杯的形狀、在空間中的位置,以及與周圍物體的關系,并産生 " 想要行動的沖動 "。這種沖動就是具有空間智能的生物的本能,能夠将感知和行動聯系起來。
李飛飛團隊目前正在收集一個包含了行爲和動作的三維 ImageNet 數據集,用于訓練計算機和機器人如何在三維世界中行動。他們在機器人語言智能方面已取得一些成就,能夠根據口頭指令讓機械臂執行各種任務,例如打開抽屜、用面包等材料制作三明治等。
如果以實現達到甚至超越人類智能的通用人工智能爲終極目标,現在的大多數 AI 還處于能夠與人類互動的初級階段,下一個門檻是如何讓 AI 具備高級推理能力。業界許多主流觀點認爲,可以通過構建更大、更複雜的模型來提升推理能力,就像 OpenAI 在 9 月發布的 o1 推理大模型。
但李飛飛在最新的訪談中提到,如今的大語言模型和一些多模态模型在底層表示形式上仍然是一維的,與空間智能的方向完全不同。這隻是生成式人工智能革命的第一章。在她看來,動物和人類等智能生物擁有在世界中互動、創造文明、甚至随心所欲地完成各種任務的能力,将這些能力轉化爲原生的三維技術,才是釋放潛在 AI 應用洪流的關鍵。
就像她在學生時代閱讀到的那些物理學巨匠,李飛飛的發言也常常蘊含一些哲學意味。" 這也回到了我所追尋的北極星——爲什麽選擇空間智能,而不是平面像素智能?我認爲智能的進化路徑必然會轉向可操作性。"