Fei-Fei Li,斯坦福大學首位紅杉講席教授,計算機科學教授,AI 領域先鋒人物,尤其在計算機視覺領域具有開創性貢獻。她是 ImageNet 項目的創始人之一,推動了深度學習革命。近年來,她積極倡導将人文價值融入人工智能技術發展,并在學術與創業領域持續探索 Spatial Intelligence 等前沿課題。本次訪談由 Tools & Weapons 與 Fei-Fei Li 回顧了她的個人經曆,探讨了受到政府與企業資助的學術研究如何在好奇心而非利益的驅動下,帶來意想不到的變革,推動突破性的創新和經濟發展的機遇。
以下爲對話内容:
人生中最珍貴的禮物:好奇心
Brad Smith:今天我想和你談談一個詞—— " 好奇心 ",它在你的生活、你的成功中所扮演了重要的角色,大家都認爲你一直是一個充滿好奇心的人。我想問的是,這種 " 好奇心 " 最初是在哪裏産生的?
Fei-Fei Li:作爲科學家,我一直覺得好奇心是人生中最珍貴的饋贈。我的書名是《The Worlds I See》,副标題中的第一個詞就是 "Curiosity",因爲保持好奇确實是我人生中最重要的主線。
你問我這種好奇心是如何誕生的,我認爲每個孩子生來都懷有好奇心。這種好奇心是我們人類獨有的天性,甚至在靈長類動物和其他物種中也可以觀察到。這是一種推動探索世界的本能。
我小時候很幸運,成長環境保護了我的好奇心。我記得父親會在周末帶我去舊貨出售的攤位。雖然聽起來像是無聊的事情,但對我來說,每一個攤位都像一個小型博物館。我父親會指着一個杯子說:"Fei-fei,看這個杯子上的貓頭鷹圖案。" 或者拿起一個園藝工具驚歎它獨特的設計。這些瞬間讓我學會用全新的眼光看待世界。
早期移民生活的艱難與饋贈
Brad Smith: 你曾提到早年移民生活的艱難時期。能否分享一下你這段經曆,以及它如何影響你的好奇心的成長?
Fei-Fei Li:我 15 歲時和母親來到美國,與父親在新澤西的帕西帕尼團聚。我們的生活發生了劇變,從中國的中産階級家庭跌入美國的貧困階層。父母在一家幹洗店工作,收入微薄。爲了節省開支,我們經常去舊貨出售和車庫甩賣購買日用品。
周末和父親一起去舊貨出售成爲我童年中最珍貴的回憶之一。父親雖然不懂英語,但總能用興奮的眼光發現那些不起眼物品的獨特之處。這種 " 初學者的心态 " 讓我明白,即使是最平凡的事物,也蘊藏着值得探索的奧秘。那種對事物初次相遇的探索欲正是我後來作爲科學家時所需的特質。我當時并沒有意識到這種視角是多麽珍貴,這與科學家第一次看到一篇好論文、聽說一種新算法時的心情是一樣的。你必須時刻保持這種好奇心。
Brad Smith: 你在普林斯頓的求學經曆非常令人敬佩,尤其是在母親手術期間仍堅持考試的故事。能否詳細講述這一經曆?
Fei-Fei Li:這段經曆對我來說并不是悲情故事,而是移民的奮鬥之歌。我的母親有很嚴重的心髒病,在我普林斯頓大學大一期間需要進行緊急手術。因爲她不會英語,我必須充當翻譯。手術期間她需要保持清醒并與醫生交流,而我必須一直在旁邊支持她。那時我正面臨期中考試,預設向學校申請了特殊安排,允許我在手術室旁邊穿着手術服完成考試。這段經曆讓我更加堅定無論環境多麽艱難,都不能放棄上進與學習。
在職業選擇的十字路口:選擇你所熱愛的
Brad Smith: 你在普林斯頓之後去了加州理工學院讀博士,但在攻讀博士期間,你曾面臨職業選擇的十字路口。一邊是 McKinsey 提供的高薪工作,另一邊是繼續科學研究的道路。你母親在這個決定中扮演了重要角色,能否分享這個故事?
Fei-Fei Li:那确實是我人生中非常艱難的時刻。博士期間的第二、第三年往往是最困難的階段。我曾經的研究論文被拒絕,AI 領域正處于 "AI 寒冬 " 時期,工業界尚未對 AI 産生廣泛興趣,學術崗位競争極其激烈。此外,我的家庭經濟狀況依舊拮據,母親的健康狀況也持續惡化。對于移民家庭而言,McKinsey 的高薪工作代表着安穩的未來。
那時候,McKinsey 的薪水比我父母在美國這麽多年賺到的總和還要多。這讓我感到非常矛盾。我記得有一天在實驗室裏獨自思考,甚至開始想象自己穿上西裝,拿着公文包,過着一份體面的職業生活。但我内心深處始終難以割舍對科學的熱愛。
我打電話給母親,告訴她我在猶豫不決。她沒有考慮自己的健康狀況,沒有考慮我們的經濟困境,而是堅定地告訴我:" 選擇你所熱愛的事情。你在猶豫什麽?" 她的這番話讓我幡然醒悟。科學讓我快樂,好奇心讓我保持前行。她讓我意識到,人生最寶貴的禮物是能夠追随自己的熱愛。而來自母親的愛和勇氣一直激勵着我。
ImageNet 的誕生:對數據規模和多樣性的重要性的前瞻認知
Brad Smith: 你在 2000 年代初期創建了 ImageNet,它後來成爲深度學習革命的奠基石。你最初是如何産生這個想法的?
Fei-Fei Li:ImageNet 始于 2006 年,當時我注意到機器學習領域對數據的重視還遠遠不足。人們通常先開發算法,然後随便找一些數據來訓練模型。但從數學角度來看,學習和泛化能力不僅依賴于算法架構,還依賴于數據的規模和多樣性。
當時我讀了很多生物學和神經科學的論文,了解到人類的認知系統需要大量的視覺輸入來學習和理解世界。我開始思考,如果機器也需要類似的視覺數據進行學習,那爲什麽我們不爲 AI 構建一個大規模的數據集?
ImageNet 的想法在當時被認爲是異想天開。很多同行告訴我,收集那麽多圖像既費時又無意義,還可能影響我的學術生涯。但我始終堅信,AI 模型隻有通過大量、多樣的數據才能真正學習世界的複雜性。于是我帶着兩個學生開始了 ImageNet 項目,花了三四年時間,最終創建了 1500 萬張圖像、覆蓋 2.2 萬個類别的龐大數據集。它是人工智能領域有史以來最大的數據集,也成爲了深度學習革命的關鍵數據集,爲神經網絡算法提供了豐富的訓練數據。
ImageNet 的意義不僅僅在于圖像數量或其作爲視覺數據集的形式,更在于它引入了大數據概念。如今,如果想要推動人工智能的發展,必須依賴三大要素:GPU、算法和數據。從 AlphaFold 到 ChatGPT,再到 Gemini 和 Transformer 等最新的人工智能模型和産品,均建立在這三大要素的基礎之上。
獨立、自由、基于好奇心的學術研究的價值
Brad Smith: 你對學術研究始終充滿熱情。爲什麽你認爲學術研究對計算機科學如此重要?
Fei-Fei Li:我始終相信學術研究的核心在于自由和好奇心,"curiosity based research" 才能做得最好。在很大程度上,學術研究最寶貴的特質是自由。作爲大學教授,沒有人會告訴你應該研究什麽。你可以完全基于好奇心選擇課題,哪怕這個課題在當時看來毫無商業價值。換言之,美國的創新創業環境爲研究人員提供了獨立探索未知領域的空間,不受商業目标的限制。
ImageNet 的誕生恰恰是這種自由環境的産物。當時許多人不看好這個項目,甚至質疑它的意義,但我依然堅持。正是因爲這種學術科研上的自由,研究人員才能想象、實踐不可想象、不可實踐的事物,并最終改變世界。學術界是一個肥沃的樂園,在這裏,研究人員和學生可以盡情想象匪夷所思的事情,或者想象一些讓人嗤之以鼻的事情。
我認爲,美國有着非常獨特且珍貴的科技創新生态系統,而大學和公共部門在其中扮演着關鍵角色。學術機構不僅是技術創新的搖籃,還肩負着培養下一代科學家和工程師的責任。我們的實驗室裏有很多年輕的學生,他們帶着無限的創造力和激情,讓我對未來充滿信心。而這正是我熱愛美國科技創新生态系統的原因——它開放且流動,知識與技術在學術界、産業界和年輕一代之間快速流動,打破了傳統的邊界。
World Labs 與 Spatial Intelligence
Brad Smith: 你既是一名學者,也是一名企業家。能否介紹一下你目前專注的創業項目和理解呢?
Fei-Fei Li:在 2023 年休假期間,我意識到計算機視覺領域正經曆一場新的革命。Transformer、擴散模型、神經渲染等技術正将深度學習、計算機圖形學和計算機視覺重新組合,這在重新定義機器如何理解和生成三維世界——也即是我所稱的空間智能時代。空間智能是一項基礎技術,能夠理解并生成三維世界,帶來前所未有的交互體驗。
然而,單靠學術界的資源很難推動這個領域的快速發展。數據、算力和跨學科協作都需要大量資金和團隊力量。因此,我與前學生及行業同事共同創建了 World Labs,緻力于開發世界模型,幫助用戶創造、交互并利用三維世界,釋放生産力與創造力。
Brad Smith: 美國的國家科學基金會或其他聯邦基金,企業社會基金在您的事業發展和研究過程中發揮了什麽作用?
Fei-Fei Li:至關重要的作用。國家科學基金會是我早期研究的重要資助來源之一,另一個主要資助機構是海軍研究辦公室。ONR 在計算機科學和計算機視覺領域尤爲知名,他們通過多大學研究計劃資助來自不同大學的教授,推動跨學科與跨機構合作。我職業生涯中參與了許多 MURI 項目,這些項目極大地促進了領域内的科技創新。
此外,産業界在推動科研方面的作用也日益重要。事實上,20 年前,我的第一筆産業資助來自微軟,後來陸續獲得了來自谷歌、亞馬遜、松下、豐田、英偉達等企業的支持。聯邦資助與企業資助的良性互動,共同構建了美國獨特的、極具優勢的創新創業生态系統。
Brad Smith: 你對政策制定者在支持基礎研究方面有什麽建議?
Fei-Fei Li:過去五年,我越來越積極地倡導爲公共部門的研究與技術提供資源支持。正如我的經曆所示,公共部門資助對創新生态系統至關重要。大學不僅是技術創新的發源地,也是培養人才和促進關于技術變革的廣泛、嚴謹讨論的場所。我希望政策制定者将公共部門和學術界視爲戰略性資産,對其進行長期投入。這種戰略性的、長期主義的投入不僅關乎知識的突破,人才的積累與吸引,更是推動美國社會進步和保持創新生态系統健康發展的唯一途徑。