作者 | 李梅
編輯 | 陳彩娴
2012 年春節前夕,李彥宏特地抽出時間,在北京接見了一位從矽谷飛來、在國内名不見經傳的技術青年。這人三十來歲,戴着黑框眼鏡,圓臉,個子不高,但口中所言句句都讓李彥宏興奮不已。
這個人,就是時任矽谷NEC Lab主任的餘凱,一位深度學習早期的少數派和虔誠信徒。
眼下,他有種強烈的感受,人工智能将很快在産業中爆發其技術潛力,而國内如火如荼的互聯網正是一片沃土,這是回國的好時機。
李彥宏就在這時找到了餘凱。谷歌全面退出中國内地市場後,百度正是春風得意。對技術敏感的李彥宏緊跟國内外頂尖科技團隊動态,很快察覺到人工智能會爲百度帶來新的機會,開始四處尋找人才。
兩人見面,餘凱布道深度學習,李彥宏則大談自己對語音識别和圖像識别的興趣。雙方内心都有一種相見恨晚的激動與澎湃。
也就是在這一天,餘凱與李彥宏爲百度和中國 AI 做了一次曆史性的相互選擇:李彥宏抛出橄榄枝,邀請餘凱回國。在大時代洪流的驅使下,餘凱毅然結束了矽谷六年生涯,回國加入百度,成立多媒體部,開始研究語音識别和圖像識别。
此前,百度在 AI 方面的研究積累幾乎爲零,餘凱加入後,百度才率先注入深度學習的基因。餘凱在短短幾個月裏,爲李彥宏兜售了深度學習的潛力。李彥宏一次次受到震撼,甚至給全公司的産品經理發信,要求他們必須重視「深度學習」這門技術。深度學習的另一代名詞「神經網絡」也開始在國内傳開,百度首先養活了國内最早一批做數據标注的公司。
不過,真正讓李彥宏下定決心「重倉」深度學習的,是 2012 年 12 月餘凱代表百度參加的一場競拍失利。
Geoffrey Hinton 團隊研發出的神經網絡 AlexNet 在全球頂級圖像識别大賽 ImageNet 上一舉奪冠,在世界範圍内引起轟動,餘凱作爲曾經的冠軍深受感觸,也更知道 AlexNet 所代表的 AI 技術範式的颠覆性。于是,他立即給 Hinton 發去一封郵件,表達想要合作的迫切期待。
這封郵件啓發了 Hinton 在當年 NIPS 大會上發起一場秘密競拍,吸引了全球四家也是如今在 AI 領域大名鼎鼎的領頭羊:谷歌、微軟、百度與 DeepMind。百度出價到數千萬美元,最終惜敗谷歌。但借餘凱的眼,李彥宏目睹了美國的有力對手追求深度學習的瘋狂,感受到了危機。
次年 1 月,李彥宏即籌備成立了全球第一家以「深度學習」命名的 AI 實驗室——百度深度學習研究院(IDL)。李彥宏親任院長,餘凱擔任常務副院長。
餘凱
時隔多年回看,那場競拍第一次暗示了中美科技巨頭在 AI 領域的較量:谷歌勝出後,Hinton 加入谷歌開啓了美國深度學習的浪潮,而餘凱則借助百度的平台,在人才引入與技術推動中,奇點般地将中國互聯網企業拽進了下一個黃金時代:人工智能時代。
餘凱是百度 IDL 早期的實際運作者。在他的影響下,百度吸引了一大批傑出 AI 科學家,如飛槳平台的創始人徐偉、後來地平線的聯合創始人黃暢以及後來百度研究院院長林元慶。巧合的是,曆史上他們都曾在同一個地方插下到訪的旗幟:矽谷NEC Lab。
以這批 NEC 注入百度的人才爲中心,尤其是餘凱,他們又虹吸了更多的科學家,如吳恩達。百度的「少帥計劃」最初由李彥宏提出,目的是吸引年輕人才,餘凱主力遊說了李沐(後亞馬遜 AI 首席科學家,現大模型創業公司 Boson.ai 創始人)、李磊(後字節跳動 AI Lab 總監)、顧嘉唯(現物靈科技 CEO)加入。
中國最早的自動駕駛項目也誕生在 IDL。倪凱、楊文利、張天雷等自動駕駛元老,都是餘凱當時爲該項目招進去的第一批員工。其他人物如張潼(後騰訊 AI Lab 主任)、賈揚清(後阿裏技術副總裁,現大模型框架創業者),也都跟 NEC 或 NEC 的人在 AI 走向中國企業的過程中有所交集。
他們中的大多數人都成爲了中國企業裏知名的 AI 科學家,但背後這座影響了他們的飛地以及飛地的故事,則少爲人知。
—— 01 ——
各路賢才齊聚「矽谷心髒」
2009 年 10 月,國際視覺挑戰賽 Pascal VOC 的結果在日本京都的 ICCV 大會上揭曉,一個來自 UIUC 與 NEC 的合作團隊摘得分類賽道冠軍,圖像識别精度甩開第二名 5%。矽谷NEC Lab開始聲名遠揚。
Pascal VOC 在當時被譽爲計算機視覺界的「世界杯」。時任 NEC 主任的龔怡宏聚集了實驗室裏幾個最擅長圖像研究的青年人才,如餘凱、徐偉、王進軍、呂鳳軍,與 UIUC 「華人視覺之父」黃煦濤的學生楊建朝和周曦一起,投入五個月,研發出一個新的稀疏編碼模型來做圖像識别,沒想一舉世界杯奪冠。
龔怡宏有些意外。那一年,正好是他加入 NEC 矽谷的十周年。
十年前,1999年,矽谷 NEC 一個華人科學家也沒有,他是第一個加入 NEC 的華人。十年後,NEC 已經聚集一批優秀的青年 AI 研究者。盡管人工智能在當時仍是不溫不火,但在他們的帶領下,NEC 美國研究院逐漸成爲了國際機器學習重鎮之一。
龔怡宏
上世紀 80 年代末是日本經濟的最高峰時,日本電氣股份有限公司(NEC)在美國設立研究院,分爲普林斯頓總部和矽谷分部。
龔怡宏是中國最早一批日本公派留學生,在 1983 年赴東京大學留學,一路念完本碩博。畢業後,他曾先後短暫在新加坡南洋理工大學和美國卡内基梅隆大學(CMU)任教過,但都隻幹了短暫幾年,最終偶然的機會來到矽谷NEC Lab媒體分析部,事業開始穩步騰飛。
矽谷NEC Lab三層小樓,位于庫比蒂諾市(蘋果總部所在地,有「矽谷心髒」之稱)
龔怡宏爲矽 NEC Lab引進第一批從事人工智能研究的華人科學家。
2001 年,他首先找到了 CMU 碩士畢業的徐偉,一個不可多得的天才。
徐偉本科在清華大學就讀,在神經網絡還處于低潮期時就已經開始研究。1998 年畢業後,他去 CMU 讀碩士,提出了一個神經網絡語言模型,是世界上最早用神經網絡(即後來的「深度學習」)方法研究自然語言處理的開山之作。
依徐偉的水平,繼續深造、拿下博士學位完全不成問題,但他更想馬上将神經網絡技術應用到工程問題中,就沒有申請讀博,而是出來找工作。龔怡宏看人很準,立即引進徐偉。徐偉是龔怡宏爲 NEC 招入的第一個 CMU 人才,與徐偉同期的還有「NEC 大師姐」韓玫。
徐偉
同一年,龔怡宏還招進一位暑期實習生,名叫朱勝火,在羅徹斯特大學讀博士三年級。
朱勝火 1994 年從浙江大學本科畢業,之後去清華讀研,跟着黃昌甯和周明做自然語言處理和機器翻譯研究。1997年,他又到羅徹斯特大學繼續深造機器學習。博士讀到中期,朱勝火慕名來 NEC 實習,他數學能力出衆,通過了龔怡宏的面試,跟着龔怡宏做了幾個月的多媒體研究。
2003 年朱勝火博士畢業時,選擇并不多,當時美國經濟蕭條,國内的 AI 也還沒發展起來,所以他先去了亞馬遜機器學習團隊做推薦算法研發。那時候的亞馬遜還是一個隻有幾十人的創業小團隊。但接觸一年多業務後,朱勝火覺得還是需要更深入的研究,于是決定再回到 NEC。
朱勝火
沒多久,餘凱、王進軍、林元慶等人也相繼到來。這當中,朱勝火的「鼓動」起到了重要作用。
2005 年 8 月中旬,朱勝火前往巴西薩爾瓦多,參加信息檢索領域的頂級會議 ACM SIGIR。就在這個會議上,朱勝火第一次見到餘凱。
那時的餘凱二十九歲,剛從慕尼黑大學博士畢業一年。餘凱是江西南昌人,在南京大學完成本碩學位,接着赴德讀博,畢業後在德國西門子中央研究院工作。
朱勝火這次來參會,除了做學術交流,還打算撈些人才進 NEC。他先前讀過餘凱的工作,印象很深刻,正好這次碰上,就上前與餘凱攀談。聊到投機之處,朱勝火問餘凱:「有沒有興趣去美國?」
餘凱正有換工作的打算,加上跟朱勝火十分談得來,就回應很有意願。
朱勝火待人熱情,餘凱亦很健談,兩人在巴西很快熟絡起來。中間朱勝火遭遇了一次搶劫,與人周旋搏鬥受了點傷,餘凱敬佩地誇他真是有勇氣,他則笑着擺手說,「哪裏哪裏,那人搶我的時候,我隻是不停地跟他說随便拿,可是人家聽不懂。」餘凱就覺得「這哥們兒憨憨的,很好玩」。
不過那段時間,餘凱也在考慮回國發展,還拿了微軟亞洲研究院(MSRA)的 offer。MSRA 那時由沈向洋領導,是國際上名氣最大的 AI 研究院。而當時的 NEC 美國研究院也很強,有過許多祖師爺級别的大牛坐鎮,如 SVM(支持向量機)的發明人 Vladimir Vapnik、深度學習先驅 Yann LeCun 等,對人才也很有吸引力。當時,如果在谷歌搜索「NEC Labs American」,谷歌會「夾帶私貨」地彈出一則谷歌招聘廣告。
餘凱幾經猶豫,最後在身邊朋友的建議下,決定不妨先去矽谷轉一圈。2006 年走進 NEC 的餘凱已經笃定,自己最終是要回國的。沒有人料到,這個念想在六年後會直接推動整個中國 AI 的産業變革。
如同朱勝火在學術會議上「鼓動」餘凱,後來的許多人如王進軍、林元慶等,也是在會議上經引薦、介紹而來到 NEC。那幾年會議規模小,同一個圈子的人都能在會上碰到面、打上招呼。
王進軍比餘凱晚一個月到 NEC。2004 年紐約 ACM Multimedia 會議上,王進軍的博士導師徐常勝把他引薦給了好友龔怡宏。當時王進軍在南洋理工大學讀博士一年級,已經發表了多媒體檢索方向的頂會論文,給龔怡宏留下了印象。
兩年後,龔怡宏找到當時在新加坡工作的徐常勝(現中科院自動化所研究員),問有沒有不錯的學生能推薦到 NEC。聽到王進軍的名字,他馬上就回想起來,「王進軍我記得,讓他來很好」。之後王進軍就與龔怡宏隔着大洋在電話上聊了一個多小時,通過了面試。
王進軍
林元慶來到 NEC 是在 2008 年,由餘凱和朱勝火介紹。他們三人第一次見面是 2007 年的 12 月溫哥華舉辦的 NIPS 會議上。
當時是林元慶在賓夕法尼亞大學讀博最後一年,他的論文被 NIPS 接收爲 Oral(口頭報告)。先前他在清華讀光學工程碩士,博士則專攻機器學習。
林元慶作報告時,餘凱和朱勝火注意到了他。兩人都認爲他的研究水準很高,而且做的是與實驗室很相關的稀疏學習(Sparse Learning)方向。他們就與林元慶聊了一番研究,聽林元慶說正找工作,兩人馬上告訴他,NEC 還要招人。林元慶沒有懸念地表示出了興趣,次年畢業後就正式入職。
這一時期,矽谷NEC Lab群賢畢至。他們大都從國内名校畢業,再到海外留學,然後聚在矽谷。這當中有不少清華子弟,除了上面提到的徐偉、朱勝火、林元慶等,還有 07 和 08 年進來的呂鳳軍與楊銘,兩人都是清華本碩畢業,呂鳳軍是個編程大神,本科就出版過一本書叫《數字圖像編程處理入門》,楊銘則十分擅長計算機視覺。
在許多人的講述中,NEC 是他們待過的研究自由度最大的地方,匠心如雲。研究人員業務交付壓力小,比如模型做出來後,業務還會謹慎複現一遍,原始代碼不一定能用上,所以大家會開玩笑,「反正做的東西也用不到産品中」。NEC 的經費來源結構也很特殊,公司直接提供 70%,僅 30% 需要從 BU 獲取,這就讓他們更能專注做研究。
在這種研究環境下,他們很快就取得了傑出的研究成果,尤其是深度學習。盡管後來深度學習爆發地不在 NEC,但 NEC 是世界上最早研究卷積神經網絡(CNN)的實驗室之一。
90 年代的中美兩地,分别有一個人堅持坐着神經網絡的冷闆凳——徐偉在清華大學将神經網絡用在語言模型中,Yann LeCun 則在貝爾實驗室研究 ATM 的支票識别。
後來 LeCun 的團隊解散,去了 NEC 普林斯頓總部,徐偉則是矽谷分部做深度學習的代表。徐偉動手能力極強,自己寫了實驗室的第一個卷積神經網絡。後來 Caffe、PyTorch 等模型參數配置化的搞法,在徐偉當年實現的 CNN 當中都已經有了。
餘凱到來後,也成了實驗室做深度學習的主力。他很感激地認爲,結識徐偉是他進NEC「最大的一個收獲」,是徐偉領他進入了深度學習領域。
接觸過徐偉的人,都會強調他的聰明至極。他對問題的直覺很敏銳,還講究效率到了極緻。一個例子是,實驗室在三樓的衛生間比較小,每天中午一起出去吃飯前,徐偉爲了避免幾分鍾的等待,一定會先去二樓的衛生間。大家發現了都很驚奇,在這種小事上,徐偉也要奉行他效率優化的原則。
同時,徐偉又十分低調,深藏許多功與名。比如在 Netflix 曾舉辦的百萬美元推薦算法賽中,有個名叫「xyz」的團隊長時間霸榜第一,卻從未透露身份,在當時引起了讨論。這個神秘團隊其實就是徐偉本人。後來,無論是在百度還是地平線,徐偉也都保持着對 AI 最純粹的熱情。
在餘凱、徐偉等人的努力下,NEC 在稀疏編碼方面的研究做到了頂尖,2009 年的 Pascal VOC 冠軍就是證明。也正是在這次冠軍之後,他們這群人的方向開始有了第一次分岔。
矽谷的投資人們找上了門,鼓動 NEC 這幫人做産業化。
龔怡宏很心動,他一直都很看重研究的落地,早有創業的想法。再加上金融危機來勢兇猛,公司受到波及,外面傳聞不斷,大家普遍騷動不安。那段時間,即使是在學術界名望很高的黃煦濤,也憂于籌不到足夠經費來培養博士,隻能無奈催促學生們盡量早點畢業。
深思熟慮後,龔怡宏私下問了一圈大家的意見,正好王進軍也有意創業。兩人就很快在加州成立了一家公司,叫 AkiiRA Media Systems,做下一代視頻搜索引擎。不過,時運不濟,他們的這次産業化嘗試并不算成功,市場環境未見好轉,不到一年兩人就離開了。
之後龔怡宏便回了國,在 NEC 中國研究院任首席科學家,2012 年到西安交通大學任教。王進軍先是去了美國 Epson 研究院,2013 年也回國加入了西交大。
—— 02 ——
餘凱創造黃金時代
在龔怡宏走後,NEC 找到在團隊裏頗有号召力的餘凱,問他如果找個人來當實驗室的頭兒,誰比較合适?
餘凱脫口而出「徐偉」。他當時也很焦灼,覺得公司不一定能撐得下去,就去外面找工作,拿了雅虎的offer。
公司又去問徐偉的意見,徐偉則未經猶豫地答「餘凱」。可見兩人對彼此有足夠的信任,也都想在離開前爲團隊選一個好的帶頭人。
餘凱領導力強,經常在家裏組織聚會,大家甚至懷疑每周末全矽谷的華人科學家都聚在了他家。大家對帶團隊沒太大興趣,更願意埋頭做研究,雜事有人願意去做就最好了。後來餘凱對此「無奈」笑道,「這幫家夥鬼精鬼精的。」
不過,徐偉先餘凱一步離開去了 Facebook。他離職前,餘凱把大家聚到一起拍了一段視頻,視頻裏大家做着滑稽的表演,說着告别的話。他們彼此感情很好,中午一起開車出去吃飯,買單後還會拿剩下的零錢去買個彩票,幻想中了大獎下周就不用來上班了。周末約出去玩,他們聊天話題從一開始的天南海北到後來的家庭和育兒,對彼此了解很深。所以分别時刻,不無感傷。
回過頭看,2009 年這一波人才出走,更多是因爲外部經濟因素,而不是 AI 迎來了風口。但在深度學習爆發之前,留守在這幢小樓裏的這群人,依然造就了 NEC 最後的輝煌,也爲 2012 年之後在中國工業界掀起 AI 熱潮做好了「無意」的準備。
其中,餘凱就是那個帶領 NEC 走出「寒冬」的轉折點。
2009 年的年末,餘凱還是決定留下來,他覺得自己有責任把 NEC 的力量重新凝聚起來。他設下兩個目标,「向業界證明我們能夠吸引最頂級的人才,做出世界上最優秀的成果」。
接管實驗室第一天,餘凱就提出,大家以後在辦公室不要再講中文了,要更開放地廣招人才。這一發話,大家就都從善如流。實驗室這些年招的大都是華人,總部還爲此抱怨多樣性不夠,要求他們招人要多元化。但沒辦法,那些白人、印度人往往都過不了面試。NEC 的面試也向來嚴格,實驗室人少,甯缺毋濫。
這次餘凱親自面試,招進來兩個大神。一位是黃暢,清華本碩博畢業。他本科時就對圖像識别很有熱情,但直到博士畢業時,他還沒想清楚圖像識别如何在工業界大規模應用,就先去了南加州大學做博士後。直到 10 年,黃暢重燃對工業界的興趣,經朋友引薦找到了餘凱。在餘凱眼裏,黃暢「也跟徐偉一樣,是個天才」,在人臉識别領域的研究是世界一流。
另一位是印度人 Manmohan Chandraker,包攬多個最佳論文獎,餘凱評價他是「3D 視覺做得最好的一個」。後來他接了林元慶的班,如今也還在 NEC 領導計算機視覺部門。
餘凱作爲大家長,爲實驗室創造了很好的研究條件。他攬下大部分雜活,經常出差、跑項目,把實驗室與總部的關系維系得相當好,經費很充裕。餘凱還與學界和業界建立了廣泛合作,對外交流很活躍,比如與吳恩達等學界研究者合作論文,受邀去斯坦福大學授課。
餘凱與吳恩達的相識,是在 2009 年 6 月的加拿大蒙特利爾。爲了複興神經網絡研究,餘凱與後來的深度學習三巨頭 Yann LeCun、Geoffrey Hinton 和 Yoshua Bengio,在國際機器學習大會 ICML 上組織了一場深度學習研讨會,并邀請了時任斯坦福大學教授的吳恩達做報告。
那一次,餘凱就記住了吳恩達這個與他同齡、說話溫文爾雅的高個子,之後兩人保持着很好的交情。
有趣的是,同樣在 2009 年,冬天,餘凱從溫哥華前往惠斯勒 NIPS 分會場,與幾位研究者拼了一輛越野車上山。當時駕車的人是另一位中國深度學習引領者鄧力。彼時鄧力正在微軟用神經網絡發起語音識别革命,餘凱則還不知道,不久後他也将在中國掀起一場深度學習産業變革的風暴。
風暴前夕,便是矽谷 NEC Lab 最後的黃金時代。
2010 年,餘凱與黃煦濤再次合作,把林元慶、朱勝火、楊銘、呂鳳軍等人,UIUC 的實習生曹亮亮、周曦,以及羅格斯大學的教授張潼集中到一起,拿下了首屆 ImageNet 挑戰賽冠軍。
後來餘凱自評,他進入工業界之後的第一件漂亮事兒,就是打赢了這場比賽,「可以說,在 2012 年 AlexNet 之前,我們用非監督的卷積深度學習算法做圖像識别,是被廣泛證明的最好算法。」
實驗室聲譽高漲,大家此前的悲觀情緒一掃而空,NEC 也繼續吸引着優秀青年進來實習。
2011 年,餘凱收到一封來自伯克利 Trevor Darrell 教授的郵件,說他有個特别聰明的學生想做深度學習,但伯克利沒有項目可做,想推薦到 NEC 實習。
這個學生就是賈揚清。餘凱覺得賈揚清資質很高,就立即找了黃暢一起來指導他。賈揚清正是從這裏開始接觸的深度學習,那段時間他所顯示出的強大數學功底和工程代碼能力,讓所有人都毫不懷疑,這個年輕人不久就将在深度學習領域拿出驚人的東西來。
賈揚清
果然,幾年後,賈揚清做出了影響全世界的深度學習框架 Caffe。之後他在谷歌和 Facebook 還參與了 Tensorflow、PyTorch 等框架的開發,影響深遠。2019 年加入阿裏巴巴後,賈揚清領導大數據 AI 業務,做到了行業領先。四年過去,他選擇從阿裏「畢業」,又回到了他最擅長的 AI 架構方向創業。
—— 03 ——
林元慶緊追深度學習浪潮
相比當了時代「炮灰」的龔怡宏,餘凱的出走更爲幸運。2012 年,他在最好的時機回國,爲百度帶去了 NEC 的人才。
離開之前,餘凱強烈推薦了林元慶做實驗室主任。林元慶有很強的閉環感,做事從一而終,餘凱非常欣賞他這一點。
林元慶
林元慶在任期間,繼續吸引了一些人才進 NEC 。當中就有兩位中科大校友王孝宇和楊天寶,另外還有 CMU 畢業的周峰。這一時期的知名實習生有楊天寶指導的謝賽甯(現紐約大學助理教授),後來他與何恺明提出了著名的 ResNeXt。
當餘凱一行人在百度轟轟烈烈搞深度學習時 ,身在矽谷的林元慶也帶隊迅速投入到深度學習。林元慶主攻機器學習,因此反應最快,開始利用深度學習做大規模細粒度圖像識别和自動駕駛的 3D 視覺感知。
他們在全世界最早用深度學習做物體檢測,并憑借其中的技術獲得了 2013 年 ImageNet 比賽的亞軍,團隊成員包括林元慶、王孝宇、朱勝火、楊銘、楊天寶以及密蘇裏大學的韓旭等人。在他們使用的框架中,深度學習在隻是作爲一個特征提取工具,名次雖居第二,但技術原創性非常強。當時,伯克利團隊與他們差不多是同期用深度學習做檢測,所以賽後林元慶和王孝宇就被邀請去伯克利報告他們的新發現,聽衆反應都很熱烈。
王孝宇說,也正是因爲他們看重技術創新、追求完美,所以 13 年之後,比賽變得越來越工程化,他們就沒再參加。
13 年這次比賽排在 NEC 後面一位的,是 Yann LeCun 的團隊。那時雙方交流也很多,LeCun 曾在 NEC 留下的代碼遺産還得到了後輩的傳承,有次王孝宇參加一個人臉分析比賽,就使用了徐偉當年所寫的代碼,而徐偉那套代碼最初是出自 LeCun 之手。
這一時期,在林元慶的帶領下,NEC 團隊在計算機視覺三大頂會上發表的論文有了數倍提升,還攬下了 2014 年 CVPR 最佳論文獎。
同時,一個明顯的轉變是,大家對研發成果商業化的渴望越來越強烈。但他們也很苦悶,在 AI 迎來産業化熱潮的大環境下,在 NEC 做技術落地的空間不是那麽大。NEC 一直以來的技術貴族做派,讓它以前走在了技術最前沿,但現在,「陽春白雪」隻能帶來與市場的脫節。
所以,2015 年前後,在中國 AI 崛起之際,NEC 人員的大批離開、回國成了必然。
—— 04 ——
那些從 UIUC 來的人
龔怡宏、餘凱、林元慶,這三位帶頭人将矽谷NEC Lab建設成了最強的人工智能實驗室之一。這裏因此逐漸成了華人尤其是青年學生實習必去的一個地方。
那時,美國各個名校都有博士來 NEC 實習,比如前面提到的賈揚清、謝賽甯等,不過這當中爲 NEC 輸送了最多青年人才的,還是 UIUC 的黃煦濤。
2006 年,龔怡宏去黃煦濤組裏訪問,雙方建立了穩定的合作。NEC 爲黃煦濤提供研究經費,後者則每年派出組裏 1 到 2 名優秀學生去實習。高校研究資金有限,學生在學校大多「過得苦哈哈」,而 NEC 的待遇和環境特别好,所以他們很願意來。每年暑假,他們到 NEC 開展研究,到了 9、10 月份開始撰寫論文,11 月向 CVPR 會議投稿,第二年中了稿到 3、4 月份去參加會議,就是這樣一個流程。
UIUC 的計算機學科非常強,是美國唯一能與「四大」并列的高校。作爲計算機視覺泰鬥黃煦濤的弟子,他的學生也都是天之驕子。甯華中、楊建朝、周曦、曹亮亮等人,都先後到 NEC 實習過,而且還都是中國科技大學校友。
甯華中是中科大 96 級少年班畢業,碩士繼續在中科大師從譚鐵牛院士。他去 NEC 實習次數最多,連續去了三年。大家因此開玩笑說,甯華中這是賣給 NEC 了。楊建朝形容,那時候甯華中去實習,相當于組裏跟 NEC 的一個結合部。
甯華中
楊建朝來自中科大 0206 班,當時班裏成績最好。06 年他去 UIUC 讀博,與同年來組裏做博士後的顔水成(現智源研究院訪問首席科學家)合作,發表了他第一篇具有影響力的文章,顔水成十分稱道他的算法能力。
他是跟着餘凱時間最長、合作最多的一個實習生,08、09 年去了兩次,做的是當時火熱的稀疏編碼研究。那時在 UIUC 任教的馬毅是最早将稀疏編碼用在視覺上的宗師,楊建朝就是他的重要傳承者,兩人在這個方向上的合作文章都成了經典。
楊建朝
2009 年,與楊建朝一起作爲 Pascal VOC 比賽主力的還有周曦。周曦是中科大 9923 班畢業,碩士也在中科大做模式識别研究。2006 年到 UIUC,從語音轉向圖像,拿過六次世界智能識别大賽冠軍。後來有次跟顔水成合作,周曦僅花了不到三天,就把顔水成先前耗了一個月的項目算法給實現了,讓顔水成感歎不已。
周曦
另外還有曹亮亮,中科大 9806 班畢業,碩士去了香港中文大學湯曉鷗的多媒體實驗室,2010 年來 NEC 實習。許多人的印象是,他不光聰明,還是「這批人裏面的大帥哥」。
曹亮亮
NEC 的正式員工中還有一些是黃煦濤學生的學生,比如楊銘。大家會開玩笑說,與他同期從 UIUC 來實習的學生雖然年齡比他小,但按輩分講,楊銘得喊他們一聲「師叔」。
2012 年入職 NEC 的王孝宇也是類似,他的導師韓旭是黃煦濤的學生。入職前兩年,王孝宇去 NEC 實習過兩次,在楊銘的指導下做大規模圖像搜索研究。他跟楊建朝是中科大的同班同學,之後到密蘇裏大學讀博,是韓旭門下第一個博士。王孝宇入學三個月,就與韓旭、顔水成合作發了一篇一作 ICCV(Oral)論文,這成了他進 NEC 實習的一塊敲門磚。
王孝宇
這些實習生陣列豪華,後來餘凱回憶起來如數家珍,語氣十分自豪,「我們在這些 shining stars 成長的早期一定程度上引導過他們的成長。」
那時,矽谷NEC Lab的華人群星燦爛,研究氛圍又十分自由。楊建朝如今在矽谷仍很懷念,「它就是一個 Research Lab,是個很靈活、很自由的團隊,大家不是特别看重産品的産出。」
這群人從 0 到 1 的追求,也是王孝宇最初去實習時就深刻感受到的。他剛到 NEC 時很懵,因爲要做一個之前沒做過、NEC 也沒人做過的新方向,大規模圖像搜索。他發現,每個人都會去發現和解決新問題,而非哪個技術火就去制造那個方向的論文。王孝宇很擅長短時間内把事情做到極緻,所以很快出了成果。
在 NEC 接受過訓練的青年才俊,後來都在 AI 産業界成就了一番事業,成爲各領域的知名人物。
甯華中 2008 年從 UIUC 畢業後,先在微軟待了一年,然後跳到了龔怡宏當時的創業公司,不到一年就離開了。之後他一直留在灣區,先後在谷歌和 Facebook 工作。19 年,他加入師兄韓旭的公司文遠知行,現在擔任感知團隊的執行總監。
楊建朝是 2011 年畢業,在 Adobe 和 Snap 研究院分别待了幾年,最後去了字節,擔任矽谷 AI Lab 的負責人。
周曦最終選擇了創業。2011 年中國科學院重慶研究院籌建之時,他受院長袁家虎三顧茅廬赴美邀請,決定回國做貢獻、爲國内吸引人才。四年後,他又将人臉識别技術進一步落地,創立了雲從科技。
曹亮亮在學界和業界輾轉多次,創辦過一家公司,最後回到了 NEC 所在的城市,在蘋果公司擔任主任科學家。
—— 05 ——
歸來,開拓中國 AI 疆土
說回到餘凱與百度的故事。
IDL 成立後,餘凱開始爲百度尋找全世界的頂級人才。他先爲李彥宏介紹了他昔日在 NEC 的老友。
有天中午,餘凱在飯桌上跟李彥宏講,要搞深度學習,就一定要招世界上最好的人才。李彥宏問招誰,餘凱跟四年前那次一樣,毫不猶豫地說出了徐偉的名字。
李彥宏接着問如何才能把徐偉吸引過來,餘凱就半開玩笑地信口說了一句,「你得請他吃飯才行。」
沒想到李彥宏馬上就安排了這頓飯。餘凱便把徐偉從美國「忽悠」回北京,把他帶到百度的招待室,随後李彥宏進來。
說起李彥宏給徐偉的入職待遇,餘凱十分羨慕。李彥宏邀他來百度的時候都沒有請吃飯,後面徐偉入職時,李彥宏更是發了全體員工信,稱徐偉的加入将推動百度的技術研發爲全人類進步做出貢獻。足見李彥宏對徐偉的重視。
徐偉加入百度後與餘凱讨論工作,一緻認爲要做一個深度學習平台。爲了快速推動項目,餘凱專門申請了一個會議室,貼上門牌「Paddle 封閉作戰室」,并立即拉來四個人跟徐偉一起做。他們從早幹到晚,很快做出了 PaddlePaddle 的第一個版本,在 IDL 和其他部門都用了起來。徐偉因此成爲百度飛槳的創始者和奠基人。
在餘凱的影響下,當時正在百度美國研發中心的黃暢也回了國,負責百度架構方面的工作,還與餘凱一起爲百度搭建了圖像識别這一技術路線。張潼緊接着也離開學術界,加入 IDL,後來以研究院副院長的身份組建了百度大數據實驗室。
2014 年,李彥宏啓動百度「少帥計劃」,餘凱親自招募了李沐、李磊、顧嘉唯三位少帥。
李沐是在餘凱的帶領下開始做深度學習的。當時餘凱破例創造條件,讓李沐在 CMU 讀博的同時加入「少帥計劃」,指導他做深度學習。
後來李沐與陳天奇等人開發 MXNet 框架,也在餘凱那裏有一個源頭。餘凱曾主張開源 PaddlePaddle,但遭百度内部集體否決,覺得很可惜,認爲開源框架即使不在百度做,也要有其他人在别處去做。于是餘凱在某個周末把李沐約到清華科技園的咖啡館,跟他說開源深度學習平台很值得嘗試。李沐深以爲然,回到 CMU 後就開始了行動。
前不久,李沐與其導師 Alex Smola 離職創業,據稱要做當下最熱門的大模型。其實李沐在百度時就曾與餘凱讨論過大模型,當時餘凱認爲,把百度的語音、圖像、視頻等項目結合起來,可以訓練出一個大模型,類似今天的 ChatGPT。隻可惜沒有真正去做,一是資源投入太大,二是李沐優先去做開源平台了。
(預告:深度學習崛起之時,賈揚清、李沐、陳天奇等一批先行者以及以百度爲代表的國内公司率先進入深度學習框架研究,雷峰網後續将另撰文《AI 框架的中國先行者們》,請持續關注,歡迎添加微信 Fiona190913 交流。)
李磊是現任加州大學聖巴巴拉分校助理教授,當初他也是在餘凱的極力建議下加入 IDL 做深度學習。兩年後,李磊有天打電話給餘凱,說他想去百度新聞做推薦系統。接到電話的餘凱正在外面爲地平線忙着跑融資,他馬上停站到路邊,花了兩個小時勸說李磊,應該去一個推薦業務更受重視的公司,哪怕是一家小公司。
這通電話結束後,餘凱馬上就親自把李磊推薦給了張一鳴本人,最後李磊出任今日頭條科學家兼頭條實驗室總監。後來餘凱總跟人感慨,「你看我把李磊勸過去,這個決策很對吧?」當時張一鳴求賢若渴,滿世界找機器學習人才,還曾公開說誰能給他推薦機器學習頂尖人才,就送誰一輛汽車。盡管餘凱迄今爲止也沒有見過汽車的影子,但這個伯樂他當得是十分開心。
第三位少帥是顧嘉唯。餘凱當初找到他時,更是花了大半年才說服他從 MSRA 離開,加入 IDL。他主要負責人機交互方面的架構研發,領導過百度智能眼鏡、智能自行車等項目。
在招募少帥的同時,餘凱還在 IDL 組建了中國第一個自動駕駛軍團。他招的第一批人,包括倪凱、楊文利、張天雷等,如今都是自動駕駛領域的明星人物。
後來自動駕駛單獨成立事業部,王勁(現中智行創始人)任總經理,背後也有餘凱的助推。當時王勁因其部門被并到大搜索而心灰意冷,想要走人,即将離職的餘凱看在眼裏也很同情,随口跟他說了句,「要不然你把自動駕駛接過去」。過後李彥宏也确實将自動駕駛交付給了王勁。
在 2014 年,百度的大事件中還包括餘凱引進吳恩達。
那段時間,餘凱爲網羅人才常往返于灣區,百度也在庫比蒂諾設立了前哨實驗室、吸引北美人才。這年 2 月,餘凱去美出差,就住在了離這個實驗室不遠的帕洛阿爾托喜來登酒店。
那天,吳恩達也正巧在這家酒店。兩人有兩年沒見,就在酒店遊泳池邊上聊各自最近的進展,許久之後意猶未盡,便約了晚上餐廳再叙。吳恩達說到自己離開谷歌大腦後做的在線教育 Coursera,餘凱隐約感到他的事業進展不順。百度首席科學家的位置已經空了一年多,這正是攬下吳恩達的好時機。
就像喬布斯當年說的「想賣一輩子糖水,還是想跟我一起改變世界」那句話,餘凱向面前的好友試探道,「你與其在這裏搞在線教育,還不如回到真正打動你、你熱情所在的 AI 事業上來。」
這句話讓失意的吳恩達一下子打開了心扉。見吳恩達有幾分動容,餘凱接着說,「百度願意敞開大門吸引你過來。」
後面的事情大家都知道了。吳恩達先後與百度高級副總裁王勁和李彥宏見面,5 月正式入職。
百度時期的吳恩達
但沒有人知道的是,至少在 2014 年的 4 月,餘凱已經有意離開百度。
當時餘凱去矽谷出差,在帕洛阿爾托的一家星巴克與吳恩達見了面。餘凱跟他講了一些入職的細節,包括怎麽對外發新聞稿之類。說完這些,餘凱話鋒一轉,語氣誠懇地告訴吳恩達,「我打算離開百度。」
吳恩達很吃驚,說「你把我忽悠到百度來,你是我在百度唯一認識的好朋友,我中文都講不了,你可别跑啊。」
事實上,那時餘凱已經有了創立地平線這樣一家公司的想法。他跟吳恩達坦誠講自己想在芯片方面做點事,吳恩達也表示理解,但希望餘凱至少再在百度待一年,也算幫自己過渡一下。餘凱應允下來,陪好友留在了百度,直到 15 年的 5 月 23 号離開。
後來李彥宏挽留餘凱,一番長談後,突然恍然大悟似的問餘凱,「你把 Andrew(吳恩達)引進來,是不是因爲你自己想走、想去創業?」
餘凱心裏頓時想,Robin 的情商還真是高。他如實回答并解釋說,百度在中國 AI 領域是絕對的第一,在全世界也是緊追谷歌,要繼續吸引最好的人才進來,不能因爲自己離開把這個事情給中斷了,這是他對百度的一個承諾。
餘凱想做自動駕駛芯片的想法其實萌生得很早。當初餘凱帶領百度 IDL 最早大規模使用 GPU 做深度學習時就想到,用 GPU 做深度學習的效果是一種無心插柳,或許專門在 GPU 上做文章也大有可爲。之後百度布局自動駕駛後更驗證了他的結論:如果不做芯片,自動駕駛就無法量産。
2015 年 7 月,餘凱成立地平線,并拉了老相識黃暢和楊銘作爲聯合創始人。三人之間都已建立了很強的信任感,也都有用技術去改變産業的理想,所以很自然又走到了一起。其中楊銘是從美國回來,他當初離開 NEC 後去了 Facebook 人工智能實驗室,曾提出著名的人臉識别算法 DeepFace。不過後來楊銘爲了照顧在美國的家庭還是離開了地平線,如今他在芯翌科技擔任首席科學家。
(左起)黃暢、餘凱、楊銘
徐偉也在地平線延續了與餘凱的第三段合作。追随深度學習二十餘年的他對人工智能有着極強的使命感,2018 年 7 月他從百度離職後,決定回歸技術研究本身,加入地平線擔任通用 AI 首席科學家。
事實證明,餘凱押中了行業。與其他百度自動駕駛元老選擇做全棧不同,他一開始就瞄準了處理器,如今他迎來了屬于自己的時代。
朱勝火與林元慶的再次相遇是在 2018 年的杭州。朱勝火在 NEC 的第十個年頭,收到金榕的邀請,加入了阿裏巴巴在西雅圖新建的研發中心 iDST。後來達摩院成立,他就回國到了杭州。
林元慶離開 NEC 是在 2015 年 11 月,受吳恩達的邀請加入了百度,先是擔任 IDL 主任,兼任自動駕駛事業部副總經理,17 年升任百度研究院院長,還與徐偉代表百度牽頭籌建了深度學習技術及應用國家工程實驗室。
後來,百度研究院架構幾經調整,不順遂之事多有發生。林元慶性格随和,但做事還是比較激進、有原則,他很快在 17 年的 9 月選擇了離開。
林元慶是個很執着的人,當初打完 ImageNet 比賽後,就想将研究推向市場,後來在百度也想做偏向落地的事情。現在終于到了創業的時機,林元慶很快在北京創立了 Aibee(愛筆智能)。
有段時間林元慶在做杭州景區的攝像頭業務時,就跟朱勝火碰了面。朱勝火在阿裏也在做機器學習在線下的落地,兩人談到這一塊都興緻勃勃,之後朱勝火去北京出差,又找林元慶聊了許久,決定與他一起發展事業。
現在朱勝火作爲 Aibee 的聯合創始人,在西雅圖全面負責機器學習。值得一提的是,先前在 NEC 待過的周峰也在 2018 年加入了 Aibee。
王孝宇離開 NEC 比林元慶還早了一點。他沒有回國,而是去洛杉矶與兩位中科大校友楊建朝和李佳(李飛飛的學生)一起創建了 Snap AI 研究院。直到 2017 年,他選擇回國出任雲天勵飛首席科學家。作爲安防賽道的明星獨角獸,雲天勵飛已經成功在今年四月登錄科創闆完成了上市。前不久,王孝宇還和李佳還一同當選了 IEEE Fellow。
當初最早嘗試做産業化的王進軍,回到學術界後仍一直對技術落地抱有熱情。所以 19 年他創辦了淩圖科技,做計算機視覺的落地。
到如今,從矽谷NEC Lab走出的華人,已經在中國 AI 的疆土上四處紮根,野蠻生長。
(公衆号:雷峰網)