作者 | 李梅
編輯 | 陳彩娴
雷峰網消息:近日,亞馬遜機器學習部門原傑出科學家 /VP Alex Smola 與首席科學家李沐師徒二人已從亞馬遜離職,并且确立新去向:進軍大模型方向創業。
此前兩個月,雷峰網與接近李沐師徒二人的 AI 行業人士交談,獲悉二人有離職打算。但直到今天,二人動态才最終确定。
據微信公衆号 " 親愛的數據 " 消息,Alex Smola 于 2023 年 2 月從亞馬遜離職後公布了新的創業項目——一家人工智能公司 Boson.ai,擔任首席執行官兼聯合創始人。其 Linkedin 資料也更新了新的公司信息。
而其弟子李沐這次也再次追随了導師的腳步。
從李沐到卡内基梅隆大學 Alex Smola 門下讀博開始,這兩位頂級 AI 科學家師徒的軌迹就高度重合。2016 年兩人就曾在深度學習落地潮中一同創業,如今在 ChatGPT 引起的新一輪 AI 大模型熱潮之際,兩人抓住機遇從大廠離職創業,新事業令人期待。
關于 Boson.ai 這家新公司,目前的公開資料還不多,Alex Smola 簡短透露稱:" 我們正在做一件大事……請保持關注。如果您想從事可擴展基礎模型方面的工作,請聯系我。" 官網目前也在建設中,頁面顯示其創業方向爲大模型。
Boson.ai 官網
李沐的公開資料還尚未顯示其最新動向,但他已在 Github 上親自創建了新公司的項目:
1
深度學習框架開創者李沐
李沐
ACM 班的 " 沐神 " 傳說
李沐的大學本科在上海交通大學 ACM 班度過。ACM 班由總教頭俞勇領銜,旨在培養計算機科學家,彙聚了一群最聰明的年輕人。
李沐 2004 年入學,在呂寶糧教授的實驗室學習,開始接觸人工智能。從大一開始,李沐就被周圍同學尊稱爲 " 沐哥 ",據他的室友李佐凡回憶,李沐有一股難以壓制的領袖氣場從内而外地散發出來,讓人不禁仰視。
2007 年夏,李沐去微軟亞洲研究院實習,在互聯網搜索與挖掘組(WSM)和搜索技術中心(STC)受 Steve Macbeth 指導(現在亞馬遜任 CE 技術總監)。這是李沐與工業界的初次接觸。
畢業後,李沐并沒有直接去業界找工作,當時計算機雖是社會上的熱門專業,但 IT 公司還沒有那麽厲害,尤其是 AI 方面的技術還沒那麽強。所以在 2009 年 8 月,李沐作爲訪問學生到香港科技大學繼續深造,之後在那裏繼續擔任研究助理。
初去百度做廣告系統
2011 年,李沐嘗試申請了一次美國的博士項目,但當時拿到的 offer 裏并沒有特别合适的導師。所以李沐選擇留在了國内,北上投奔師兄戴文淵,在百度做廣告方面的工作。
在百度的一年,李沐的主要工作是利用廣告數據訓練能夠預測用戶點擊廣告率的模型。李沐從中積累了不少工業界經驗,也爲他後來開發機器學習系統的長久事業開了一個頭。李沐後來在回顧百度的這段經曆時也說到,在百度 " 遇到的很多問題成爲了之後研究方向的來源,當時深度學習剛出來,冥冥中覺得應該是大規模機器學習的未來 "。
一年後,李沐決定再次踏上求學之路。在百度的經曆讓他清楚了自己的研究短闆,而當時國内的機器學習系統并不發達,選擇他選擇了 CMU 和 MIT 兩所美國學校,把之前的博士申請材料重新寄了一遍,結果很順利地拿到了 CMU 的 offer。
某次,李沐在百度的食堂與餘凱、張潼一同就餐,談到去 CMU 讀博,餘凱和張潼就建議他去 Alex Smola 教授門下,并寫了一封推薦信過去。
百度少帥與 MXNet
李沐去 CMU 讀博的前半年,Alex 還在谷歌工作,由于經費不足,就找來另一位做分布式系統的教授 Dave Andersen 一同指導李沐。
在博士第一年結束的暑假,李沐去谷歌實習,主要在研究内部代碼和文檔,了解了谷歌的基礎架構,開了眼界。當時 Google Brain 成立不久,李沐在那裏見識了 Jeff Dean、Geoffrey Hinton 等大牛。
博士第二年,李沐實現了一個通用的分布式機器學習框架,即 Parameter Server(論文:Parameter Server for Distributed Machine Learning)。該框架一開始的目的是爲了做實驗更方便,李沐花了大量時間去設計接口,做了多個版本實現,還做了一些工業界級别的大規模實驗。最後,這項工作發表在了機器學習系統領域的頂會 OSDI 上。Parameter Server 後來還合并到了 MXNet 項目中。
李沐對深度學習的接觸并非起于在 CMU 的博士研究,而是在國内的百度見證了深度學習的火熱。時任百度深度學習研究院(IDL)副院長的餘凱是他的引路人。當時,餘凱正在百度推動深度學習,啓動了 " 少帥計劃 " 以吸引優秀的年輕 AI 人才。李沐入選該計劃,并 " 入坑 " 深度學習。也是在餘凱的建議下,李沐開始醞釀做一個深度學習開源平台。
回到 CMU,李沐先是繼續做 Parameter Server 項目,寫了許多代碼,并幫助用戶使用這些代碼。但遇到不少困難,比如由于忽視代碼的易讀性,導緻隻有少部分人能理解代碼從而做一些開發,再者,沒有人能一起審核代碼接口,導緻這些接口個人風格強烈,但很難做到對所有人都簡單明了。
幸運的是,李沐發現了當時在華盛頓大學讀博的陳天奇,當時陳天奇在做 XGBoost 項目。兩人交流以後,發現很多基礎部件是可以多個項目共同使用的,而不是每個項目都造一個輪子。于是,李沐與陳天奇在 Github 上創建了 DMLC(Distributed Machine Learning Community)組織。
MXNet 項目也在這個組織中很快啓動。李沐将三個不同的開源項目合并到了一起,分别是由在美國的陳天奇的 CXXNet,張铮及其學生王敏捷牽頭的 Minerva,以及顔水成學生林敏牽頭的 purine2,最終創建了 MXNet 框架,并于 2015 年年底開源。
2
" 參數服務器之父 "Alex Smola
Alex Smola 是國際機器學習的知名科學家,此前在亞馬遜期間緻力于構建人工智能和機器學習工具。在分布式深度學習框架領域,他曾提出并行 LDA(Latent Dirichlet Allocation)的框架,是參數服務器概念的最早來源。
Alex Smola
Alex Smola 于 1996 年在慕尼黑工業大學獲得碩士學位,曾在慕尼黑科技大學、帕維亞大學和霍姆德爾的 AT&T 研究院學習物理學。1998 年,他獲得柏林工業大學的計算機科學博士學位,先後去往柏林 GMD 軟件工程和計算機體系結構研究所和澳大利亞國立大學信息科學與工程研究院工作。2004 年,他在 NICTA 的統計機器學習項目中擔任高級首席研究員和項目負責人,2008 年起入職雅虎研究院。
2012 年春至 2014 年底,Alex Smola 在谷歌研究院工作,中間從 2013 年起,他開始擔任 CMU 的教授,指導李沐,後來于 2016 年加入 AWS。
3
李沐師徒的亞馬遜往事
2016 年李沐準備從 CMU 博士畢業,那段時期深度學習的落地十分火熱,科學家紛紛從學術界去往工業界,各種巨資收購初創公司不斷。當時李沐在國内的許多好友都紛紛創業,如餘凱離開百度創立地平線,戴文淵從華爲離開、創立第四範式。
李沐也躍躍欲試,與兩位導師 Alex 和 Dave 以及 Ash Munshi 一起,創立了公司 Marianas Labs,李沐出任 CTO。
中途,Dave 離開公司,去了谷歌與 Jeff Dean 一起做 Tensorflow。之後,公司的項目果然被一個小上市公司看中,就将公司賣了出去。但後來他們認爲這家公司不靠譜,就考慮不再合作,另做打算。當時的 Alex 在陽谷縣(SunnyVale)買了房,有還貸的經濟壓力,于是選擇去了亞馬遜,擔任 AWS 副總裁級别科學家(Distinguished Scientist),從 CMU 重返工業界。
所以,這次短暫的、并不算很成功的創業之旅就此終止,李沐也總結了一些教訓和經驗:團隊和技術強是一方面,更重要的是要把産品做好。
在這時,李沐收到了 Jeff Dean 從谷歌抛來的橄榄枝。機會很誘人,但李沐考慮到 MXNet 的後續發展,覺得去亞馬遜是更好的選擇," 自己挖的坑,總是要自己填的 "。李沐便追随導師 Alex,以兼職的身份去了亞馬遜,直接向 Alex 彙報,帶着一些人做 MXNet 的開發和 AWS 上深度學習的應用。
随後,李沐完成博士學位後,于 2016 年 7 月正式加入亞馬遜 AWS。亞馬遜的人工智能部門彼時剛剛成立,對深度學習框架正有着強烈的需求。李沐的新目标不再僅僅是深度學習框架的研發,還包括讓框架更好地服務用戶。在他看來,分布式系統最難的不是如何讓每個機器計算的多快,而是機器之間的通訊,如何減少通訊提升交互效率,對系統來說也至關重要。
2016 年 11 月,MXNet 被亞馬遜選爲官方開源平台,這對于 MXNet 和李沐而言是一次重大勝利。
起初李沐因爲想要填 MXNet 的 " 坑 " 而追随導師加入亞馬遜,六年多來也主要圍繞 MXnet 展開工作,如今看來他已找到了待發掘的 " 新坑 "。而對于 Alex Smola 而言,上一次的短暫創業因爲背負房貸壓力而終止,這次他與弟子再次創業,想必房貸的經濟壓力早已解決,也有足夠的資本來投身燒錢的大模型領域。
當下大模型的火熱對人才的吸引力巨大,AI 科學家離開大廠、創業入局 ChatGPT 已成趨勢,期待李沐與 Alex Smola 師徒在這一賽道上的新動作。
參考鏈接:
https://mp.weixin.qq.com/s/EEUDKjcEgvD1lGWCXHI36w
https://alex.smola.org/
https://zhuanlan.zhihu.com/p/25099638
https://mp.weixin.qq.com/s/GIkUsPZDsCs3PpZVYXnB_w
更多内容,點擊下方關注:
未經「AI 科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!
公衆号轉載請先在「AI 科技評論」後台留言取得授權,轉載時需标注來源并插入本公衆号名片。
雷峰網