Cohere 的三位聯合創始人:Ivan Zhang、Aidan Gomez、Nick Frosst
文 | 适道
本期内容摘要:
1. 20 歲的少年參與了開創生成式 AI 時代的重要論文
2. 喜歡玩技術的華人創業者與天才少年聯合創立 Cohere
3. AI 會帶來哪些風險,它未來最大的機會是什麽?
基礎大模型領域的全球競争仍在進行,融資百億美元的 OpenAI 毫無疑問是領跑者之一,它的殺手級應用 ChatGPT 擁有數億活躍用戶,想要與它正面競争無疑是困難的。
而一家估值 20 億美元的 AI 獨角獸在基礎大模型的競争中找到了一條差異化的路線,成爲大模型創業混戰中的一股清流。
這家獨角獸就是 Cohere,它由《Attention is All You Need》這篇開創性論文最年輕的作者 Aidan Gomez 與他的兩位多倫多大學校友 Ivan Zhang 和 Nick Frosst 聯合創立。
Cohere 近期獲得了 2.7 億美元的 C 輪融資,累計融資額超過 4.3 億美元,估值超過 21 億美元。它的投資者名單中包括 Salesforce、NVIDIA、Oracle 這樣的企業巨頭,Tiger Global 和 Index Ventures 等頂級投資機構,以及 Geoffrey Hinton(深度學習三巨頭,圖靈獎獲得者)、李飛飛等知名 AI 大牛。它的合作者還包括 Amazon、麥肯錫等。
爲何說 Cohere 是大模型創業混戰中的一股清流?
在産品上,它專注于服務企業級客戶,以強大的大模型 Command 爲基礎,提供企業級别的文字處理,知識問答等功能,并且模型可微調、可定制。此外,它還推出了企業級的知識助手 Coral。
在安全性上,爲了打消企業客戶的疑慮,它的産品可以多雲和本地部署,并且擁有高度的數據隐私性。
在融資策略上,它更傾向于拿與自己産業鏈相關的大企業的錢,借助巨頭的力量發展自己,但是卻不與巨頭綁定(參考 OpenAI 與微軟的關系)。
作爲知名 AI 獨角獸,Cohere 的産品和企業競争優勢已經被研究透徹,我們嘗試從創業者角度切入,以 Cohere 的兩位創始人 Aidan Gomez 與 Ivan Zhang 的多個訪談爲材料,整理出 Cohere 從 0 到 1 的發展曆程,以及 Aidan 與 Ivan 兩位創業者對企業與 AI 的諸多真知灼見。
注:本文材料來源于 Cohere 的投資人、Madrona 合夥人 Jon Turow,Weights&Bias 的創始人 Lukas Biewald,知名媒體人 Steven Marsh 與 Cohere 的兩位聯合創始人 Aidan Gomez 及 Ivan Zhang 的對談。
20 歲的少年參與了開創生成式 AI 時代的重要論文
Aidan Gomez 是大語言模型領域開創性論文《Attention is All You Need》最年輕的作者。當時他從多倫多大學去 Google Brain 實習,還是大約 19 或 20 歲的本科生,這是他在美國科技界的第一次經曆。
Aidan Gomez 在多倫多大學
他在谷歌的實習導師是 Lukasz Kaiser,也是《Attention is All You Need》的主要作者之一。當時他們一起打造了一個訓練大型神經網絡的軟件平台 Tensor,同時他們也在訓練一個 AI 模型。他們的想法是,訓練一個能從數據集中學會做許多事情的巨大 AI 模型,訓練它要用到多種模态的數據集,包括圖片、文本、甚至視頻。
當時 Aidan 和 Noam Shazeer(也是 Transformer 的論文作者)是 " 同桌 ",Noam 也在研究大語言模型,隻是他研究的算法是 RNN(循環神經網絡)。Noam 的目标是找到一種比 RNN 更簡單、更精煉、更具可擴展性的新架構。
于是 Lukasz、Aidan 與 Noam 一拍即合,打算一起做這項研究,這時他們又發現 Google Brain 的 translate 組的 Niki Parmar, Jakob Uszkoreit, Ashish Vaswani 與自己有相近的想法,兩個小組合并後,大家齊心協力地研究,最後那篇《Attention is All You Need》就誕生了。
論文的投稿是在一個淩晨,當時辦公室隻有 Aidan 和 Ashish 兩個人。稿子投出去後,他們就沉浸在了興奮中。Ashish 已經預見到這篇論文可能産生巨大的影響,而年輕的 Aidan 還是第一次投稿重要論文,還不知道這篇論文的重要性。就像他接受紐約客專欄作家 Steven Marsh 訪談時說的那樣:" 我不認爲任何人預見到了它在未來會變成什麽樣。 "
而他真正對 Transformer 模型的實際影響感到震撼,是在實習結束回到多倫多大學以後。
" 當時,我在多倫多大學進行夏季研究,然後收到了 Lukasz 的郵件,主題是《看看這個》。郵件内容是一個關于日本朋克搖滾樂隊的故事,故事記載了他們怎麽組隊,怎麽發專輯,然後又遺憾解散的過程。在郵件的最後,Lukasz 寫道:‘我輸入的唯一的詞是 transformer,模型自動生成了故事。’
看了這篇機器生成的文本,我覺得這會掀起一場産品革命。因爲這是第一次,一個非人類的系統以一種像我們人類一樣引人入勝的方式使用語言。" Aidan 對 Steven Marsh 說。
大模型的進化樹
當《Attention is All You Need》和 Transformer 誕生之後,這個創新的模型迅速被 AI 社區采納,成爲了新的技術标準。它在 AI 研究者中間掀起了熱潮,不斷有基于 Transformer 的強大模型出現,例如 BERT,例如 GPT。而在 2022 年底,ChatGPT 正式打開了生成式 AI 的熱潮。
喜歡玩技術的華人創業者與天才少年聯合創立 Cohere
Cohere 的聯合創始人 Ivan Zhang 是一個非典型 AI 研究者,但卻是一個典型的創業者。他與 Aidan 是多倫多大學的校友,後來辍學與 Aidan 一起創業。" 我是一個創造者,我不太喜歡坐在教室裏單純地吸收大量信息,我需要親自動手,邊‘玩技術’邊學習,這是我最好的學習方式。" 他這麽向 Cohere 的投資人 Jon Turow 介紹自己。
Cohere 的聯合創始人 Ivan Zhang
從研究者到創業者,從 ToC 轉型 ToB
2017 年,從多倫多大學辍學後,Ivan 在一家創業公司做後端工程師,他正是在這時認識了 Aidan Gomez。當時 Aidan 想做一個獨立的 AI 研究小組,進行興趣主導的 AI 研究,驗證自己的創新想法,于是他們一起做了 FOR.ai 。現在這個組織仍在運行,叫做 Cohere For AI,由多位 AI 領域的研究科學家組成,主要做 AI 的基礎研究。
2019 年,Ivan 向 Aidan 提議:" 我們爲什麽不一起做一些新東西?",于是他們從 FOR.ai 獨立出來,開始進行更正式的創業。在這個階段,他們已經有了創業經驗,懂得一個組織正确的運行方式,也認識了不少 AI 領域的創始人。
在 Cohere 的創業初期,他們的第一個想法是打造一個 AI 基礎平台,讓開發者上傳 AI 模型,然後平台會壓縮模型的尺寸,使模型更高效。但是在那個時間點,生成式 AI 的熱潮并沒有到來,這個市場還太小。
作爲論文作者的 Aidan 觀察到 Transformer 模型在 AI 社區内的蓬勃發展,看到它解決了各種各樣和文本處理相關的問題,看到了開發者們對這個架構的改進。正好那時 OpenAI 的 GPT-2 發布,Transformer 模型的參數突破 10 億,這也讓 Aidan 進一步意識到了模型規模的重要性,以及這個模型架構真正的潛力。
于是,幾位創始人将 Cohere 的方向從一個模型壓縮平台,往基礎大模型及服務轉型。
" 當體驗了 GPT-2 後,我們發現它很酷,但是我們還不确定可以用 GPT 這類的 AI 基礎模型搭建什麽服務。我們先嘗試做了 Cohere 的第一個項目,它是一個文本自動完成工具,形式是 Chrome 浏覽器的擴展。用戶隻要在文本框中輸入一段文字,它可以自動續寫完成。我們最初打算利用廣告來賺錢。(注:這是一個 ToC 的商業模式)。但是我們顯然低估了打造消費者産品的難度,這個産品的體驗并不好,也沒有獲得很多用戶,我們明白自己在這個方向沒有競争優勢。
于是我們決定拆除前端的界面,隻提供後端的模型的能力,從 ToC 轉向 ToB,做企業級的 API 服務。當時,99% 的 NLP 用例需要單詞嵌入,也需要對模型進行微調,所以我們在幾個月内,打造了一個帶有 AI 生成能力,并可以對模型進行嵌入和微調的 API 平台。" Ivan 向 Jon Turow 分享 Cohere 轉型背後的思考。
對于 Cohere 爲什麽轉向 ToB,以及公司使命的内核,Aidan Gomez 進行了清晰的表述:" 我們就是想讓 AI 大模型被更多人使用。當時,開發者和企業想要利用 AI 大模型的能力,無論是技術還是算力上都面臨很多阻礙。我們存在的意義就是消除人們使用 AI 大模型的障礙,讓不熟悉 AI 的開發者,以及普通的企業,都能方便地使用 AI 的能力。
因爲生成式 AI 特有的對話式互動對于終端用戶來說是最好的體驗。以我自己爲例,當我想開一個銀行賬戶時,如果一家銀行能有一個 24 小時與我對話互動、并且高效解決問題的移動 App,那會對我吸引力大增。
Cohere 就是要做到這一點,幫助所有類型的企業和組織用上生成式 AI 的力量,增強他們的競争優勢。
Cohere 允許企業客戶用自己的數據微調模型
企業在采用 AI 能力時,還會對兩個問題産生疑問,就是模型的托管和數據的隐私。我們是支持多雲托管的,企業可以選擇适合自己的雲服務,也可以在本地的服務器中部署。我們也十分重視數據隐私,當企業用自己的數據進行模型微調時,無論是部署在雲中,還是部署在本地服務器,我們都不會看到他們的數據,這是我們的一個核心特性。"
不拘一格的人才策略,塑造了 Cohere 的高創造力
Cohere 能夠在早期迅速轉向,找到自己正确的位置,離不開 Ivan 和 Aidan 從 FOR.ai 開始積累的人才觀和創業哲學。Ivan 在與 Jon Turow 對談時分享了他們的人才招聘哲學和創業文化:" 我們的招聘方式與衆不同。在 FOR.ai 創業的時候,我們就确立了一個原則:我們尋找的是來自不同背景,但是對 AI 非常感興趣并希望産生巨大影響的人。
你不需要具有在 Meta AI,DeepMind 或 Google 工作過的完美背景,但是一定要對自己專注的領域有非常高的興趣和熱情。而且你不光會寫論文,還要有實際動手的能力。我們把這種招聘方式帶到了 Cohere,構建了非常強大的早期團隊。
在公司文化上,我們喜歡在技術方面進行很多探索,‘玩技術’,然後獲得突破。雖然我們都會寫論文,但不是‘書呆子’,我們對自己應該要做什麽非常清楚,而且會花很多的時間在工程實踐而不僅是算法探索上,這讓我們打造的産品能夠真正爲人們帶來價值。"
現在 OpenAI 占據了生成式 AI 的 C 位,那麽已經擁有數億活躍用戶的 ChatGPT,會不會幫助 OpenAI 進行壟斷,其他的公司是否還有機會?Aidan Gomez 有自己的看法:" 我絕不認爲大模型領域會形成壟斷。我認爲每個公司都有自己的風格、方向和自己的優勢,在市場上都會找到自己的位置。消費者和企業客戶會選擇他們認爲最好的夥伴,最值得信任的公司,以及最能幫他們成功的平台。
對于 Cohere 這樣的基礎模型公司,我們面對的最終狀态,很可能不是赢家通吃,而是一個多元化的市場格局。我們會有憑借自己的優勢去赢得自己比賽的勝利。我們會用各種方法幫助客戶,讓他們用上最好的 AI 能力。我們的焦點是讓 AI 模型通過提示,微調在内的各種方法,幫助特定客戶,獲得最大的價值。"
AI 會帶來哪些風險,它未來最大的機會是什麽?
生成式 AI 的爆發,在受到歡迎的同時,也引發了不少擔憂。在公衆層面,人們擔憂 AI 是否會發展太快,能力太強,從而 " 搶奪 " 人類的工作機會;在現實的使用層面,則有不少人擔憂 AI 模型的安全性和可控性。
對此話題,Aidan Gomez 和 Ivan Zhang 也發表了自己的看法。
AI 可能 " 污染 " 社交媒體
Aidan Gomez 的觀點更偏向社會性,他表示,AI 生成的内容對社交媒體的 " 污染 " 值得擔憂:" 與其擔憂非人類智慧代替人類這類可能還有很多年才會發生的事,我們更應該關注當前的現實風險。
例如,非常有可能有 AI 生成數百萬個機器人,無縫地進入我們的社交媒體和公共對話,然後推動某一個觀點(無論這個觀點是有益的,還是有害的)。這可能會在一些能對社會産生重大影響的公共議題上産生無法預料的影響。
所以我們必須權衡這個事情的風險,最好有具體的政策來減輕這種風險。例如,人們有權知道,我們正在閱讀的媒體内容或者營銷内容,到底是人類創作的還是機器合成的。"
而 Ivan Zhang 的觀點則相對現實,他認爲 AI 面臨兩大挑戰:" 對于 AI 面臨的挑戰,我們從客戶中獲取的信息首先是怎麽評估生成式 AI 模型的能力。要準确地比較兩個 AI 模型的能力并不容易,而且在文本生成方面,這種比較很可能是主觀的。這對生成式 AI 在商業方面的采用會産生一定的阻礙。
另一個挑戰就是數據隐私問題,在使用開源或閉源的大模型進行商用時,你有時候會使用一些敏感的數據,這又會産生合規的問題。比如用 AI 輔助你寫作一封敏感的電子郵件時,你是不是會擔心自己輸進模型的敏感數據被濫用?當然,這種擔心成爲了我們的機會,我們正在與 Oracle 合作解決這個問題。"
具身智能未來是 AI 的大機會
Aidan Gomez 和 Ivan Zhang 既是 AI 專家,也是企業家,對于 AI 在未來有哪些新的方向和機會,他們的觀點也值得關注。
首先,他們在不同的場合都提到了同一個技術,那就是具身智能,也就是将生成式 AI 的能力注入到有形的機器中。
Aidan 這麽對 Lukas Biewald 表述:" 我認爲将生成式 AI 用到機器人技術和實體化方面真的太酷了,而且這個方向有非常強烈的需求。我們都想象過機器人具有高智能和靈活的身體會怎麽樣——它一定會産生巨大的變革。但是這個方向确實還有很長的路要走,我也希望自己在這個方向産生影響,并試着去做一些相關的事情。"
Ivan 也認爲具身智能絕對是 AI 下一階段的大機會:" 我認爲最大的機會是能影響實體的‘行動模型’,将 AI 與工程及實體的産品結合起來,将會非常令人興奮,也一定會有不少企業對它們感興趣。但是,這項技術要走向實體化,模型的準确性還需要進一步的提高。"
此外,Aidan 也對 AI 的智能發展和未來應用做了更長遠的想象:" 現在 AI 模型的構建依賴于人類,爲了讓 AI 更加智能,我們會用人類的各種高階知識來訓練它。打個比方,就像讓一個非常聰明的人,去教一個還不那麽聰明的 AI。那麽未來如果 AI 模型變得非常聰明,人類的知識已經被他全部學會了,就會面臨一個臨界點——人類已經沒什麽能教給 AI 了。
我最感興趣的是,如果 AI 突破了這個臨界點,會發生什麽?如果一群已經學完了人類已有知識的 AI 在一起交談、探索、學習,會不會産生新的知識?
也許當這個時候來臨,我們人類會向 AI 學習新知識,AI 會帶着人類一起在新的知識海洋裏遨遊。"