圖片來源 @視覺中國
文 | 适道
本期内容摘要
1. 早期找到 AI 投資的錨點
2. 投資向量數據庫 Weaviate
3. 垂直整合投資
ChatGPT 的橫空出世,讓創投界燃起對 AI 領域的投資熱情。
但不同于互聯網時代的流量模式,作爲前沿科技,AI 領域投入大、周期長、競争者衆多。
AI 投資難免出現 " 雷聲大雨點小 " 的現象。CB Insights 數據顯示,今年第二季度,全球 AI 領域投資總額環比暴減 38%。
即便如此,在每個行業都将被 AI 革命的當下,不可否認,AI 一定是未來幾年最大的産業趨勢。創業投資數據庫 Carta 報告顯示,和其他類别的初創公司相比,AI 初創公司的估值和融資規模擁有更好的增長趨勢。
投資人如何在發展早期找到 AI 投資的錨點,尤爲關鍵。或許我們可以學習老牌風投公司的做法。
01 早期找到 AI 投資的錨點
Index Ventures(簡稱 Index)是一家歐洲老牌的風險投資公司,成立于 1996 年。一直以來,Index 都是 AI 的忠實信仰者和倡導者。
在 ChatGPT 發布的一年前,Index 領投了 Cohere 的 4000 萬美元 A 輪融資,目前 Cohere 已經是估值 20 億美金的 AI 獨角獸。(關于 Cohere 是誰,可以參考我們的上一篇文章最年少 Transformer 論文作者如何與非典型華人創業者聯合打造 20 億美元的 AI 獨角獸?|獨角獸真探)
此外,在 ChatGPT 将 AI 主流化的前幾年,Index 已經開始對舊金山的自動駕駛技術公司 Aurora;紐約的機器學習平台 Arthur AI 等人工智能公司進行投資。
前段時間,Index 的合夥人 Erin Price-Wright 領投了 Weaviate,這是一家開源向量數據庫公司。該公司在今年 4 月份以 2 億美元的估值籌集了 5000 萬美元的 B 輪融資,除了 Index,NEA、Cortical Ventures、Zetta Venture Partners 和 ING Ventures 也加入了這一輪融資。
那麽,Index 爲何将眼光投向了向量數據庫?适道(ID:survivalbiz)找到了 Index 合夥人 Erin Price-Wright 女士近期的訪談文章《Here ’ s How Index Ventures Is Investing In An Era Where ‘ Every Company Will Have AI ’》,下面是文章的翻譯簡寫和補充。
02 投資向量數據庫 Weaviate
首先,對于 ChatGPT,Price-Wright 沒有給出高度評價,她認爲 ChatGPT 隻是在走捷徑,畢竟這項技術已經存在了幾年,不是什麽新鮮事。ChatGPT 之所以走紅,是因爲 " 突然之間,它被每個人看到了,每個人能真切地感受到它作爲一個消費品 "。
那麽,真正具備價值的是什麽?
從采訪來看,Price-Wright 給出的答案包括支撐 ChatGPT 的向量數據庫。
目前的大語言模型主要基于深度學習技術。深度學習需要輸入文本,圖片,視頻等語料數據。但這些語料數據需要轉化爲向量數據,才能被神經網絡使用。而向量數據庫,是用來存儲和查詢向量數據的數據庫。
爲解釋向量數據庫的作用,我們假設一個場景。圖書館一般按類型和作者排列書籍,例如文學類、經濟類等等。但如果你想找一本小時候看過的恐怖故事,隻記得裏面有稻草人變成活人的情節,不記得書名和作者時,你該怎麽做?
如果你沒時間翻找書架,最快的方法是問圖書管理員,因爲他們讀過很多書,更可能知道哪本書是你要找的。
那麽,圖書管理員就是一個向量數據庫,因爲向量數據庫旨在存儲關于對象 ( 例如書籍 ) 的複雜信息 ( 例如書籍的情節 ) 。因此,向量數據庫可以幫助你根據特定的查詢 ( 例如,一本關于…的書 ) 而不是一些預定義的屬性 ( 例如,作者 ) 來查找對象,就像圖書管理員一樣。
例如,讓 ChatGPT 用莎士比亞的語氣生成一段詩句,ChatGPT 先會通過向量數據庫的相似搜索功能,才能增強内容輸出的準确性。
因此,訓練大模型時,向量數據庫可以成爲一個知識庫,給大模型提供最新數據、每個客戶企業獨有的内部知識庫。
Price-Wright 表示,在尋找這個投資機會(投資 Weaviate)前,Index 花了近兩年的時間研究向量數據庫。" 而真正讓我們下定決心的事件是 ChatGPT,它讓我們真正理解了向量數據庫在更多生成式 AI 工作流中的價值,以及真正理解嵌入算法的重要性。"
公司在思考中得出了兩個結果。
1、當你考慮了所有這些不同類型的生成式 AI 用例,會發現實際市場比單獨的企業搜索市場要大得多。(the market was actually way bigger than the market for enterprise search alone, if you ’ re thinking about all of these different types of generative AI use cases.)
2、擁有一個專用數據庫的價值,它可以非常接近嵌入算法。讓你成爲其産品的一等公民,而不是現有數據庫的附加産品。(the value of having a dedicated database that could get really close to the embedding algorithms as a first-class citizen within its product, versus a bolt-on for an existing database.)
Price-Wright 認爲:" 在接下來的十年中,已擁有大量數據集、大量客戶群和複雜運營的企業會開始将 AI 融入到他們的産品中,讓運營更高效、流程更精簡、決策更快更靈活。我們将看到 AI 成爲企業新型搜索的一個大的推動者,将數據編碼成向量,并使用 AI 尋找相似的信息。對于很多用例來說,這比關鍵詞搜索更加強大。"
那麽,讓 Index 青睐有加的 Weaviate 又有哪些優勢?
Weaviate 首席執行官兼聯合創始人 Bob van Luijt 表示:" 作爲一個開源産品,Weaviate 向量數據庫被用作 AI 原生生态系統的核心基礎設施。它允許從初創公司到企業的用戶創建新一波應用程序,範圍從定制的搜索和推薦系統到 ChatGPT 插件。"
另外,Weaviate 向量數據庫簡化了 AI 開發人員的向量數據管理,解決了生成、存儲和搜索嵌入向量及其相應對象的難題,具有如下功能:
1、可擴展的内置機器學習(ML)模塊:隻需加載和搜索;Weaviate 負責機器學習(ML)的繁重工作——任何數據類型、任何模型、任何用例。
2、更豐富的向量搜索:支持各種 ML 搜索,還可以搜索向量和生成向量的源對象。
3、高性能:亞秒搜索,可擴展到數十億個對象,不間斷運行。
Price-Wright 也曾在另一篇采訪中表示:" 企業和人工智能原生初創公司使用 Weaviate 開發多模式搜索、推薦和生成應用程序的速度令人難以置信。這是開發人員使用人工智能構建的最佳産品,我們很高興能與他們合作,幫助推動下一階段的增長。"
03 垂直整合投資
除了投資向量數據庫,Index 還在 AI 投資領域做了哪些動作?
如同 SaaS 随着雲計算的興起而出現一樣,基于 AI 原生的産品也正在帶來新的商業模式。
Index 認爲:第一,在十年内,AI 将成爲每一個應用軟件的核心組件;第二,這一波浪潮将由廣泛采用的基礎模型(foundation models)來推動。
" 我們并不确切地知道這些新的商業模式将會是什麽,但是我們對軟件價值鏈如何變化有一些想法,并且開始看到了新模式出現的早期迹象。"
在應用層,Index 認爲,随着時間的推移,商業模式将轉變爲通過 AI 來解鎖更多針對客戶的價值。用戶不再簡單地爲使用 SaaS 付費,而是根據産品内的定制或個性化程度付費,例如針對行業、組織甚至個人進行微調的模型。
基于此,Index 投資了 Gong、DeepScribe 等公司。
2020 年,Index 投資了 Gong,他們的産品可以記錄銷售電話,并允許公司管理者來以此分析業績,發現客戶反饋的趨勢,幫助培訓和指導銷售代表。當一個組織廣泛采用該産品時,Gong 就會沉澱他們與客戶對話産生的大量數據集。這反過來幫助 Gong 更好地定制産品,以高度個性化的方式服務于特定企業,從而改善用戶體驗。
2022 年,Index 領導了 DeepScribe 的 A 輪融資。DeepScribe 的産品可以記錄醫患對話,并使用 AI 爲電子健康記錄生成結構化的醫生報告。通過持續使用可以增加産品對特定用戶 ( 例如,具有特定風格的醫生 ) 或一組用戶 ( 例如,特定專業的醫生或遵循一緻标準的特定醫院集團内的醫生 ) 的價值。
在這兩種情況下,随着産品被持續使用,用戶将更多自己的數據放入産品中,AI 也能夠以高度定制化的方式進行改進。
Index 認爲,這是 AI 原生(AI-native)公司建立護城河并随着時間推移而持續獲得增長價值的一條途徑。
除此之外,Index 投資了 Hebbia,該産品可以用 AI 快速準确地爲金融服務行業提供信息。Index 還投資了 Notion,這是一家擁有強大工作流和用戶體驗的公司,該公司目前緻力将 AI 無縫融入到用戶使用中。
Price-Wright 說:" 當我談論 AI 是令人興奮的,因爲它是一種新的促成技術(Enabling technology)。AI 無處不在,并正成爲每一款軟件的心髒起搏器。"