最近幾個月來,似乎每個人都在日常生活中跟 ChatGPT、Bard 等 AI 機器人聊得熱火朝天,讓它們來幫忙寫郵件、寫總結、做計劃。但有個普遍的現象是,一旦當人們切換到工作模式時,這些生成式 AI 工具便很少出現在大家的工作流程中,甚至被一些公司明令禁止。
AI 能力如此強大,爲什麽企業們不用?
這背後的核心原因其實很簡單——每個企業的數據安全和隐私問題都太重要。沒有企業敢把自己的 " 命脈 " 完完全全地交在還并未發展成熟、并由其他大型公司掌控的 AI 手上。
那麽,是否有辦法解決這個棘手的問題,進而在企業端最大化地發掘生成式 AI 的潛力呢?其實從 2019 年開始,就有一家名爲 Cohere 的 AI 創業公司在密切關注這個問題并不斷提出解決方案。
長期以來,企業級的生成式 AI 都是一個相對小衆且壁壘較高的市場,但 Cohere 憑借着成熟的技術和敏銳的嗅覺得到了一衆大佬和巨頭的支持。目前Cohere 的投資者不僅包括英偉達、甲骨文、Salesforce 等巨頭,同時還有圖靈獎得主 Geoffrey Hinton、斯坦福 AI 教授李飛飛等一衆圈内大佬。不久前,YouTube 的前首席财務官 Martin Kon 也選擇加入 Cohere 擔任總裁和首席運營官。
英偉達、甲骨文和 Salesforce 都在押注 Cohere,圖片來自 Crunchbase
乘着 ChatGPT 爆火的東風,今年以來,Cohere 的潛力開始被越來越多的人的看到并進入了估值飙升的快車道,目前已成爲全球 AIGC 賽道僅次于 OpenAI 和 Antropic 的第三大獨角獸。
從谷歌 " 脫胎 ",來自加拿大頂級 AI 圈
Cohere 成立于加拿大多倫多,于 2019 年由 Aidan Gomez、Ivan Zhang 和 Nick Frosst 共同創立。三人本科都就讀于多倫多大學計算機科學專業,按照入學時間推算,三人目前應該都未超過 30 歲。
Cohere 的創始團隊,圖片來自 Cohere 官網
其中,Aidan Gomez在 2017 年本科期間就參與了由谷歌大腦團隊研究并作爲署名者之一發表了名爲《Attention is All You Need》的論文,而這篇論文就是日後大名鼎鼎的 Transformer 機器學習架構的開端,也是發展谷歌 BERT、OpenAI 的 GPT 等未來革命性架構的基石。
在同一年,Aidan Gomez 和同系的同學 Ivan Zhang 創立了一個非營利人工智能研究社區 For.ai,用以支持和鏈接世界各地的人工智能獨立研究者。
本科畢業後,Aidan Gomez 前往牛津大學攻讀計算機科學的博士學位,同時也加入了由 " 深度學習之父 "、圖靈獎獲得者 Geoffrey Hinton 領導的谷歌 AI 團隊,基于 Transformer 架構進行進一步研究。在谷歌大腦的 Hinton 團隊之中,Aidan Gomez 結識了一直從事機器學習和認知科學研究的 Nick Frosst。
在之後兩年中,通過研究的深入,大家了解到 Transformer 可以擴展爲性能出色的大型神經網絡,并在語言相關的任務上表現十分出色。包括 Aidan Gomez 在内的一些 Transformer 論文撰寫者們都開始思考這背後所蘊藏的商業化機會,目前除了 Llion Jones 仍在谷歌工作,其他七位作者都紛紛 " 下海 " 創業。
其中,Aidan Comez 則與 Nick Frosst 和 Ivan Zhang 共同創立了 Cohere。跟谷歌、微軟等實力雄厚公司去重金訓練大模型不同,在 2019 年 Cohere 成立開始,他們就專注于企業用例,試圖根據不同企業的專有數據去創建定制化的大語言模型。
不靠雲,要做企業定制生成式 AI 服務
簡單來說,Cohere 的目标是要成爲各類開發人員的默認 NLP 工具包,讓各類開發人員都可以使用大型神經網絡和最先進 AI 來解決任何語言相關問題,但卻不依托于任何公共雲,讓模型能在私有雲或本地部署中運行。
目前,Cohere 的主要産品主要圍繞着企業日常運營中的三個關鍵領域:文本生成、文本分類和文本檢索,幾乎覆蓋了企業生産中所有跟文字有關的領域。
文本生成部分主要有 Summarize、Generate、Command Model 三個産品。Summarize 是一個由大型語言模型驅動的文本摘要生成器,能快速概述和總結文檔的關鍵點,可以支持輸入 10 萬個字符和文本格式選項。Generate 則是一個内容生成器,可以爲各種目生成獨特的内容,比如電子郵件和産品描述等。
下面,再重點介紹一下 Command Model。Command 是 Cohere 推出的一個能夠接受用戶個性化命令訓練的文本生成模型。也就是說,企業用戶在将自己的數據和 Command 結合之後,就可以産生一個自己獨有的語言模型,能夠在企業的實際業務中立即發揮作用。
Command Model,圖片來自 Cohere
值得注意的是,作爲一個隻有 520 億個參數的模型,Command 的準确性表現此前卻超過了其他更大規模訓練的模型,在不久前被斯坦福大學的語言模型全面評估(HELM)評爲世界上最有能力的大型語言模型。
圖片截自斯坦福大學的語言模型全面評估(HELM)官網
文本檢索部分,包括 Embed、Semantic Search、Rerank 三個産品。
對于希望構建自己的文本分析應用程序的機器學習團隊,Embed 可以幫助他們快速發現趨勢,并支持 100 多種語言。Semantic Search 是一個強大的搜索工具,用戶隻需要簡單使用 API,就可以使用該搜索功能,能夠支持基于查詢的含義而不僅僅是關鍵詞來返回多種信息,并且不受語言的限制。Rerank 可以基于語義相關性分析現有工具的搜索結果并進行排名,從而提供更豐富、更相關的結果,且對用戶的幹預或編程經驗要求很小。
文本分類部分主要産品爲 Classify,該功能使用戶能夠個性化的組織信息來幫助内容審核、用戶分析和進行聊天機器人體驗。比如它能夠通過快速标記不同類别的客戶來進行高效的客戶服務,也可以識别正面和負面的社交媒體評論來更好地了解客戶的反饋等。
圖片來自 Cohere
Cohere 的商業模式是先承擔創建大型的 Transformer 神經網絡的成本,然後再将有需求公司連接到這些網絡,公司則按使用情況進行付費。Cohere 的主要特點是爲客戶提供了包括私有雲、本地部署、Cohere 托管雲和其他雲夥伴 AWS、谷歌等多種數據托管選項,讓用戶根據自身需要進行選擇,讓客戶對數據擁有控制權。
對于希望學習原型設計并成爲社區一部分的開發者,Cohere 提供了免費的、限制使用率的使用。然而,如果希望進入生産、訓練自定義模型、訪問所有端點并接收增強的客戶支持,将需要支付費用。目前 Cohere 的客戶包括 Spotify、Jasper、HyperWrite 等。
從價格來看,嵌入功能下,默認模型每 100 萬個 Token 40 美分,企業自定義的模型 80 美分,生成功能下,默認模型每 100 萬個 Token 15 美元,自定義模型 30 美元,總結功能下,每 100 萬個 Token15 美元等。
Cohere 不同功能的價格情況,圖片來自 Cohere
不過,此前 Cohere 的這個定價還算很有優勢,但在昨天 OpenAI 大降價之後,預計也會給 Cohere 帶來不小的沖擊。比如 OpenAI 的嵌入模型價格直接跳水 75%,每千 token 隻需 0.0001 美金,也就是 1 美元一千萬 token,遠遠低于 Cohere。
大佬和巨頭力挺,Cohere 駛入 AIGC 第一陣營
瞄準企業級 AI 數據安全痛點的 Cohere,在當前的 AI 用戶端厮殺中脫穎而出,包括 VC、科技巨頭和人工智能領域的大佬們都給它投去了支持票。2021 年正式邁入商業化以來,Cohere 的估值也節節攀升,目前已達到約 22 億美元,在 AIGC 賽道僅次于微軟支持的 OpenAI 和谷歌支持的Anthropic。
在 Cohere 成立之初,它的人工智能學術色彩似乎更爲濃郁。在 2021 年和 2022 年的 Cohere A 輪和 B 輪融資中,當時的 AIGC 賽道的投資還在寒冬中,有誰給 Cohere 投去了支持資金呢?在這兩輪的投資列表中,我們都看到了以下幾位 AI 大佬的身影。
圖片來自 Crunchbase
除了幾個創始人在多倫多直接跟随學習過的 " 深度學習之父 "、圖靈獎得主 Geoffrey Hinton 之外,還包括斯坦福大學教授、視覺實驗室負責人李飛飛,加州大學伯克利分校教授、伯克利人工智能實驗室主任 Pieter Abbeel,多倫多大學教授、前 Uber 人駕駛汽車技術研究中心主任 Raquel Urtasun,個個都是人工智能領域的學術大咖。
而在本月初宣布的最新一輪融資中,在 AIGC 的熱潮中,Cohere 也得到了更多領域内科技公司的關注。其中包括人工智能最強 " 軍火商 " 英偉達以及雲巨頭 Salesforce 和甲骨文。目前的融資總額已經達到 4.39 億美元。
Cohere 的迅速發展離不開深厚的技術背景和賽道選擇。從大模型的角度來說,Cohere 目前可能并不是市場上最領先的,但他們敏銳地抓到了 AIGC 企業端應用的痛點,能夠在首先滿足企業安全性需求的前提下,再進一步的提供内容生成、摘要、搜索等領域的服務。
他們的商業模式使得大量公司能夠在無需斥重金構建自己模型的情況下自定義地接入大型神經網絡,并通過細分業務模塊,讓公司能根據使用情況來進行付費,從而達到一種雙赢的狀态。
從目前 Cohere 越來越高的熱度和 OpenAI 最近大規模的降價和 API 升級來看,AIGC 的戰火在用戶端正在一路蔓延到企業戰場。而屆時,或許一場真正的 AI 生産力革命才會真正開始。
面對當前的 AIGC 熱潮,矽星人最近将重磅開啓 " 全球 AIGC 獨角獸解讀 " 系列合集文章,帶領大家一一走進當前全球最新誕生的生成式人工智能獨角獸,深入解讀它們誕生背後的創業團隊、技術應用、商業模式和融資情況。
針對 AIGC 技術的發展,我們希望通過對獨角獸公司們的解讀爲大家提供一個更加市場化的視角,幫助了解 AIGC 技術正在如何發展以及如何進行商業化落地轉化,爲未來技術的創新和應用提供啓示。無論你是技術從業者、投資人、創業者還是對人工智能感興趣的普通讀者,相信這個系列的解讀文章都将爲您帶來一些收獲和靈感啓發,歡迎大家持續關注矽星人!
* 參考資料:
注:封面圖來自于 Cohere,版權屬于原作者。如果不同意使用,請盡快聯系我們,我們會立即删除。