編者按:
本文原作者是紅杉的兩位合夥人 Sonya Huang 和 Pat Grady,以及 GPT-4。
文章回顧了過去一年以來生成式 AI 的發展态勢,同時提出了這樣一個觀點:生成式 AI 正在從 " 第一幕 " 走向 " 第二幕 ","炒作和快速展示正在爲真正的價值和完整的産品體驗所取代"。爲此,他們更新了生成式 AI 市場圖。
以下全文翻譯轉載自深思圈。
一年前,我們發布了一個假設,即生成式 AI 将成爲技術領域一個深遠的平台轉變,然後,風暴來臨。
科學家、曆史學家和經濟學家長久以來都在研究創新的寒武紀大爆發的最佳條件。在生成式 AI 中,我們已經達到了一個現代的奇迹,我們這一代的太空競賽。
這一時刻已經醞釀了幾十年,摩爾定律的六十年爲我們提供了處理浮點數據的計算能力,四十年的互聯網爲我們提供了數萬億 token 的訓練數據,移動和雲計算的二十年讓每個人的手掌中都有一台超級計算機。換句話說,數十年的技術進步爲生成式 AI 的起飛創造了必要的條件。
ChatGPT 的崛起成爲點燃導火線的火花,釋放出我們多年未見的創新密度和熱情——可能自互聯網初期以來。在 " 腦力谷 " 中,人們尤其是激動,AI 研究者達到了搖滾明星的地位,每個周末黑客馬拉松的房子都擠滿了新的 Agent 和陪伴聊天機器人。AI 研究者從車庫裏的 " 黑客 " 變成了指揮數十億美元計算的特種部隊。arXiv 的論文如此多産,以至于研究者們開玩笑要求暫停新的出版物,以便他們能趕上。
但很快,AI 的興奮變成了近乎歇斯底裏。突然,每家公司都成了 "AI 副駕駛(Copilot)"。我們的收件箱被 "AI Salesforce"、"AI Adobe" 和 "AI Instagram" 的無差别宣傳充滿。1 億美元的種子輪又回來了。我們發現自己處于一個不可持續的融資、人才戰和 GPU 采購的瘋狂。
果然,裂痕開始顯現。藝術家、作家和歌手挑戰機器生成的 IP 的合法性,關于倫理、監管和即将到來的超級智能的辯論充斥了華盛頓。更令人擔憂的是,矽谷開始有傳言稱生成式 AI 實際上并不有用。産品遠遠低于預期,這可以通過糟糕的用戶留存率來證明。對許多應用的最終用戶需求開始達到高潮,這隻是另一個蒸汽泡沫周期嗎?
對 AI 的不滿之夏使批評者歡欣鼓舞地跳舞,讓人想起互聯網的初期,那時在 1998 年,一位著名的經濟學家宣稱:" 到 2005 年,将變得清晰,互聯網對經濟的影響不會超過傳真機。"
毫無疑問——盡管有噪音、歇斯底裏和不确定性及不滿的氛圍,生成式 AI 的起步已經比 SaaS 更加成功,僅從初創公司就獲得了超過 10 億美元的收入(SaaS 市場需要幾年,而不是幾個月,才達到同樣的規模)。
一些應用已經成爲家喻戶曉的名字:ChatGPT 成爲增長最快的應用,尤其在學生和開發者中有很強的産品市場契合度;Midjourney 成爲我們的集體創意缪斯,據報道僅用 11 個團隊就達到了數億美元的收入;Character 推廣了 AI 娛樂和伴侶,并創造了我們最渴望的消費者 " 社交 " 應用——用戶平均在應用中花費兩個小時。
盡管如此,這些成功的早期迹象并沒有改變一個事實,那就是許多 AI 公司根本沒有産品市場契合度(PMF)或可持續的競争優勢,而整個 AI 生态系統的繁榮是不可持續的。
現在塵埃已經稍微落定,我們認爲現在是一個适當的時候來放大和反思生成式 AI ——我們現在所處的位置,以及我們可能的走向。
面向第二階段
生成式 AI 的首年—— " 第一幕 " ——是從技術出發的。我們發現了一個新的 " 錘子 " ——基礎模型,并引發了一波輕量級的新技術演示應用。
我們現在認爲市場正在進入 " 第二幕 " ——這将是從客戶開始的。第二幕将端到端地解決人類問題。這些應用與首批推出的應用在本質上有所不同。它們往往将基礎模型作爲更全面解決方案的一部分,而不是整個解決方案。它們引入了新的編輯界面,使工作流程更加粘性,輸出效果更好。它們往往是多模态的。
市場已經開始從 " 第一幕 " 轉向 " 第二幕 "。進入 " 第二幕 " 的公司的例子包括Harvey,該公司爲頂級律師事務所定制 LLM;Glean,該公司正在爬行和索引我們的工作空間,使生成式 AI 在工作中更加相關;以及Character 和 Ava,它們正在創建數字伴侶。
市場格局
我們更新的生成式 AI 市場圖如下:
與去年的地圖不同,我們選擇按照使用案例而不是模型模态來組織這張地圖。這反映了市場上兩個重要的推動力:生成式 AI 從技術錘子到實際使用案例和價值的演變,以及生成式 AI 應用日益多模态的特性。
此外,我們還加入了一個新的 LLM 開發者棧,反映了公司在生産中構建生成型 AI 應用時轉向的計算和工具供應商。
重新審視我們的觀點
我們去年的文章提出了一個關于生成式 AI 市場機會的論題,以及對市場如何發展的假設。如今一年過去了,來看看我們預測得怎麽樣呢?
以下是我們預測錯的:
事情發展得很快。去年,我們預計還需要近十年的時間擁有實習生級别的代碼生成、好萊塢質量的視頻或不發機械聲的人類質量語音。但聽一聽 Eleven Labs 在 TikTok 上的聲音或 Runway 的 AI 電影節就明白,未來已經以光速到來。甚至 3D 模型、遊戲和音樂都快速變得優秀。
瓶頸在供應端。我們沒有預料到最終用戶的需求會超過 GPU 的供應。許多公司增長的瓶頸很快就不是客戶需求,而是獲取 Nvidia 的最新 GPU。長時間的等待成爲常态,出現了一個簡單的商業模型:支付訂閱費跳過等待隊列并獲得更好的模型。
垂直分離尚未發生。我們仍然相信 " 應用層 " 公司和基礎模型提供商之間會有分離,模型公司專注于規模和研究,應用層公司專注于産品和 UI。實際上,這種分離還沒有幹淨利落地發生。事實上,最初面向用戶的應用中最成功的是垂直整合的。
競争環境殘酷,現有競争者的反應迅速。去年,競争格局中有幾個過于擁擠的類别(尤其是圖像生成和文案寫作),但總體上市場還是一個空白區域。如今,競争格局的許多角落比機會還要競争激烈。從 Google 的 Duet 和 Bard 到 Adobe 的 Firefly,現有競争者迅速的反應——以及他們最終願意承擔 " 風險 " 的意願——加劇了競争的熱度。即使在基礎模型層,我們也看到客戶在不同供應商之間建立自己的基礎設施。
壁壘在客戶中,而不是在數據中。我們預測,最好的生成式 AI 公司可以通過數據飛輪生成可持續的競争優勢:更多使用→更多數據→更好的模型→更多使用。盡管這在某種程度上仍然是對的,特别是在擁有非常專業和難以獲得的數據的領域,但 " 數據壕溝 " 正處于不穩定的地面:應用公司生成的數據并沒有創造一個無法逾越的壕溝,下一代基礎模型很可能會摧毀初創公司生成的任何數據壕溝。相反,工作流和用戶網絡似乎正在創造更持久的競争優勢來源。
以下是我們預測對的:
生成式 AI 是一種事物。突然之間,每個開發者都在研究生成式 AI 應用,每個企業買家都在要求它。市場甚至保留了 " 生成式 AI" 的名稱。人才湧入市場,風險資本也湧入。生成式 AI 甚至成爲了流行文化現象,如 " 哈利 · 波特巴倫西亞加 " 這樣的病毒視頻,或者由 Ghostwriter 創作的模仿德雷克的歌曲 "Heart on My Sleeve",這首歌已經成爲了排行榜上的熱門歌曲。
第一個殺手級應用已經出現。衆所周知,ChatGPT 是最快達到 1 億 MAU 的應用程序——并且在短短 6 周内自然而然地做到了這一點。相比之下,Instagram 花了 2.5 年,WhatsApp 花了 3.5 年,YouTube 和 Facebook 花了 4 年才達到那種用戶需求水平。但 ChatGPT 并不是一個孤立的現象。Character AI 的參與深度(平均每次會話 2 小時)、Github Copilot 的生産力益處(效率提高 55%)以及 Midjourney 的商業化路徑(數億美元的收入)都表明,第一批殺手級應用已經到來。
開發者是關鍵。像 Stripe 或 Unity 這樣以開發者爲中心的公司的核心洞察是,開發者創造了你甚至無法想象的使用案例。在過去的幾個季度裏,我們接到了從音樂生成社區到 AI 紅娘到 AI 客戶支持代理的各種想法。
形态正在發展。AI 應用的第一版大多是自動完成和初稿,但這些形态現在正在變得越來越複雜。Midjourney 引入的攝像機平移和填充是生成式 AI 優先用戶體驗變得更豐富的一個很好的例子。總的來說,形态正在從個體到系統級的生産力,從人在循環中到執行導向的代理系統發展。
版權、倫理和存在的恐懼。這些熱點話題的辯論如火如荼,藝術家、作家和音樂家意見不一,有些創作者正當地憤怒于其他人從衍生作品中獲利,有些創作者則接受了新的 AI 現實(Grimes 的利潤分享提議和 James Buckhouse 對成爲創意基因組的一部分的樂觀态度浮現在腦海中)。沒有初創公司想成爲最終的 Spotify 的 Napster 或 Limewire(感謝 Jason Boehmig)。規則是模糊的:日本已經宣布用于培訓 AI 的内容沒有 IP 權利,而歐洲已經提議下重手進行監管。
我們現在所處的位置?生成式 AI 的價值問題
生成式 AI 并不缺乏使用案例或客戶需求。用戶渴望 AI 能使他們的工作變得更容易,他們的工作産品變得更好,這就是爲什麽他們會以創紀錄的速度湧向各種應用的原因(盡管缺乏自然分布)。
但人們會繼續使用嗎?不一定。下面的圖表比較了 AI 優先應用與現有公司的首月移動應用留存率。
用戶參與度也不佳。一些最好的消費公司有 60-65% 的 DAU/MAU,WhatsApp 的爲 85%。相比之下,生成式 AI 應用的中位數爲 14%(Character 和 "AI 陪伴 " 類别是顯著的例外)。這意味着用戶還沒有在生成式 AI 産品中找到足夠的價值,以至于每天都在使用它們。
簡而言之,生成式 AI 最大的問題不是尋找使用案例、需求或分發,而是證明價值。正如我們的同事 David Cahn 所寫:"2000 億美元的問題是:你打算使用所有這些基礎設施來做什麽?它如何改變人們的生活?"建立持久的業務的路徑将需要解決保留問題,并爲客戶生成足夠深入的價值,使他們堅持并成爲每日活躍用戶。
但我們不應該絕望。生成式 AI 仍處于其 "尴尬的青春期"。有時會有卓越的迹象,當産品沒有達到預期時,失敗通常是可靠的、可重複的且可修複的。我們的工作擺在面前。
第二階段分析
創始人正在進行 prompt 工程、微調和數據集策劃的艱苦工作,以使他們的 AI 産品優秀起來。他們正在逐步地建設,将引人注目的 Demo 演示變成完整的産品體驗。與此同時,基礎模型底層繼續充滿研究和創新。
随着公司找到持久價值的路徑,正在發展一個共享的劇本。我們現在有了共享的技術來使模型變得有用,以及将塑造生成式 AI 第二幕的新興 UI 範式。
模型開發棧
新興的推理技術,如連鎖思考、樹狀思考和反射,正在提高模型執行更豐富、更複雜的推理任務的能力,從而縮小了客戶期望與模型能力之間的差距。開發者使用像 Langchain 這樣的框架來調用和調試更複雜的多鏈序列。
檢索增強生成(RAG)正在引入關于業務或用戶的上下文,減少幻覺并增加真實性和實用性。像 Pinecone 這樣的公司的向量數據庫已成爲 RAG 的基礎設施支柱。
新的開發者工具和應用框架爲公司提供了可重用的構建塊,以創建更先進的 AI 應用,并幫助開發者評估、改進和監控生産中的 AI 模型的性能,包括像 Langsmith 和 Weights & Biases 這樣的 LLMOps 工具。
像 Coreweave、Lambda Labs、Foundry、Replicate 和 Modal 這樣的 AI-first 基礎設施公司正在解除公共雲的捆綁,并提供 AI 公司最需要的東西:大量的 GPU 以合理的成本、按需可用和高度可擴展,以及一個不錯的 PaaS 開發者體驗。
這些技術應該能夠在基礎模型同時改進的情況下,縮小期望與現實之間的差距。但使模型變得出色隻是成功了一半,生成式 AI 優先的用戶體驗也在進化:
新興産品藍圖
生成式界面:基于文本的對話用戶體驗是 LLM 的默認界面。漸漸地,新的形态進入了武器庫,從 Perplexity 的生成用戶界面到 Inflection AI 的語音發聲等新的模态。
新的編輯體驗:從 Copilot 到導演模式(Director ‘ s Mode)。随着我們從 Zero-shot 到 ask-and-adjust(感謝 Zach Lloyd),生成式 AI 公司正在發明一套新的旋鈕和開關,它們看起來與傳統的編輯工作流程非常不同。Midjourney 的新的平移命令和 Runway 的導演模式創造了新的相機般的編輯體驗。Eleven Labs 使得通過提示(Prompt)操作聲音成爲可能。
越來越複雜的代理系統:生成式 AI 應用越來越不僅僅是需要人來審查的自動完成或初稿;它們現在有自主權來解決問題、訪問外部工具并代表我們端到端地解決問題。我們正穩步從 0 級進展到 5 級自主性。
系統範圍内的優化:有些公司并不是嵌入單個人用戶的工作流程并使該個體更有效,而是直接解決系統範圍内的優化問題。你能否選擇一部分支持票據或拉取請求并自主地解決它們,從而使整個系統更加有效?
結尾的思考
當我們接近前沿悖論,當 Transformers 和擴散模型的新奇性逐漸消失時,生成式 AI 市場的性質正在發生變化。炒作和快速展示正在爲真正的價值和完整的産品體驗所取代。
在紅杉美國,我們仍然堅定地相信生成式 AI。這個市場起飛所需的條件在幾十年的時間裏已經累積起來,市場終于到來了。殺手級應用的出現和終端用戶需求的巨大規模加深了我們對市場的信心。
然而,Amara 的法則——我們傾向于在短期内高估一項技術的效果,在長期内低估其效果的現象——正在發揮作用。我們在投資決策中運用耐心和判斷,密切關注創始人是如何解決價值問題的。公司使用的共享劇本來推動模型性能和産品體驗的界限,使我們對生成式 AI 的第二階段感到樂觀。
原文鏈接:https://www.sequoiacap.com/article/generative-ai-act-two/