大模型時代的開發者平台,不僅要提供 AI 原生能力,還要具備生态打造和商業化閉環能力。
提及" 靈境 ",人們在腦海中往往會呈現出自己旅行過的風景名勝。然而,當身處在通用大模型 " 智力湧現 " 的語境下,對準備在這裏探索 AI 世界的開發者而言,能夠提供機遇的 " 靈境 " 平台,又會是什麽樣?
這個問題不好回答,畢竟運營一個開發者平台,涉及産品打磨、規則建立、持續運營等多個維度。而一個新時代的開啓,勢必有着更多不可預測的變量。
但在此時,我們同樣也看到有些先行者正試圖給出自己的答卷。比如,在國内率先推出 " 文心一言 " 的百度,在今年 9 月也快速上線了自己的 " 靈境矩陣 " 開發者平台(以下簡稱 " 靈境 ")。
我們了解到,靈境矩陣自 9 月份發布公測上線以來,整體收到的申請是 2.7 萬左右。其中個人開發者的比例一直呈現上漲的趨勢,現在在 30% 左右。
而且靈境矩陣的不同之處還在于,它不僅是一個重在提供開發能力的平台,也爲開發者設計了一套流量變現通路,希望讓開發者能切切實實地通過平台獲得收益。
這是一套頗爲前沿的探索機制,讓人好奇,靈境矩陣的推出和設計,都經曆了怎樣的思忖和探索?
11 月 15 日下午,在第二屆 " 百度搜索創新大賽 " 期間,我們懷揣着種種有關 " 靈境 " 的問題來到百度科技園中,與百度靈境矩陣平台負責人張瑞星進行了 2 個小時的訪問。
靈境的誕生:讓大模型成功才是戰局關鍵
" 是做一個低成本能開發 AI 應用的平台去賦能開發者,還是去幫開發者直接接入大模型,通過大模型再賦能到各家企業中?到底選哪個方向?我們經曆了較長時間的思考。" 面對靈境究竟爲何誕生的疑問,張瑞星坦誠回應。
今年年初,在全新的大模型戰場上,大多數人都選擇做應用,典型如國内的妙鴨相機、國外的 Midjourney 等。但百度在全線重構自有産品之外,也在思考如何幫助開發者降低成本。
這是一個非常重要的研判。大模型是一個強大的大腦,但是它需要更多手和腳。所以,在今年年初大家的眼光都集中在大模型時,百度已經開始思考如何對大模型進行更多的能力支持。
開發者平台成爲了一個選擇。如果做類似 Midjourney 這樣的應用,成就的是個體。而做開發者平台,成就的是大模型和生态。如果有愈發多的開發者來到這裏,開發出更多的能力,那麽大模型也會因此獲益。百度的文心大模型,也會進一步赢得新時代的 AI 戰役。
這個判斷,也是和衆多使用大模型的客戶" 聊 "出來的。
" 我們當時也和很多開發者、企業溝通,發現他們在使用大模型的過程中還是有一些具體場景下的痛點,需要插件這類産品去幫助解決。" 張瑞星說。
所以,靈境的定位,就是要助力文心大模型這個大腦有更多的手和腳,讓文心的服務能力更強。
抛去概念,插件與 Agent 都是靈境
大模型這個行業,叠代非常快速,市面上一時産生了很多概念:如 Bot、插件、Agent 等等。但是,糾結這些概念,在日新月異的大模型時代意義不大。
" 我們需要有一種機制,能讓開發者以足夠低成本的方式,接入到大模型的底座上來。這種機制,到底是叫插件,還是叫 Agent,還是叫某種 API,或是叫其他什麽,都隻是概念的一種。随着技術的演進,市場的發展,它們最終會逐步規範化、統一化到一類範式上。" 張瑞星認爲。
但另一個問題是,既然現在看來,Agent 更像是未來的範式,插件是不是不重要了?跟 Agent 的關系又是怎樣的呢?
在張瑞星的眼中,Agent 可能是未來主流的接入方式,其本身要涉及到幾大能力。"Agent首先是對于描述需求的自然語言有理解。第二就是基于理解,對用戶的動作和任務,做出有效的規劃。同時,針對用戶交互的信息,它要長期記憶。" 張瑞星進一步解釋,在這個過程中,要想滿足用戶需求,其實 Agent 需要調用各種各樣的 tools 工具。
所以,插件可能就是 Agent 的基礎,是 Agent 所需調用的大量工具的基礎。
比如一款旅遊行程規劃的 Agent,可以讓用戶快速地制定一個基于個人習慣的私人助理,從而制定旅遊行程規劃。
但是,這個 Agent 本身需要調用大量的工具。也就是當它需要查詢天氣類,調用飛機或火車的時刻表、班次信息,以及是否喜歡靠窗等一些個人偏好,同時還需要去查詢目的地城市的好玩景點,是否帶娃出行等個性化屬性的時候,Agent 就會調用很多插件工具,組合型地滿足用戶的個人需求。
從這個角度上看,各種各樣的插件,是支撐起 Agent 的基座。
" 現在插件做的事情就是大量的 tools。比如旅遊智能行程規劃 Agent,可能你和它交互完之後,它直接能幫你訂票。爲了完成這個動作,它需要調一個訂票的 tools,也就是插件現在在做的事情。插件未來會成爲 Agent 的一個重要支撐。" 張瑞星說。
他還打了一個有趣的比喻來形容未來大模型、Agent 和插件的關系:"Agent 或許是一個小腦,大模型是個大腦,未來可能各家的大小腦容量都差不多。但如果我手上有 10 樣工具,你手上隻有一樣工具,那我滿足客戶需求的能力肯定更強。"
爲什麽一定是靈境?
雖然目前不少大模型公司都在推出開發者平台,但要做大模型時代的開發者平台,不僅需要技術支持,還需要了解用戶需求,也要具備生态打造和商業化閉環能力。
而靈境的誕生,始于百度對于大模型格局的前瞻研判,也離不開過去整個技術、産品、生态、商業化體系的積累。
靈境矩陣平台的真正立項時間是 7 月。從立項到上線測試,再到 9 月對外發布,靈境隻有 2 個月左右的時間。
張瑞星回憶起當時團隊的緊張節奏,簡直是分秒必争:" 不到 30 天,8 月中下旬内測(邀測)版本已經發布,在 9 月初,我們在聯盟峰會上正式發布了公測版本。"
而光速上線 " 靈境 " 開發者平台,除了團隊的全力以赴,也與百度過去的長期積累有着莫大的關系。這也是國内不少做大模型的企業所不具備的。
首先,百度原本就積累了很強的開發者生态——不管是原來的站長,還是後來的小程序,這百萬站長和三四十萬的小型開發者,是百度的天然優勢。
市面上不少公司都想做開發者生态,但是原本在這個層面上沒有積累。如果在本身沒有開發者或者 B 端生态的情況下硬造一個平台,除非企業有着很強的布局能力,否則即便做成平台,收益也會很低。
再者,對比有開發生态的大模型玩家,百度同樣擁有着豐富的 " 流量場景 "。
這也讓靈境在市面上的定位更具差異化——它不止是一個純開發平台,而是一個覆蓋 " 開發 + 運營 + 商業化 " 的一體化賦能平台。
對比之下,國内外許多插件開發者都面臨着 " 既沒有生态,有沒有流量場景 " 的困境。比如在 OpenAI 的生态中,有一個金融領域的插件開發者表示插件做完了,在 ChatGPT 上卻很少有人去問金融問題,會導緻他的插件調用很少,收益也很小。而沒有流量分發的開發者平台,很可能是無效的。
張瑞星解釋:" 爲什麽我們在定位上沒有隻寫‘開發’兩個字?因爲靈境包含了開發、運營以及商業化的部分,隻不過初期,開發肯定是最重要的。"
他向我們透露,百度此前已經部分打通了分發場景,并預計在第四季度徹底打通百度搜索和文心一言這兩大分發場景," 像地圖、文庫等百度的其他主要分發場景,靈境都在接入。所以,很快就能看到開發者不隻可以在靈境上開發,還會有比較适配場景的流量湧入。預計在今年 Q4 或者明年 Q1,靈境會布局商業化的能力,允許一些插件開發者在對應的場景上進行流量變現。"
那麽,假如對手也有着這兩方面的優勢,靈境的支撐又是什麽?
答案是大模型自身的能力。而在國内,百度對于大模型的投入是非常長期且巨大的,效果層面也直追國際水平。
前瞻的魔鬼細節
功能的完善程度和易用性,往往在初期就能決定一個産品的成敗。
那麽,在最初搭建的開發模式層面,靈境相較 ChatGPT 插件又有哪些不同?通過張瑞星的講述,我們感受到,魔鬼往往藏在細節之中。
第一,靈境采用了最新的可視化開發編排模式,通過拖拽的方式,可以在一定程度上淘汰 Langchain 這種中間平台,降低大模型應用的開發成本。據了解,百度靈境矩陣其實在 7、8 月份的時候就采用這種比較領先的方式,甚至比 OpenAI 要早。
第二,在接入層面上,靈境支持了多種方式。像 ChatGPT,本身更多支持 API 的接入,但靈境支持的數據接入類型更多,比如本地上傳,數據庫、API 等,能力型的接入都覆蓋。此外,應用類的接入也是靈境的一大特點。一些能力較強的開發者,如攜程,願意來靈境做一個類似于智能應用,未來這個智能應用也可以接入到大模型裏。" 這三種模式我們都支持接入,所以從接入的方式上比 Plugin 更豐富。" 張瑞星表示。
第三,靈境在頂層設計上,把插件的分發設計成了一體多端的模式。并且,這一模式 Q4 就能完整落地。
" 所謂一體多端,就是基于百度的流量場景的特性,設計兼容移動端的各類 APP 和 PC 浏覽器在内網頁搜索的模式。" 張瑞星說,有了一體多端的分發能力的設計,未來靈境上的插件就能原生地植入到原本的 App 中,甚至包括自己的小程序裏,這是一個良好的基礎,也是 ChatGPT-Plugin 不能達到的。
具備衆多差異化特點,目前靈境所覆蓋的領域也比較齊全,除卻法律、情感、辦公創作、商品評測等,還有很多插件都在開發和上線中。現在靈境中使用較多的是辦公創作類插件,因爲這仍是眼下大模型應用的最主要場景。
我們還注意到,之前法律 Bot、旅遊 Bot 兩款靈境的應用很早就得到了開發者的好評。
從這兩類 Bot 的打造方式中,我們也可以看出靈境矩陣的運作細節。
首先,針對這兩個行業,百度成立了專項小組。
比如法律 Bot。百度的法律部門在百忙中提供了很多專業的律師來爲 Bot 校正,逐字評估回答的準确性。" 看似我們在産品上投入不大,但整個團隊加起來,每個小方向的投入基本都在幾十人左右,這裏面包括了策略、評估的團隊、包括了相關專業的團隊。" 張瑞星介紹。
而旅遊 Bot則不止是靈境團隊的付出,更是攜程團隊和百度大力協同的結果," 相當于我們有一個很緊密的兄弟團隊也做了大量投入,和我們聯動做這件事情。" 張瑞星補充。
此外,領域對齊也是一個大模型火熱話題。
張瑞星分享了在做法律 Bot 訓練過程中的經驗," 在大模型訓預處理、預訓練的過程中要經過反複的策略調整。比如同樣一個問題,你回答成這樣或者回答成那樣,哪個到底是對的、哪個是好的,它需要有一個正反饋。在這個過程中,靈境有大量的評估團隊、樣本生成的團隊,去輔助大模型的訓練。"
這裏有兩個點,首先是整個團隊從不懂到懂的過程中,其實需要和内外部專業人士頻繁溝通。" 所有市面上能聊的我們都聊了,而且律師團隊還會給産品團隊做培訓。團隊還引入了專業人士,數據标注這一環都招的是有法律背景的人。" 他告訴我們。
再一個,和專業機構的合作也能讓産品效果得到飛躍式提升。我們了解到,靈境平台上法律方向的内容,也得到了中國司法大數據研究院的支持。
" 當你進入到深水區的時候,進入到這個垂直領域的時候,你的策略和模型的效果,對整個‘法言法語’的理解,就會上一個很大的台階。" 張瑞星如此總結深紮垂直領域的感受。
未來的靈境
" 人人可 AI" 是靈境秉持的理念。這是一個長期的目标,需要持續耕耘才能實現。
我們了解到,未來一年内,靈境将會持續發力三個重點方向。
首先,靈境平台會持續地降本,這是靈境的内核,也是行業的趨勢。AI 時代的開發者,不會僅是傳統意義上隻具備專業研發能力的從業者,還有越來越多的普通人,也對此躍躍欲試。而要讓這件事真正落地,降低開發者的成本,會是重中之重。
Agent 開發範式的出現,給了這件事轉機。
在 Agent 的開發模式下,通過代碼、開發 API、Prompt 的方式創建功能,會帶來極大的成本降低空間。
" 成本降低到什麽程度?有可能未來整個靈境平台就是一個 Agent,使用者進來隻需要敲字:‘我想創建一個什麽東西’,或者‘我想再外挂一個數據庫’,隻需要通過自然語言交互的方式就完成了,這是我們的一個明确路徑。" 張瑞星表示。
而這同樣是一個新的飛輪。這個模式,會讓開發門檻降下來,籠絡更多的開發者,同時讓有開發實力的人開發出更好的東西。
張瑞星也詳述了靈境持續降本的一些計劃。
最直接的方式是把開發者的開發過程壓縮,讓大模型直接幫開發者把過程轉化成 Prompt,做好對應的 Agent。
此外,靈境還會提供開發者不少資源。" 靈境去賦能大家更多的算力、賦能更多的免費 Token。此外,靈境還會有一些經濟上的賦能或者支持。比如,在服務器層面、軟硬件條件層面,如雲的服務器等,我們對很多個人開發者或者企業開發者都可以免費開通。" 張瑞星補充。
第二個重點攻堅方向涉及商業閉環。也就是說,靈境接下來還要賦能開發者足夠的經營能力。" 這條線我們認爲依然是百度差異化的核心優勢。我們真正能給開發者帶來收益,而不是講空話。" 張瑞星強調," 開發者做出了好的東西,靈境還希望幫他推出去。"
在這其中,靈境一方面會幫助開發者真正能獲取流量和用戶,同時也會提供各種各樣的商業化賦能。另一方面,對于缺乏 C 端訴求的開發者,靈境也會打造出 "D2C"、"D2D" 的模式," 其他開發者可以把你開發的東西買走或者直接調用。" 張瑞星表示甚至還可能會推出 "D2P" 的商業模式,即開發者可以爲平台有償做一些精品化的東西。
當然,爲了保證用戶體驗,靈境對于插件的上線審核有着嚴格的要求。某個插件上線,就意味着要通過文心一言、百度搜索等産品,和用戶發生交互。在這種狀況下,靈境對于它的準确率、觸發準确率和回答的質量,都要求較高。爲此,靈境團隊有着嚴格的上線評測标準,以免給用戶造成不好的使用體驗。"
當然,靈境的持續打磨之路,同樣有着各種各樣的挑戰。最直接地,是模型和 Query,再和最後執行動作的調優。
對 Agent 的開發範式來說,原來的網頁分發那套邏輯不再适用了——任何一個網頁、任何一個網站未來都可能會被定義爲一個小的 Agent,未來的搜索會變成調用各種各樣 Agent 的模式。
比如網站 Agent、App Agent、數據 Agent,都是不同類型的 Agent。那麽,如何将這個過程智能化、自動化,達成精準識别調用 Agent 并分發的效果,不僅要優化産品,還要在這個過程中形成 B、C 一體的策略飛輪、數據飛輪。
這需要讓大模型有很強的判斷能力和識别能力,以及與 Agent 之間的交互能力,才有可能做到。這同樣是靈境後續的一個核心方向:打造一個搜索的 AGI+ 一個通用的 Agent。
這顯然不是一件易事,但對靈境矩陣來說,更大的願景還在路上。
在百度的設想裏,靈境未來也會構建一個類似于 GPTs 這樣的 store," 但和移動時代的 App Store 不同,靈境能構建真正适合開發者的構建範式,從而創作出類似領域下的新東西。" 在張瑞星看來,構建這樣一個平台,是讓創作者激發更多想象力,讓整個 Agent 生态更加繁榮的必經路途。
* 本文系量子位獲授權刊載,觀點僅爲作者所有。
— 完 —
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~