作者 | 董溫淑
編輯 | 李 原
運營 | 劉 珊
由 AI 開啓的科技大航海時代已經到來,這一點無需多言。但如何爲無數開發者和用戶降低門檻,掃清 AI 應用的障礙,行業需要領軍者來制定标準,架起更便捷的梯子。
一年前,在 AI 風暴剛剛席卷世界時,百度便在國内率先發布了自研大語言模型。一年後,當文心大模型的調用量已穩居國内頭部時,百度又在嘗試樹立起新标杆。
4 月 16 日,百度創始人、董事長兼首席執行官李彥宏在 "Create2024 百度 AI 開發者大會 " 上,對 AI 世界的藍圖發出暢想:" 未來,自然語言将成爲新的通用編程語言。你隻要會說話,就可以成爲一名開發者,用自己的創造力改變世界。"
他向在場觀衆介紹了百度三大 " 開箱即用 " 的 AI 開發神器,這三大神器瞄準了普通用戶與專業開發者的日常痛點,将極大降低應用開發和模型精調的門檻。
李彥宏也同時指明了百度的 AI 願景:" 作爲一家技術公司,百度的角色定位,就是盡可能地爲大家提供所需的開發工具,不斷提升整個社會的創造力。"
理想情況下,未來開發一個 AI 應用将會有多簡單?李彥宏的答案是:難度大概會和 " 拍個短視頻一樣 "。爲了推開大模型時代的大門,百度正在緻力于幫助開發者極緻地降低使用難度。李彥宏表示:" 最快隻需三步,開發者就可以用自然語言開發出一個 AI 原生應用。打開開發界面,第一步給應用起名,第二步填寫角色指令,第三步再插入需要的工具組件。"
這樣簡潔到極緻的開發過程,要走過的研發路徑是極其艱辛的。傳統而言,基礎大模型與 AI 應用之間,需要曆經許多鏈條。如一位開發者在 " 百度開發者中心 " 網站中所發布的《AI 原生應用速通指南》中寫道:"AI 原生應用開發涉及需求分析、數據準備、模型訓練、部署上線、監控與優化等五大流程。" 而且,每個環節還各有子流程,環節中對于開發者的編程能力也有所要求。
爲解決這個問題,百度推出了 AI 原生應用開發神器 AppBuilder。在其中,百度提前封裝和預置了開發 AI 原生應用所需的各種組件和框架,以此大幅降低開發門檻。同時,該神器具備跨模态能力。例如,開發者給出一段文字,就可以快速創建繪畫類應用。因此,AppBuilder 也被李彥宏描述爲 " 最好用的 AI 原生應用開發工具 "。
在此之上,百度同時推出了文心智能體平台 AgentBuilder。當下,能幫助執行複雜任務的 " 智能體 " 概念,正成爲業界共識。比爾 · 蓋茨曾在其官方博客中預測:" 一個全新的技術—— AI 私人助理智能體——将普及至每個人的日常生活中,而不僅僅局限于辦公室工作。"
而 AgentBuilder 的設計,則是爲普通用戶在創建智能體的過程中,掃清編程壁壘。
根據李彥宏的演示,打開文心智能體平台官網後,創建頁面顯示爲 " 零代碼 "" 低代碼 " 兩種模式,新手可以直接選擇 " 零代碼模式 ",用自然語言描述需求,隻需幾句話就能創建一個智能體。一個賬号最多可以創建 50 個智能體,單個智能體還能承載 10 個數據集。
同時,AgentBuilder 已經能夠爲開發者提供百度生态流量分發路徑,完成 " 開發 + 分發 + 運營 + 變現 " 一體化的商業閉環。李彥宏透露,截至目前,已經有 3 萬多個智能體被創建,5 萬多名開發者和上萬家企業入駐了 AgentBuilder。
相較于前兩款面向普通用戶的開發神器,ModelBuilder 更多是從 MoE(Mixture of Experts,混合專家)的思路出發。對此,李彥宏特别解釋道:"MoE 不是一般的學術概念,而是大小模型的混用,不依賴于一個模型來解決所有問題。"
ModelBuilder 更聚焦專業開發者,可以讓開發者根據需求定制任意尺寸的模型、并根據細分場景對模型進一步精調。ModelBuilder 預置了文心大模型 " 家族 ",其中包括了旗艦版大模型 ERNIE3.5 和 ERNIE4.0,适合通用的複雜場景;三個輕量級大模型,ERNIE Speed、Lite、Tiny;以及兩個垂直場景的模型。
此外,ModelBuilder 也支持國内外第三方主流模型,總數量達到 77 個,可以說是國内擁有大模型數量最多的開發平台,便于開發者按需選用。
無數普通用戶能被李一舟 " 收割 ",背後正反映了普通人對于大模型應用開發的迫切需求。然而,世界上現存的編程語言已經多達約 600 種,一個成熟代碼工程師的成長周期更要長達幾年。過去,普通人在 AI 的開發需求和開發能力之間,存在幾乎難以逾越的技術壁壘。
如何降低大模型的落地門檻,也是當下整個創造市場所關注的難題。正因如此," 大模型中間件 " 的概念也應運而生:它是在底層大模型和上層應用之間的中間層基礎軟件,主要用于解決大模型落地過程中,集成數據、應用、知識庫,以及大模型融合級功能協同等問題。
當下," 大模型中間件 " 市場仍處于早期發展階段。在國内最早發布自研大模型的百度,也很早就意識到了這一問題。2023 年,李彥宏就曾簡明扼要地講道:" 大模型本身并不産生價值,基于基礎大模型開發出來的應用才是模型存在的意義。"
而前述的三大應用開發神器的推出,恰好精準擊中了用戶缺乏代碼能力的痛點,也回應了行業填補中間件市場空白的需求。
在演講中,李彥宏現場演示了在多個場景下,如何借助 " 三大神器 " 完成開發的過程。
比如想創建一個 " 新加坡旅遊局 " 智能體,讓其設計旅遊方案、解答相關問題、提供酒店門票預訂服務時,用戶隻需要借助 AgentBuilde 就能輕易打造出一個基礎智能體。
随後通過高級配置,用戶還可以把新加坡百科詞條、官網鏈接都添加到知識庫裏,讓智能體每天更新;并通過添加酒店查詢、景點門票購買等工具,進一步增強智能體的服務能力。
如今,這樣的智能體已不是空中樓閣,而是正在快速落地、成爲現實。除了新加坡旅遊局,現在大連、沈陽等文旅類智能體都已在文心智能體平台上線。
李彥宏還現場演示了如何 " 三句話打造 AI 原生應用 "。他分享道,今年年初,華北電力大學提出希望爲全校師生提供智能化的專屬服務,而 AppBuilder 正可以滿足這一需求。在他的演示中,用戶在打開 AppBuilder 進入創建頁面後,第一步僅需點擊 AI 自動生成配置,爲應用設置名稱、簡介、頭像等基本信息;第二步用自然語言在角色指令中描述任務、組件能力、要求與限制等具體要求;第三步,隻要插入自定義的圖書借閱查詢、課表查詢、成績查詢等組件,校園助手就基本具備了智能化服務的能力。
而在應用 ModelBuilder 方面,李彥宏演示了一款作文批改模型。ModelBuilder 先是對原始的 180 條數據進行了數據清洗、數據标注和數據增強;接下來在用戶選型 ERNIE Speed 作爲基礎模型後,給出推薦值來幫助精調;最後把模型部署在平台上。經過上述步驟,精調後的大模型便擁有了更加專業的老師點評思維,能夠更好完成格式批改等工作。
簡而言之,無論是個人還是組織的 AI 開發需求,未來都能通過上述 " 三大神器 " 找到解法。
除了三大神器,李彥宏還在本屆 Create 大會上發布了備受外界關注的 " 文心大模型 4.0" 的工具版。升級後的文心大模型,将更便于用戶體驗代碼解釋器功能,允許用戶通過自然語言交互,實現對複雜數據和文件的處理與分析,還可以生成圖表或文件,能夠快速洞察數據中的特點,分析變化趨勢,爲後續的決策提供高效精準的支撐。
李彥宏表示:文心大模型曆經不斷的優化叠代,已成爲全國調用量最高的大模型。相比一年前,文心大模型的算法訓練效率提升到原來的 5.1 倍,周均訓練有效率達到 98.8%,推理性能提升了 105 倍,推理的成本降到了原來的 1%。
日益完善的強大基礎模型系列,加上三大 AI 開發神器,共同組成了一個強大的 AI 工具箱,支持開發者打包帶走,随取随用。
過去一年中,百度不斷探索打通從大模型到 AI 原生應用之間 " 最後一公裏 " 的解決方案。而在這些成績背後,百度也付出了身爲探索者的代價。李彥宏講道:" 這是百度根據過去一年的實踐,踩了無數的坑,交了高昂的學費換來的。"
2023 年 6 月,百度發布了基于文心大模型的智能代碼助手 Comate。如今,Comate 不僅支持 100 多種語言和所有主流 IDE 平台,還可以推薦代碼、生成代碼注釋、進行代碼續寫等等。Comate 生成的代碼采納率達到了 46%,百度每天新增的代碼中,已經有 27% 是由 Comate 生成的。
這隻是百度大模型落地嘗試的冰山一角。在智能駕駛、智能硬件等諸多市場,都能看到百度對大模型落地的不斷突破和嘗試。
之所以對 AI 原生應用開發、降低大模型應用門檻如此執着,更宏觀的原因在于百度想要完善整個 AIGC 市場生态的願景。隻有不斷降低模型使用門檻,讓每個人、每家企業都打開那扇解放生産力的 " 大門 ",真正的 AGI(通用人工智能)時代才有可能盡快到來。
如李彥宏所言:" 今天的中國,有 10 億互聯網用戶,有強大的基礎大模型,有足夠多的 AI 應用場景,有全球最完備的産業體系。國家也在大力鼓勵和支持‘人工智能 + ’行動,每一個人,每一家企業,隻需要充分利用這些工具,就可以釋放無限的創造力和生産力。"
當大模型開發從一小部分專業人士的遊戲,變爲普通人用自然語言就可以完成的工作時,我們距離 AGI 的實現,才算真正的近了一步。