" 兩個多月,四次叠代,核心場景推理性能提高 50 倍。"
這是百度在過去 70 天間爲文心一言交出的成績單。僅僅在兩周前的技術交流會上,文心一言性能提升還不過十倍。
也是在那次交流會上,百度首次現場演示了大模型微調過程,文心一言背後的絕對功臣 " 文心千帆 " 才開始悄然走進公衆視野。
此前,公衆對于百度更爲熟知的一直是 " 文心一言 " 這一對話式 AI 産品,鮮少有人看到爲其提供支撐的文心千帆大模型平台。
而現在,它終于适時地開始浮出水面,這對于熱衷擁抱大模型的企業而言,無疑是一個好消息。
1、文心一言幕後的支撐者
文心一言的叠代速度令人驚歎,在 5 月 23 日的技術交流會上,百度智能雲副總裁朱勇表示,自内測以來,通過算法和模型的持續優化,文心一言的推理性能已經大幅提升 50 倍。
僅僅在兩個多星期以前,文心一言的推理性能還停留在提升 10 倍的水平。在剛剛過去的二十天,基于文心千帆大模型平台百度通過四層架構(芯片 - 框架 - 模型 - 應用)的端到端優化,文心一言将高頻場景下的推理性能進一步提升了 5 倍。此前,文心一言的推理成本已經降到最初的十分之一,性能的提升也意味着相關成本進一步的下降。
不少人可能還在好奇,文心千帆和文心一言有什麽區别,是什麽關系。如果用最通俗的話,文心一言更像一個 To C 産品,爲用戶提供大模型對話的能力,而文心千帆則是開發、訓練到應用大模型的平台。
更具體的講,文心千帆提供的服務能夠覆蓋人工智能研發的全生命周期,包括:數據管理、模型訓練、模型評估、預測部署和插件服務等,能夠端到端地幫助客戶開發和部署大模型應用。
在 5 月 9 日的技術交流會上,百度智能雲就曾對外展示 " 文心千帆大模型平台 ",表示其是全球首個一站式的企業級大模型平台。
5 月 23 日的交流會中,百度智能雲 AI 與大數據平台總經理忻舟對這一定義做了進一步闡述。前述概念中有兩組關鍵字:其一是 " 一站式 ",這意味着,文心千帆将提供從模型開發、應用、推理,到數據回流、開發的全閉環過程,涵蓋大模型整個開發生命周期;其二是 " 企業級 ",也就是文心千帆将提供衆多企業相關服務,比如智能管控、數據安全、賬号管理等等。
過去一段時間,文心一言的叠代速度已經側面證明了文心千帆在訓練大模型方面的能力。我們看到百度成爲國内第一個發布大語言模型的企業,也欣喜看到過去幾十天間文心一言火箭般的升級速度。
基于這樣的變化,我們可以預見,未來的一段時間,在文心千帆的加持下,文心一言的升級速度或許會更加超出我們的想象。
與此同時,文心一言快速的叠代充分證明了文心千帆平台的能力,讓更多想用大模型能力的企業堅定擁抱。
從企業側來看,文心千帆近期舉辦的四場技術交流會,場場爆滿,參會的幾乎都是企業客戶。據悉,截至目前,已經有 15 萬家企業申請文心千帆的内測。300 餘生态夥伴與百度簽約,展開在 400 多種場景内的探索。
值得注意的是,文心千帆不僅支持文心一言的大模型服務,也支持第三方的大模型。換句話說,客戶使用第三方大模型也可以在文心千帆上進行部署和訓練。
從企業需求側來看,當今企業擁抱大模型,最關注的三個焦點是模型效果、成本和安全。即大模型與能給自身企業帶來多大的業務提升,以及自己是否用得起,以及數據是否能保證安全。
先來看效果,文心一言的訓練成果已然從側面反映出,文心千帆作爲大模型平台的能力。此前,5 月 9 日的現場演示顯示,僅十分鍾左右的微調以後,模型效果就得到了明顯提升。據了解,這樣的微調過程每次大約僅需标注 100 條數據,且模型能夠在類似的問題中産生一定的泛化能力。據百度智能雲介紹,文心千帆開發效果的提升主要依托于 AI 大底座的能力,AI 大底座的千卡并行線性加速比可以達到 90% 以上,訓練資源利用率超過 70%,模型開發叠代效率提升 100%。而來自客戶的反饋也在證明這一點,AI 大底座提供的端到端優化能力大大提高了模型叠代速度,這打動了成立 35 年的金山辦公,雙方很快一拍即合,并且已經開始逐漸在具體産品上落實。
就成本側而言,百度傑出系統架構師王雁鵬表示,企業主要關注點集中于開發成本,即算力。但實際上,它占總成本的比例可能并不高,且這一成本可以通過很多方法降低,比如四層架構端到端的優化。算法、框架、系統和芯片,是一體化的。百度智能雲副總裁朱勇表示,除了算力等整個底層資源的消耗,整個智能應用的開發,需要大量人力成本,大模型的出現使得這些工作門檻足夠低,這些工作交給文心千帆都将是個不錯的選擇。
在安全層面,忻舟坦言,公有雲需要非常高的安全機制,有完善的指令監控、日志監控、審核以及資源隔離機制,可以保證數據安全。從而在一定程度上保證用戶私域的數據安全。此外,客戶還可以選擇私有化部署的方式。同時,爲了保護用戶的數據隐私,百度不會拿用戶數據做模型訓練和叠代優化。并且在符合政策要求情況下,這些數會被删除。
會後的交流中,忻舟進一步解釋道:" 我們要把這個功能每一個角度都做的足夠好,不用做的太複雜,其實更多的是靈活性更強一些,讓我們的客戶和用戶基于足夠的靈活性,能夠根據自己的業務需求開發自己所需要的場景的應用,這是從産品角度來講需要精心設計的。"
2、從大模型到千行萬業
大模型的落地場景遠不止文心一言。在更具體的行業層面,大模型的應用場景擁有更大的想象空間。
剛剛過去的一季度,百度智能雲首次實現盈利。百度智能雲副總裁朱勇告訴雷峰網,百度雲能夠盈利,一方面在于不斷提升的産品标準化程度,是産品驅動;另一方面,基于芯片、框架、模型、應用的四層架構以及端到端優化,都使得其成本不斷降低。
當然,朱勇也表示," 大模型出現之後,我們也看到業界、客戶、合作夥伴的熱情,當前都在積極聯合測試開發,這對于我們接下來很多的項目,或者說很多産品落地、産品的發布節奏是非常有幫助的,未來可能會産生更多的收入來源。"
百度智能雲六大智能産品正基于文心一言升級,經安全評估完成後将會上線。包括金融、政務、客服、寫作等行業和領域。
以智能創作爲例,平台将全方位賦能内容生産者高效創作,高品質内容一步到位。從選題策劃、文本創作到圖片、視頻制作,涵蓋各個層面。
在選題上,智能創作平台将提供新聞線索、熱點發現、事件脈絡梳理等一系列功能;基于大模型的輔助創作将升級爲 AI 自動創作,單篇創作時間從小時級縮減到分鍾級,實現文章全流程自動化寫作且支持交互式内容修訂;提供 16 類場景化圖片,且提供圖片編輯、圖生圖等功能;實現圖文到視頻一站式生成和處理。
據百度智能雲 AI 應用産品部總經理劉倩介紹,智能客服的應答輔助、會話小結、智能工單、客服知識庫等功能在基于大模型完成升級後,知識生産效率提升 9 倍,多輪對話構建成本下降 65%,可讓終端用戶獲得到更聰明更拟人的的體驗。
再如,在政務行業,百度基于大模型打造了一網辦|政務服務助手、一問通 | 社區咨詢服務助手、一問通 | 社區咨詢服務助手、一網管 | 城運洞察助手、一屏觀 | 智能分析助手等一系列産品,助力政府機構實現數字智能和政務體驗的雙增長。
可以看到,大模型已經不再是遙不可及的前沿技術,基于它的應用場景正逐漸深入到企業的生産鏈路中以及人們的日常生活。
除一系列智能應用外,預計未來将會有越來越多的産品基于大模型升級,最先從中獲益的是百度網盤等七大企業級産品。據悉,基于大模型的百度網盤企業版,将爲企業提供數字智能管理平台。升級後的百度網盤能夠通過對話式交互,幫助企業版用戶對文件内容進行總結、翻譯、問答等加工處理。據百度智能雲副總裁朱勇透露,百度将在所有業務中都集成文心一言的能力,内部做了非常詳細的規劃。
3、企業何去何從
此前,在《從智能雲首次盈利,看百度如何在大模型時代奔流》一文中,雷峰網就曾提及,随着大模型到來,百度智能雲的客戶超出預期,不少過去不太願意用的機構開始主動與百度溝通。換句話說,越來越多的企業正選擇擁抱大模型。
在 5 月 9 日的發布會上,百度工程師首次現場通過 " 文心千帆 " 演示了大模型微調的過程。當時,忻舟還表示," 快且收斂,是大模型應用訓練中一個非常重要的指标。隻快不收斂,大模型的訓練是沒有用的。文心千帆在多機多卡訓練性能方面,可以更快達到收斂的狀态,在全球權威 AI 基準評測 MLPerf 榜單中排名世界第一。" 在忻舟看來,企業想用好大模型,隻有大模型仍不夠,還需要有成熟完備的大模型生産平台。
事實上,也确實如此,客戶的積極溝通和擁抱說明了一切。除卻上文提到的金山辦公外,金蝶、軟通動力等不少企業都已經或正在與文心千帆溝通簽約事宜。
5 月 18 日,在百度智能雲合作夥伴大會上,金蝶與文心千帆現場簽約,正式成爲文心千帆的合作夥伴。金蝶中國助理總裁韓革纓在演講中表示,目前金蝶已經接入了百度文心一言大模型,不斷在各種探索驗證并産生了不錯的成果。未來,金蝶還會結合百度文心一言等大模型,利用金蝶的行業知識、專有數據,在特定任務上進行行業模型的打造,不斷去升級金蝶原有的 NLP、OCR 等應用,探索更多的業務場景。
朱勇坦言,文心千帆大模型平台,将爲企業提供開發應用大模型的最好的環境,是客戶擁抱 AI 的最佳路徑。我們希望文心千帆大模型平台,能夠讓我們的客戶和合作夥伴用最簡單的方式,用上大模型,用好大模型。
如前所述,文心千帆不僅提供包括文心一言在内的大模型服務,也爲客戶提供了完整的工具鏈和開發訓練環境,能充分滿足客戶需求。
未來,文心千帆主要将提供兩種服務:
第一,以文心一言爲核心,提供大模型服務,幫助客戶改造産品和生産流程。朱勇表示,這有點 " 淘金 " 的意味,真正的挖掘金子,通過提供模型服務的方式賦能客戶。
第二,作爲大模型生産平台,企業可以在文心千帆上基于任何開源或閉源的大模型,開發自己的專屬大模型。朱勇對此解釋道," 從百度來說,作爲業界頭部的 AI 公司,百度還是希望能夠更加全面,給客戶提供各種各樣的服務,隻要跟大模型相關的,都是我們的‘菜’。"
此外,針對不同客戶需求,文心千帆也将會針對性提供多樣性的服務模式:公有雲層面,文心千帆提供推理、微調、托管等服務;私有化部署方面,文心千帆則通過軟件授權、軟硬一體、租賃服務的方式交付給客戶。
盡管文心千帆爲客戶提供了大模型從開發、訓練、微調、數據回流等全閉環過程,涵蓋整個生命周期,但并不是所有的企業都适于從頭開發訓練基礎模型。
朱勇坦言,其實訓練一個基礎模型成本是非常高的,如果真的要做一個千億級的大模型,需要單機群萬卡以上的算力,不僅要有 GPU 卡,還要有能夠把 GPU 的集群資源利用起來,這個往往不是很多的公司能做的。
在他看來,未來,基礎模型(大的底層模型)可能就那麽幾家,但是基于此,會有很多不同專業和行業類型的大模型,這些不同領域的模型将來支撐上層非常繁榮的領域應用。
據忻舟介紹,從行業來看,目前大模型普及較多的領域以信息化和技術普及率較高行業爲主,比如,金融、能源以及泛互聯網行業等。
後記:生成式 AI 未來可期
近兩月來,大模型遍地開花。企業關注的焦點,已經從大模型的産品功能,轉向如何以更快的速度用好大模型,完成産業鏈的創新再造,實現彎道超車。
百度智能雲方面透露,目前已有 15 萬企業申請文心一言内測,其中有超 300 家生态夥伴在 400 多個具體場景取得測試成效,包括辦公提效、知識管理、智能客服、智能營銷等代表性場景。
作爲國内最早發布大模型産品的企業,百度在大模型領域的探索一直在路上:從文心一言的發布,到一系列應用場景的展示,再到如今文心千帆步入内測階段,爲企業提供開發 AI 應用的各種工具鏈及整套環境,試圖覆蓋人工智能研發的全生命周期。
正如文心千帆負責人忻舟的話:" 生成式 AI 是百年難見的技術變革,我們雖然在起步中,技術還在發展中,但我相信它的未來一定會爲我們帶來很多自己應用的創新和效率的提升。我們擁有最多的人、企業、場景,百度努力在生成式 AI 大模型路上。"