家人們,百度文心一言的插件,現在可以聯動着用了——
隻要幾十秒,立馬給你生成一個專業廣告大片!
話不多說,直接先來看一下成品:
不信?
沒關系,我們現在就來手把手地實操演示一下。
首先就是要把要用到的文心一言的相關原生插件 " 火力全開 ":
百度搜索:也就是大家常說的 " 聯網 ",可以保證大模型的時效性和準确性(默認開啓);
說圖解畫:把圖片丢進去,就可以根據它寫故事、文案、回答問題等;
一鏡流影:根據主題詞、語句或段落,一鍵創作生成視頻(依托文心跨模态大模型,突破了不同模态之間語義對齊等技術難題,創新融合文本、視覺、語音、跨模态等一系列技術能力)。
然後我們将一張可愛的奶牛照片丢進去:
讓文心一言先做一個理解:
從解析的結果上來看,文心一言精準無誤地做到了 " 看圖說話 ":
一頭黑白相間的奶牛,站在藍天下,正凝視着鏡頭。它似乎有些好奇或驚訝,又或許在思考着自己的存在和命運。它的耳朵豎立,眼睛炯炯有神,仿佛在尋找什麽重要信息。它是一隻充滿生命力的動物,充滿了活力與好奇心,讓人不禁想要靠近觀察它的世界。
接下來,我們讓文心一言幫忙取一個品牌名稱:
在給出的品牌名稱的風格之上,我們再讓文心一言寫一段廣告語:
最後,隻需要求文心一言根據以上内容生成一個視頻," 啪的一下 ",數十秒時間,廣告視頻就誕生了!
或許有朋友要說了,職場人拍個廣告片,前期可是要做大量的調研工作才能保證視頻内容的真實性與精準度。
确實如此,不過現在,借助文心一言多個插件的聯動,這項工作也會變得異常輕松容易:
覽卷文檔:根據給定的文檔,可以完成摘要、問答和創作等任務;
E 言易圖:僅需簡單的數據圖表需求,或輸入待生成圖表的數據内容,即可生成可交互圖表,已支持 7 類圖表的生成,包括數據圖、餅狀圖、折線圖、雷達圖、漏鬥圖、思維導圖、散點圖。
在将文檔 " 喂 " 給文心一言之後,不論是對内容的總結亦或是對數據的分析,都變成了一句話的事了:
如此一來,原本要消耗數天甚至數周的工作,直接壓縮到了幾分鍾的時間裏。
網友們在看到這般效果之後,也是紛紛驚呼 " 泰酷辣 "、" 給工作帶來了很多幫助 "。
爲了能夠打造更多的插件,文心一言還發布了大模型插件統一開發範式及工具集,邀請第三方爲文心一言開發插件。感興趣的小夥伴可以去嘗鮮了(鏈接見文末)。
(注:除百度搜索外,目前可最多聯動 3 個插件。)
而以文心一言爲代表的大語言模型,也意味着跨入了一個新的台階,正如百度首席技術官王海峰在大會中首次對外所表示的那般:
人工智能具有多種典型能力,理解、生成、邏輯、記憶是其中的核心基礎能力。這四項能力越強,越接近通用人工智能,而大語言模型具備了這四項能力,爲通用人工智能帶來曙光。
升級後的文心大模型,還能做什麽?
作爲開發者大會,定然是少不了代碼場景下的能力升級。
百度集團副總裁吳甜在現場便抛出了一個讓很多程序員頭疼的問題——接手代碼:
" 前人 " 留下的代碼太難懂、太晦澀了。
現在,程序員們再遇到這樣的問題就不用愁了,一個 " 複制粘貼 " 的動作,把煩惱統統交給文心一言來解決。
它會逐行地對代碼的功能做出解釋,并且在結尾處會總結整個代碼的作用:
這個函數的功能是計算給定文本中單詞的頻率,并按照頻率對結果進行排序。
若是依舊不是很好理解,也隻需讓文心一言對代碼做一個改寫:
當然,我們還可以讓它寫一個測試用例,并給出運行結果。
至于在代碼輸出能力,吳甜在現場也演示了生成展示詞雲的代碼,并将它實時運行了出來:
可見文心一言已經具備了很強的代碼解釋、代碼改寫、代碼注釋、代碼生成等能力。程序員防秃頭,就用文心一言呀。
WAVE SUMMIT 大會上百度爲開發者提供的福利可不止這個。大模型社區 " 星河 " 上線了!
在星河大模型社區,開發者可以獲得一體化大模型開發體驗。飛槳 + 文心貫通全開發流程,與開發者持續共創大模型項目和應用。
它的前身其實很多小夥伴都已經比較熟悉了,正是飛槳的 AI Studio(星河社區),專門爲大模型增設了一塊新的 " 專區 "。
據了解,星河大模型社區目前已經有 300 多個大模型創意應用,還有創意配方可以分享和使用,同時也提供了穩定的應用部署環境(登錄 AI Studio 訪問 " 社區 " 欄目,能玩兒上好一陣)。
不過剛才提到的種種新能力,也還隻是文心一言升級表現的一隅。
工作生産力方面,百度智能工作平台" 如流 "也得到了相應加持——重磅發布超級助理,不僅是工具那麽簡單,而是會更懂你、專業、實時陪伴的那種。
例如,百度集團副總裁、百度集團首席信息官李瑩和同事在現場演示了一句話完成請假:
下周五我要休一天假,去參加社區公益活動。
更複雜的,如申請差旅,也是可以一句話搞定了:
我後天上午去上海研發中心開會,當天返回北京,請幫我規劃行程。
不僅爲已有日程讓出時間,就連機酒組合也一并奉上,還不用操心報銷問題,秒級完成操作。
另外,找文檔、學知識、查文獻,在文心一言的加持下,現在也都簡化成了一句話搞定:
除此之外,聚焦到開發者,百度程序員都在用的編程助手 Comate,也基于文心一言來了個大升級——發布 X 版本,覆蓋研發全生命周期、全場景,全面幫助工程師 " 想 "" 寫 "" 改 " 代碼,已支持 30+ 語言,十多種 IDE。
同樣是一句話,李瑩和同事現場一分鍾便開發出了邀測激活碼功能代碼:
用 Java 寫一個方法,來生成唯一的激活碼。
同樣的,在 Comate X 中也可以繼續追問,例如 " 解釋這段代碼 "、" 生成注釋 "、" 生成測試 " 等。
不僅如此,這屆 WAVE SUMMIT 還推出了開發套件 Comate Stack,讓更多、更大的開發項目變得越發容易。
例如若是想在超級助理裏開發一個休假政策的插件,那麽現在隻需兩個步驟即可:第一步對 Prompt 做評估,第二步用 iPlayground 少量配置即可完成。
一套操作下來之後,也是讓網友們驚歎于開發的簡易與高效:
那麽在縱覽這波技術 " 肌肉秀 " 之後,随即而來的一個問題便是:
怎麽做到的?
左手文心大模型,右手飛槳,這便是此次能力升級背後的秘笈。
正如剛才王海峰所述,現在文心産業級知識增強大模型已經具備了理解、生成、邏輯、記憶四項能力。
至于它們的獲得方式,我們不妨以文心一言爲例來窺知一二。
文心一言首先從數萬億數據和數千億知識中融合學習得到預訓練大模型。
在此基礎上采用有監督精調、人類反饋的強化學習和提示等技術,并具備知識增強、檢索增強和對話增強等技術優勢。
進一步地,通過多種策略優化數據源及數據分布、基礎模型長文建模、多類型多階段有監督精調、多任務自适應有監督精調、多層次多粒度獎勵模型等技術創新,全面提升基礎通用能力。
在檢索增強和知識增強的基礎上,通過知識點增強,提升對世界知識的掌握和運用;通過大規模邏輯數據構建、邏輯知識建模、多粒度語義知識組合以及符号神經網絡,提升邏輯能力;通過構建數據、内容、模型和系統安全的全面安全體系,保障大模型的安全性。
也正因如此,文心一言自 3 月份開放測試以來的短短 5 個月,技術和應用效果都在大幅提升。
吳甜在此次大會中也公布了一組數據:
過去 5 個月 " 文心一言 " 成長迅速,現在已經熟練掌握的創作體裁超過了 200 個。内容豐富度是發布初期的 1.6 倍,給用戶提供了更加豐富、言之有物的文案書寫。大語言模型非常讓人欣喜的一個能力是它的邏輯思考能力,通過思維鏈長度的提升,今天的 " 文心一言 " 思維鏈長度已經是發布初期的 2.1 倍,思維鏈長度使得 " 文心一言 " 思考的過程具備了更好的深度。同時通過知識點覆蓋的加強,使得 " 文心一言 " 在給大家提供幫助的時候有更廣闊的思維,如今知識點覆蓋達到了發布初期的 8.3 倍。
而大模型效率的提升,也離不開飛槳的加持,例如在訓練方面,百度對此總結了自己的一套打法:
第一,與硬件集群協同優化,提升有效訓練時間占比。對于長時間、高負荷的大模型訓練而言,降低訓練集群的故障率和訓練恢複成本無疑是至關重要的。
第二,與芯片 / 存儲 / 網絡協同優化,提升訓練吞吐速度。這也是飛槳一直以來持續優化的方向。
第三,與模型算法協同優化,提高收斂效率。特别是在大模型訓練中,優化收斂效率和穩定性,可大幅度減少訓練時間,達到事半功倍的效果。
在推理方面,飛槳則是從模型壓縮、推理引擎、服務部署三個關鍵環節進行協同優化。
例如采取了自适應 Shift-SmoothQuant 壓縮算法、結合場景的混合量化推理方案、動态插入批處理技術等,飛槳持續結合算子融合加速、變長輸入處理加速等。
除此之外,爲了更好的支撐大模型生産與應用,飛槳的大模型套件圍繞大模型開發、訓練、精調、壓縮、推理、部署的六個階段全流程進行了升級,持續降低大模型開發和應用成本。
整體而言,通過飛槳端到端自适應混合并行訓練技術以及壓縮、推理、服務部署的協同優化,文心大模型訓練速度達到了原來的 3 倍,推理速度則達到了原來的 30 多倍。
至于飛槳開源框架自身,也升級到了最新的 2.5 版本:
基礎框架持續升級:微分功能更完善,性能優化更通用。
更好支持 AI for Science:正式發布飛槳科學計算工具組件賽槳 PaddleScience v1.0;螺旋槳 PaddleHelix 發布 HelixDock 蛋白 - 化合物構象親和力預測大模型。
當然,生态依舊是非常關鍵的因素之一。
正如百度 AI 技術生态總經理馬豔軍在大會中所述:
在研發的過程當中我們也發現,軟硬件的互聯互通标準非常關鍵,所以我們也積極參與到這個标準的研制當中,由中國電子技術标準化研究院牽頭,包括百度等其他廠商一起起草了國家标準《人工智能 深度學習框架多硬件平台适配技術規範》。
據了解,基于這個技術規範,飛槳已經跟 30 多家硬件廠商開展聯合适配;目前已經跟 12 家硬件夥伴開展文心大模型的适配。
技術兩手抓,生态亦兼顧,也就不難理解爲什麽百度可以做到了。
百度飛槳 + 文心大模型,落地勢能在加速度
最後,縱觀整場大會,或許給人最爲直觀的感受便是" 加速度 "了。
不僅是技術的發展的加速度,更是落地勢能的加速度。
技術層面上的加速度顯而易見,例如上述的各項能力的大幅提升,便是非常好的印證。
而落地勢能的加速度,也并非是一蹴而就的信号,而是貫穿每一屆 WAVE SUMMIT 的那種。
早在 2019 年,王海峰就提到:
深度學習正在推動人工智能進入工業大生産階段。
王海峰當時認爲,正因深度學習具備通用性,以及深度學習平台在不斷發展,所以它們正在推動 AI 步入一種新的模式。
這種模式可以歸結爲 " 三化 ",即标準化、自動化和規模化,這也就意味着人工智能在進入工業大生産階段。
要做人工智能時代下的普及,就需要先讓框架、大模型在企業,尤其是龍頭企業加速鋪展開來;而後通過反饋和優化,逐層向下更深入的應用起來。
除此之外,生态,生态,還是生态。
正如蘋果、安卓在移動時代下的生态大戰一般,得生态者爲王;人工智能時代下,亦是如此。
百度可以說是幸運的,早早的布局,讓它立于現在這個時間節點上,已然顯現出了 " 先發優勢 " ——
以飛槳生态爲例,可以說是愈加繁榮,已凝聚 800 萬開發者,服務 22 萬家企事業單位,基于飛槳創建了 80 萬個模型。
而本屆大會中,百度在落地勢能加速度上又發出了一個新信号—— AI 原生。
這正是得益于大模型在全球的火爆發展,諸如企業辦公等産業領域所迎來的新機遇、新範式。
不是簡單的調入接口等操作,而是從開發到應用,自下而上将 AI 原生貫穿的那種。
就目前來看,百度在這方面也是搶占了先機,尤其是在産業領域展開了布局,并發布 " 生态号召令 ",以共創的方式再提速。
至于如此 " 百度速度 " 何時能夠完全引爆智能時代的生産力,我們拭目以待。
文心一言的插件能力正式啓動邀測,歡迎開發者加入:
yiyan.baidu.com/developer