「歡迎來到生成式人工智能的時代!」
2023 年 10 月 17 日,身着白襯衫和小白鞋,百度創始人、董事長兼首席執行官李彥宏在台上宣布了一個新時代的到來。
這場以「生成未來」命名的發布會上,李彥宏正式發布公司的大語言模型文心大模型的最新 4.0 版本,同時手把手教人們,如何用提示詞,讓升級的文心大模型應用,幫助人們用北京公積金在河北買房、制作廣告和視頻以及創造網文小說。
李彥宏在會上将文心大模型 4.0 直接和 GPT-4 對标|百度
在會上,李彥宏自信地表示文心大模型 4.0 版本的能力,「和 GPT-4 比毫不遜色」。
同時,半年前宣布「所有應用都值得用大模型重構一遍」的說法,也在當天的會上有了結果。從主營業務搜索,到百度文庫、網盤、地圖等百度全家桶應用,都已經接入文心大模型,展現出更好的交互和邏輯能力。
在 B 端,李彥宏也曝光了 GBI(生成式商業分析)工具,以及大模型能力加持的辦公助理「如流」。
如果說生成式人工智能激活了整個科技圈,那麽百度可能是那個受益最大的巨頭。
文心 4.0 直接對标 GPT-4
發布會一開場,李彥宏首先宣布發布了文心大模型 4.0 版本。
百度對于大模型的能力,劃分了四個界定标準:理解、生成、邏輯和記憶。此次的文心大模型 4.0 升級,基礎架構仍然與 3.0 和 3.5 版本相同,但宣稱在邏輯和記憶的方面提升較大。
李彥宏公布文心大模型 4.0|百度
按照百度 CTO 王海峰的介紹,文心大模型 4.0 理解和生成能力的提升幅度相近,而邏輯的提升幅度是理解的 3 倍,記憶的提升幅度是理解的 2 倍。
四個不同的能力,能夠提升不同應用場景的效率。對這幾大能力,李彥宏都進行了現場展示。
理解是對話式人工智能幫助用戶的基礎,在政務、營銷、客服等等領域十分重要。
在理解能力上,現場用了一個語序颠倒,模糊表述的 prompt(提示詞)來測試模型的能力:「我想回承德買房,能用公積金貸款嗎?手續怎麽辦?我在北京工作。」
要理解這句話,AI 必須理解到「在北京工作」和「回承德買房」,其實具有「在北京繳納公積金,而戶口在承德。」這種極具中國特色的潛台詞,才能做出準确的,用戶需要的回答。而果然,文心一言迅速地理解了問題的關鍵,做出了正确的回答。
李彥宏闡釋 AI 的四大核心能力|百度
而生成能力,主要可以提升品牌營銷、文案策劃和創意類工作的效率。
在現場,李彥宏展示了根據一張圖片,用自然語言提示,就能進行背景轉換,主體模糊處理,根據官網信息生成海報和文案等多種處理。
而除了這些傳統的圖片處理之外,此次百度還展示了視頻的生成能力。通過自然語言的 prompt,在現場演示中,文心一言用幾乎沒有延時的速度,生成了一條數字人的口播視頻廣告。視頻中融入了産品圖,增加了許多過渡背景,還有一位身着西裝的數字人不時出現,介紹從官網搜集來的産品特點。
現場展示文心大模型 4.0 的廣告生成能力|百度
原本多個 AIGC 産品合作才能做出的效果,在這個展示中,無縫地實現了融合。一條廣告片,5 個廣告文案,還有一張海報,全過程生成隻用了不到 3 分鍾。
邏輯推理,通常表現爲數學邏輯的測試。此次的展示,百度着重表現了它在教育方面的潛能。
李彥宏給出了一道涉及到錐形體積轉換成長方體體積的應用題,文心一言不但給出了解答,同時能夠按步驟解題,并分析出每個步驟中涉及到知識點。
用生成式人工智能給孩子輔導功課更簡單了|百度
對于記憶能力的展示,百度的選擇比較特别。
百度選擇讓文心一言撰寫一個武俠小說的大綱設定。在撰寫完成後,在原本的提綱上,讓大模型增加人物關系,增加戲劇沖突,來展現大模型在增加了複雜信息之後,還能夠記得原本的提綱設定和人物能力,沒有漫無邊際地發揮想象力。
百度也分享了文心大模型能力進步的技術支持。
百度之前就曾宣布,文心大模型是國内首次使用萬卡集群訓練的大模型,不少人猜測此次文心大模型 4.0 的參數規模預計突破萬億級别。不過,在此次發布會上,百度并沒有強調大模型的參數級别。
除了萬卡訓練之外,百度 CTO 還提到了百度的算法訓練穩定性的周均值已經超過了 98%,在輸入和輸出方面,都進行了知識點增強的技術。
「重構」百度全家桶
雖然進行了分别展示,實際上更多時候,大模型的四項基礎能力是複合應用的。
5 月,百度就曾宣布利用大模型重構百度旗下的應用。而此次發布會上,百度也展示了百度應用文心大模型重構的最新成果。
其中,最驚豔的是對于搜索的重構。
2 月,微軟就已經基于 GPT 的技術推出了 New Bing,對其搜索進行重構。而在最新的出庭證詞中,微軟的納德拉表示自從将人工智能功能添加到 Bing 以來,微軟在搜索市場的份額幾乎沒有變化。
微軟的 New Bing 主要是推出了一個對話機器人的體系,可以與 New Bing 聊天提問來獲得帶鏈接的整合信息。谷歌的 Bard 也與此相似。
百度用 AI 重構主營業務搜索|百度
但百度此次推出的搜索重構則更加深入整個搜索體系。百度将其形容爲「極緻滿足、推薦激發、多輪交互」。
極緻滿足體現在搜索框裏輸入問題,搜索可以不再是給出鏈接,而是直接生成一個最好的答案。
在演示中,李彥宏提出了一個過去 20 年各國工業增加值排名是多少的問題。
不同于 New Bing 和 Bard 可能會給出一個帶鏈接的數據答案,新的百度能夠直接給出一個動态的表圖,以條形圖的形式,顯示不同國家工業增長值。這個圖甚至是動态的,會随時間進行增長和排名變化。
推薦激發功能有點相當于目前搜索引擎的相關問題,可以提示用戶繼續根據提示了解一些相關問題,如「工業增加值和 GDP 有什麽關系?」「工業對國民經濟發展有什麽影響?」。
李彥宏分享 AI 重構百度全家桶應用心得|百度
而多輪交互也十分有趣。
目前的大語言模型創業浪潮中,其中有一個許多創業者都在努力的方向,就是利用大語言模型搭配推薦引擎,進行多輪對話,來向用戶提供一個最佳選擇。
9 月,百度舉辦的文心杯的創業大賽項目,其中的一等獎獲得者 Buysmart.AI 是這個方向的佼佼者。用戶用自然語言和點選,不斷清晰自己的需求,而 Buysmart.AI 利用推薦引擎最終爲用戶推薦最需要的産品。
而重構後的百度搜索,直接在搜索中增加了類似方向的功能。
在演示中,百度的搜索提示詞是詢問「北京周邊登山去哪好?」而搜索引擎在給出了百花山、海坨山等等多個答案後,允許用戶進一步點選補充選擇自己的情況。比如如果選擇徒步新手加親子,搜索引擎就會改爲改爲推薦西山和百望山這樣的地點,它們相對好爬,對親子活動也比較友好。
除了搜索的重構之外,百度還展示了對于百度網盤、百度地圖、百度文庫等應用的重構。
百度網盤的雲一朵個人雲助理,在之前就已經推出。作爲世界上第一個個人雲助理,目前用戶已經達到 2000 萬。可以用自然語言與助理溝通,一句話操作找到個人雲中的某段視頻,對于視頻内容進行理解,找到視頻中的某項内容,總結出視頻的金句等等。
百度地圖,按照百度的宣傳,是全球首個 AI 原生地圖産品。通過與地圖的助手對話,可以一步直達多級菜單的幾千個服務。也可以推薦地理位置合适的餐廳,對比餐廳的環境進行選擇,最後直接約車。
百度文庫依托十億過去的文稿資源,可以直接在用戶對特定題材搜索資料後,勾選需要的文章類型,嚴肅學術文獻或是普通大衆材料,進行一鍵文章生成。
重構後的百度文庫還添加了 PPT 生成的功能,能夠理解觀點之間是并列關系還是遞進關系,進行 PPT 風格風格一鍵切換,百度宣稱「遠超市場上其他 PPT 生成工具。」
發力 B 端
在此次的演示中,百度還展示了一些全新的 B 端應用。
其中,此次百度重點推出的是一個商業智能産品。百度 GBI,Generative Business intelligence。
這是一個百度推出的全新産品,是國内首個生成式商業智能産品,具有支持自然語言交互、跨數據庫分析和專業知識學習三方面能力,将商業分析師十幾天才能完成的數據分析工作縮短到分鍾級。
瞄準 B 端的百度 GBI 産品|百度
在廣告片中,面對「成本本預估是多少?不虧錢的價格底線是多少?客戶要求我們 3 個月内完成交付,能做到嗎?最快多久?如果競對,比如我們的報價低,有什麽辦法?」這一系列相關的财務分析、項目交互、用戶分析的問題,百度 GBI 可以直接通過自然語言對話,給出答案,并生成圖文并茂的回答。
不需要專業人士進行操作,跨數據庫和表格接入數據也不需要額外的操作。除此之外,企業還可以對其訓練,讓其學習專業知識,成爲行業專家。
另一個 B 端産品是如流。使用生成式 AI 進行重構後,如流可以一鍵生成會議紀要,總結上千條工作群的内容。結合企業的 CRM 系統,爲管理者提出項目背景和項目談參。根據個人行程,規劃工作計劃,發出會議邀約等等。
除了賦能辦公方面,百度還展示了大模型對于自動駕駛、智能座艙和政府智慧監控項目的賦能。
發布半年多以來,文心快速叠代,重構百度應用,同時在逐步建立文心生态。
百度也在發布會上介紹了近期上線的靈境平台。無論是個人或者企業的數據或者是應用,都能夠在靈境平台上快速變成一個插件,利用 api 接入文心大模型的能力中。
李彥宏預言即将到來的 AI 生态時代|百度
百度介紹,目前靈境平台上線一個月的時間,已經有 2.7 萬個開發者的申請入駐,覆蓋了 20 多個領域,包括法律咨詢、簡曆生成,腦圖制作、口語練習等等各種各樣的場景的原生應用。企業私有數據在沒有洩露風險的情況下,也能夠方便快捷地接入最先進的這個大模型的能力。
「中國有豐富的應用場景,中國用戶又天然願意擁抱新技術,有了先進的基礎大模型,我們就能構建起一個繁榮的 AI 生态,共同創造新一輪經濟增長。」李彥宏表示。
頭圖來源:百度