IT 技術的技術棧正在發生根本性變化。
來源|多知網
作者 |馮玮
圖片來源 | 百度
今天下午,百度就新一代大語言模型生成式 AI 産品 " 文心一言 " 召開發布會。
百度創始人、董事長兼首席執行官李彥宏介紹了當前文心一言在文學創作、商業文案創作、數理推算、中文理解、多模态生成五個使用場景中的綜合能力。
其中的一些能力也同樣可适配到教育場景中。
例如,發布會現場,面對 " 雞兔同籠 " 的經典題型,文心一言能梳理出解題思路,并按正确步驟一步步算出答案;文心一言在現場還解釋了成語 " 洛陽紙貴 " 的含義、" 洛陽紙貴 " 對應的經濟學理論,并用 " 洛陽紙貴 " 四個字創作了一首藏頭詩。
此前,作業幫、高途、學大、昂立、達内、寶寶巴士、藝術寶等教育領域品牌均宣布已接入文心一言。
寶寶巴士官方曾表示:接入文心一言後,寶寶巴士将基于百度智能對話技術成果,研發面向兒童啓蒙的内容産品與服務,并應用于寶寶巴士旗下 200 餘款 APP、2500 多集視頻及 9000 多期音頻啓蒙内容、點讀筆及繪本等産品中……
李彥宏在現場罕見出現了緊張狀态,同時坦言目前的文心一言尚不算完美。
" 但爲什麽今天要發布?因爲有市場需求,因爲百度的各個産品線從搜索到智能雲到自動駕駛到小度,大家都在等着要用這樣的技術。更重要的是我們的客戶、我們的合作夥伴在等着用這樣的技術。" 李彥宏說道。
3 月 16 日起,首批用戶即可通過邀請測試碼,在文心一言官網體驗産品,後續将陸續開放給更多用戶。同時期,百度智能雲即将面向企業客戶開放文心一言 API 接口調用服務預約。
以下爲李彥宏分享全文,經多知網編輯整理。
01
百度真的 Ready 了麽?
尊敬的各位來賓,各位媒體界的朋友們,歡迎大家來到百度參加我們這次文心一言的新聞發布會,感謝大家一直以來對我們的關注和支持。
這段時間其實不斷的有人問我說爲什麽現在發布?你們是不是真的 ready 了?
其實百度在過去的十幾年當中,一直從 AI 研發層面堅持投入文心大模型。
第一個版本是 2019 年就發布了,那麽此後的每一年其實都要發布一個新的版本。所以從這個意義上說,文心一言的發布隻是我們過去多年努力的一個自然延續。
今天大家對文心一言的期望值是要對标 Chat GPT,那這個門檻還是很高的,可以說全球的大廠當中百度是第一個發布的,像 Google、Facebook、Amazon 等現在都沒有真正的發布同類型的同級别的産品,百度是第一個。
從我自己在内測對文心一言的能力體驗來說,它确實也不能講叫做完美。但爲什麽今天要發布?因爲有市場需求,因爲百度的各個産品線從搜索到智能雲到自動駕駛到小度,大家都在等着要用這樣的技術,更重要的是我們的客戶、我們的合作夥伴在等着用這樣的技術。
大家都在催,我們需要盡早地把它發布出來。
當然,一旦大語言模型這種産品發布出來,它就會獲得真正的、真實的用戶反饋;而有了用戶反饋,它的叠代的速度就會非常快,能力提升也會非常快。
我們大家都希望文心一言能夠快一點成長,能夠盡早給用戶和客戶帶來價值,讓所有的人都從中受益。
所以 " 十月懷胎,一朝分娩 ",今天我就帶大家一起來看一看,百度的預訓練生成式大語言模型,文心一言長什麽樣?
我下面用 5 個 Demo 來分别展示一下文心一言的能力。
02
五個模塊,五種能力
第一個是文學創作,第二個是商業文案的創作,第三個是數理邏輯的推算,第四個是中文的理解,第五個是多模态的生成。
首先來看一下文學創作。
這就是我們文心一言的界面,先來看一個有關三體的例子。
三體的作者是哪裏人?想先要知道三體作者是誰,然後要懂得哪裏人是什麽意思,因爲是跟我老鄉,所以第一個問題選了可以總結一下三體的核心内容,如果要續寫的話,可以從哪些角度出發?
那麽他總結了三體的第一步是什麽意思?第二步在講什麽?第三步在講什麽?續寫又是角色的塑造,情節設計、文化背景、哲學思考。
那麽我們追問如何從哲學角度來進行續寫生命的意義,人與宇宙的關系,道德和倫理價值和信仰,科技和人文的關系。
再問電視劇三體的演員都有哪些?他比較準确的列出了一系列的參與的演員,那麽我們再問于和偉和張魯一有哪些共同點?都是優秀的實力派演員獲過多多個獎項,豐富的表演經驗等等。
最後問于和偉和張魯一誰更高?那麽張魯一比于和偉高三厘米。
我們看到在這一輪的問答當中總共有 6 輪對話,這些對話可以體現出文心一言總結分析能力、推理的能力還有總結的能力等等。
你要問誰和誰相比更高的話,你先得明白對這個人身高是多少,那個人身高是多少,然後再做一些比較很多這種事實性的東西。
這其實對于一個搜索引擎來說不是那麽難,但是對于一個生成式預訓練大模型來說,它出錯的概率還是挺高的,這些問題都答對相當不容易。
文心一言其實也采用了知識增強和檢索增強,我們有 5500 億的事實知識在訓練數據裏,所以可以相對來說保證事實性的問題能夠比較準确。
第二個 Demo 是商業文案的創作。
好,如果要成立一個用大模型服務中小企業數字化升級的科技服務公司,應該給它起個什麽名字?信智科技、數字雲圖、雲集科技、意象科技、魔方科技,好,數字雲圖這個名稱不錯。
那麽給我起一個公司的服務的 slogan 來表達共赢的概念。
答案就是數智共赢、智慧未來。
當我生成一篇公司成立的新聞稿,數字雲圖,以共赢的服務理念,用大模型來服務中小企業的數字化升級,要求是 600 字左右,所以也生成了相應的新聞稿,我就不一個字一個字念了。
大家可以看到這裏頭涉及到相應的這種理解的能力,表達的能力,也包括一些這種創意創作的能力,這些個能力都是沒有辦法我們去一一的去教文心一言的,那麽怎麽做到的?
其實還是要有好的技術,要有大的數據,人們說讀書破萬卷,那麽文心一言可能讀了千億萬億的頁面,用了幾十億的搜索請求,用了很多的圖片,用了我們全部的知識圖譜的這些個 5500 億的事實。
在不斷訓練的過程當中就逐步具備了一些比較通用的能力。
所以也有人講說是大模型到了千億的參數千這個參數達到千億量級,那麽又有足夠多的訓練語料數據來進行訓練的時候就會發生什麽現象?發生智能湧現,沒有教過他的能力,他也會這個可以說是我們這方面的一個例子。
第三個 Demo,我們來演示一下數理邏輯的推算。
下面我們來玩一個雞兔同籠的遊戲。
問有多少隻雞多少隻兔子?文心一言說這題好像出的不太對,算不出來了,我們改一下,重新問一遍。
解題思路是這樣子,答案 3 隻雞和 6 隻兔子,所以我們看到在這兩輪提問當中展現出來的能力,使文心一言大語言模型它的數理邏輯的推理的能力,這方面它不僅知道就是提出的對不對,也不僅僅能夠簡單的給出來答案,那麽也給出來了解題的步驟,這就很像是小學生在解這個應用題了。
它是有邏輯的一步一步的推理出來的。
這樣的能力我們在過去一個月左右的這種内測當中,其實不斷的看到文心一言在進步,雖然我們現在還不敢說是百分之百這類型的題都能做對,但是他的能力已經是挺強的了。
第四個 Demo,我們來演示一下對中文的理解。
因爲百度是植根于中國市場的,我們理應在中文的理解和對中國文化的了解上,超出世界上任何一個預訓練大模型。
" 洛陽紙貴 " 是什麽意思?你必須得知道這個成語,你才能夠明白才能答對。當時洛陽的紙到底有多貴,這就有點冷知識了,不是那麽容易能夠答對的。大家也看到好像漲了兩三倍,這個成語在經濟學原理裏頭對應的理論是什麽?他很明确的答出來,這是一個需求定律,就是 " 物以稀爲貴 "。
最後我們用洛陽紙貴來寫一首藏頭詩,每一個首字連起來是洛陽紙貴成語。
文心一言在中文理解能力和對中國文化的這種熟悉程度其實是相當高的,它也可以處理英文,隻不過确實要承認他的對英文的這種理解和處理能力,現在還沒有中文這麽好。
部分原因是因爲我們在訓練數據裏頭給它注入的英文的數據還沒有那麽多,在接下來的時間我們會逐步的訓練他英文以及其他語種的這些能力,以及将來這種跨語種的翻譯推理的能力,那麽大家有機會将來可以慢慢來嘗試。
第五個 Demo 是多模态的生成。
請爲 2023 世界智能交通大會來創作一張海報,那麽大家看到其實反應是很快的,而且海報很有未來感也很貼切,那麽你認爲智能交通最适合哪個城市發展?上海、北京、廣州、成都。好,再來一個多模,請用四川話将以上内容講出來。
這時候發展智能交通的應該是那些具有較高人口密度,經濟發達,交通需求量大的城市,接下來是一些可能适合的城市。
一上海作爲中國最發達的城市之一,上海擁有着繁忙的交通網絡和多元化的交通需求,自然交通可以幫助緩解城市家交通壓力,提升城市交通效率,改善城市居民出行體驗。好。
請将以上内容生成視頻。
最适合發展智能交通的應該是那些具有較高人口密度,經濟發達,交通需求量大的城市,以下是一些可能适合的城市。
一、上海作爲中國最發達的城市之一,擁有着繁忙的交通網絡和多樣化的交通需求,智能交通可以幫助緩解城市交通壓力,提升城市交通效率,改善城市居民出行體驗。
二、北京是中國的政治中心、文化中心、國際交往中心。
大家看到生成的視頻也是非常的相關,而且還挺美,所以我們這一輪交互分别看到它可以用文字生成圖片,可以回答相關的問題,有一定創造性的問題可以用語音,方言大概就是我們演示了四川話,其實它廣東話、東北話、閩南話什麽也也都能講,最後是用這些内容來生成視頻。
前三個 Demo 現在文心一言的用戶都可以用了。
第四個因爲計算成本還是比較高,我們還沒有對所有的一言的用戶開放,但是如果你是百家号的創作者的話,你肯定對這個功能其實是不陌生的。現在大概每天有幾萬篇的百家号的文章,通過這個技術會自動的轉成視頻,在百度裏頭分發,所以這些技術我們已經都把它連起來了。
那麽通過這 5 個例子的演示,大家會對文心一言行程一個基本的概念。
從文心一言的表現來看,它其實已經具備了很多像人類的這種對自然語言的理解的能力、表達的能力、邏輯推理的能力,這些個能力還在不斷的完善的過程當中,我們有時候用的時候會感受到驚喜,有時候可能也會發現明顯的錯誤。
但是有一點是肯定的,就是他的進步的速度非常的快。在未來的一段時間當中一定是一個日新月異的這樣的狀态。
我們通過對文心一言大模型進行微調,讓他去适配百度内外各種各樣的産品,那麽就可以在用戶界面或者說在用戶體驗上展示出來驚人的親和力,讓每一個産品都離自己的用戶離自己的客戶更近。
所以文心一言這樣的一個大模型會成爲每個人必不可少的生産力工具,無論是什麽樣的公司都不可能在幾個月的時間裏頭靠突擊做出來這樣的技術,那麽它是百度十幾年超大規模的這種研發投入慢慢的積累出來的。
所以我們如果說來進一步解釋文心一言到底怎麽能做出來的話,我需要把我對于 IT 領域最近發生的一些變化來跟大家分享一下。
03
IT 技術的技術棧正在發生根本性變化
過去 IT 的技術站其實分爲三層,一層是芯片層,上面是操作系統層,再往上就是應用層或者軟件層。這個事情在 PC 時代、在移動互聯網時代都是這個樣子。
但是當我們進入 AI 時代的時候,IT 技術棧從 3 層變爲了 4 層,也就是這裏展示的芯片層。
當然芯片層跟過去的芯片也不太一樣:過去以 CPU 爲主,未來很可能會以 GPU 爲主了。再往上我們叫做框架層,比如說像百度飛槳這樣的叫做框架。
上面就是模型層,今天文心一言就處在模型層。文心是百度整個模型的一個品牌,以後或者說 AI 時代的應用都會基于這些大模型來進行開發。所以以後不管是搜索也好、聊天也好、或者什麽其他的應用,都會是基于域性鏈的這種大模型來進行開發。
百度每天比如說搜索有數十億的這種檢索請求,也就意味着文心大模型每天在服務數十億的用戶了,隻不過,過去在服務搜索的時候,它是一個判别式的語言大模型。
今天文心一言的發布它是一個生成式的語言大模型。
爲什麽講技術棧的變化?
大家知道生成式樣的這種 AI 是非常耗算力的,有時候人們把它叫做暴力美學,要有大算力,要有大模型,要有大數據,那麽費用相當的昂貴。4 層架構之間相互進行協同,不斷的進行優化,就可以使它的效率比别人要高很多,就可以顯著地降低成本,尤其是在框架層的模型層之間的這種協同,過去我們在幾個月其實已經體會到了這方面帶來的這種收益。
講這 4 層,其實我真正想講的是:在全球範圍内、在芯片框架模型應用 4 層都有領先産品的公司,可以說是絕無僅有,百度就是那個唯一。
我們的優勢非常獨特,這個優勢相信大家在未來的文心的叠代速度上可以會有明顯的感受。
從 2 月 7 号我們正式官宣文心一言要發布以來,也就一個多月一點的時間,已經有 650 家的企業宣布接入文心一言的生态。這意味着很多企業其實已經明白這是一個大機會,這是任何一個企業都不應該錯過的大的機會。
生成式 AI 它是代表了一個新的技術範式,它會帶來市場需求的爆發性增長,商業價值的釋放會是前所未有的、指數級的。
對于文心一言的定位,我們認爲它是一個通用基礎模型,在 4 層結構上看到可以有能源大模型,交通大模型,媒體大模型等等。
所以文心一言不僅僅會影響到搜索,也不僅僅是會影響到互聯網公司,那麽它會影響到每一家公司。由于它超強的自然語言理解能力、表達能力以及推理能力,它可以使得任何一個公司都能夠離自己的客戶更近。
也就是說,任何一個公司都有可能利用這些能力做出更好的用戶體驗,從而建立更強的競争優勢。
我看到有機構預測,到 2030 年腦力勞動者的生産效率會因爲人工智能而與今天相比有 4 倍的提升,也就是說很多人他的工作性質會發生不可逆轉的改變。
04
大語言模型将帶來的三個産業機會
文心一言的發布,或者說生成式大模型的問世會帶來哪些個創業機會、投資機會?我覺得至少有三方面。
首先我把它叫做新型雲計算。
大家知道雲計算在當下最主要的商業模式叫做 IaaS。這是公有雲提供的基礎雲服務,主要是算例。那麽現在今天在哪要建一個智算中心,通常是我要多少匹的算力對吧?主要是指的這個東西。未來的雲計算公司主要的商業模式會變成 MaaS,以後的應用會建立在大模型上,而不是建立在過去的雲計算的這些算力或者存儲上。
這個對于雲計算産業是一個 Game changer,是一個改變遊戲規則的東西。
以前大家看你的基礎雲服務,看你的算力,看你的存儲,今天會看你的模型好不好,你的框架好不好,你的芯片框架模型應用之間協同的好不好、效率高不高?
百度智能雲會基于這套理念和這套架構對外去提供服務,賦能千行百業。
我們相信它會使得各行各業在提升效率、在各自領域的應用當中能夠有很大的商業機會和效率的提升空間。
随後可能過兩個星期,我們智能雲會有一個單獨的發布會,我們會具體介紹相關産品,既有的公有雲服務也可以做私有化部署。
第二類機會我們把它叫做行業模型的精調。
剛才 4 層架構裏頭其實在模型層我們沒有把文心放上去,而是放了各種各樣的行業的這種大模型。
是因爲我們覺得很可能是存在這麽一個中間層的,任何一個行業都有它自己獨特的數據,都有它對自己的行業的獨特理解。這些個數據、理解和知識如果跟基礎大模型進行結合,就會産生很強大的創造力和效率提升的能力。
這些個能力很可能不是百度所具備的,甚至這些數據也不是别人願意給到百度的。那麽這些能力在各個行業的精調可以避免我們剛才講到的那些基礎模型容易犯的錯誤,所以它的實用性會更強。
我們認爲這也是一類新的商業機會。
第三個就是應用開發。
那麽剛才大家看到文字的生成、圖像的生成、音頻的生成,以及我們熟悉的數字人三 D 等等,這些個能力一旦結合,再加上它超強的理解能力和表達能力,那麽會創造出來很多新的可能性。
所以大模型時代真正最大的機會,既不在基礎服務,也不在這個行業服務,我覺得恰恰是在應用。
就好像在移動互聯網時代,最大的商業機會可能不是 iOS 或者說安卓這樣的操作系統,而是微信、抖音、淘寶這些個應用一樣。
那麽在人工智能時代,我相信一定會出現殺手級的應用、現象級的新的産品,大家會不斷看到一個個裏程碑事件的發生。
最後我想說在文心一言發布之後,我們就會建立起來一個好的這種反饋閉環:用戶的真實的反饋,開發者的模型的叠代以及開發者的調用之間會形成一個正向的循環,給大家士别三日當刮目相看,這樣一個驚喜。
最後我想說,文心一言不是中美科技對抗的工具,而是一代代百度技術人員在追尋我們讓科技改變世界的夢想當中的一個自然的結果,是我們服務億萬客戶,賦能千行百業的最新的平台,更是創新驅動發展的最佳的證明。
謝謝大家的理解和支持。
END
本文作者:馮玮