文|林炜鑫
編輯|鄧詠儀
5 月 18 日,第七屆世界智能大會在天津舉行,百度 CEO 李彥宏發表了題爲《大模型改變人工智能》的演講,再次闡述他關于生成式人工智能的思考。
李彥宏表示自己不擔心大模型會減少人類的工作機會,同時透露,百度自研的 " 昆侖芯 " 第三代會在明年年初上市。
過去半年,OpenAI 開發的 ChatGPT 徹底出圈,使生成式人工智能受到前所未有的關注。研究機構預計,未來 10 年很多工作的效率會成倍提升。越來越多人意識到,大模型将大幅度解放人們的生産力。一些悲觀的聲音認爲,現有的大量工種将被 AI 取代,到時可能的失業潮将引發不可預料的社會問題。
李彥宏較爲樂觀," 大家能夠看到現在的工作會消失,但是我們看不到什麽新的工作機會會被創造出來 "。他以工業革命爲例,蒸汽機的發明和應用導緻井下背水的工作消失了,但同時又創造了更多新的工作。每次生産力的解放,最後都會讓人們的生活變得更好。
AI 不會搶走人類的工作,相反,AI 加持的工作有更多想象空間。李彥宏舉例,大模型會重新定義營銷和客服,未來每個客戶都可以獲得全天候的專屬助理的服務。
人工智能時代也革新了 IT 行業。過去的技術棧是三層(芯片—操作系統—應用),如今變爲四層(芯片—框架—模型—應用)。以芯片爲例,未來的主流将是 " 以 GPU 爲代表的,新一代适合并行大規模浮點運算的芯片 "。
百度早在 2013 年左右就開始研發人工智能,2019 年發布了文心大模型的 1.0。兩個月前,百度推出了對标 ChatGPT 的大模型産品 " 文心一言 ",引起市場關注。
李彥宏介紹,百度在這四層都有比較領先的産品,其中百度自研了十年之久的芯片 " 昆侖芯 ",目前有兩代産品,幾萬片的部署,第三代也有了明确的上市時間。
演講最後,李彥宏表示百度會長期持續在人工智能方面進行投入,他強調,人類最大的危險不是創新帶來的不确定性,而是不創新不進步造成的停滞。
以下爲李彥宏演講實錄:
各位領導、各位嘉賓:我今天給大家帶來的題目叫做《大模型改變人工智能》。剛才龔克也講了,人工智能在過去這半年當中,受到的關注度比以前高了很多,最主要的是因爲出現了生成式的人工智能。而生成式人工智能底層技術,實際上就是大模型。
那麽大模型爲什麽會改變人工智能呢?是大算力、大模型、大數據,導緻了智能湧現,什麽叫智能湧現呢?過去的人工智能是,我想讓機器學會什麽技能,就教它什麽技能。教過的有可能會,沒教過的就不會。大模型出現所謂的智能湧現之後,以前沒教過的技能,它也會了。這就是爲什麽有人講,我們現在朝着通用人工智能方向發展。
與此同時,人工智能發展方向從辨别式走向生成式。什麽叫辨别式?我們過去比較熟悉的人工智能的應用,基本上都是辨别式。比如說人臉識别,過來一個人,我識别這個人是誰,或者不是誰。這個是典型的辨别式。搜索引擎也是典型的辨别式人工智能。用戶輸入關鍵字或者一段話,他要找的東西,我們在全網進行匹配,哪一個網頁,哪一段内容是他需要的,這是辨别式人工智能。
什麽叫生成式人工智能?今天我想寫一份申請書,你給我寫一下。或者說,我周末請客,10 個人,需要出一份菜單,這個無所謂對錯,但是它能給你一些感覺,給你一些創意,給你一個好的基礎去發展你的思路。或者說,給我畫一幅車水馬龍的圖片。這種東西,過去人們不覺得是人工智能應該做的事,現在可以做了。
那麽這樣會導緻什麽呢?導緻人們的工作效率大幅度地提升。比如說,在内容創作、客戶服務、翻譯這些工作,它的效率會大幅度地提升。所以我們也看到,很多研究機構都認爲,在未來的 10 年,很多工作它的效率會成倍成倍的提升。同時也帶來一些擔心,是不是這樣的效率提升,會使得很多人的工作就沒了?這些人工作丢掉之後,會不會給我們人類帶來不可預知的問題。
其實這個事兒我也講過很久,最好的去探知答案的方法,實際上是回顧過去。因爲很多人也覺得,人工智能是第四次産業革命的标志,我們可以看看之前的産業革命都取代了哪些工作?
200 年前,從井下背水的工作基本上消失了。第一次産業革命是蒸汽機的發明,蒸汽機發明第一個應用就是采礦的水,怎麽能夠把它用機器弄上來。井下背水這些工作的消失,帶來了什麽?我們來看一下,實際上産生了很多新的工作。
這 100 年,我們看到世界人口出現了高速增長,跟之前的一兩千年人口增長速度相比,快了很多。與此同時,人均 GDP 也幾乎是在同樣地快速增長。這說明什麽?說明雖然有些工作機會沒了,但是更多的機會出現了。人們工作效率的提升,可以養活更多的人,而每個人的生活又變得比以前更好了。從井下背水那個工作,真的不是什麽好工作。
100 年前,馬車夫的工作消失了。這張圖片是 1913 年紐約第五大道的一張圖片,這張圖片裏幾乎已經全部都是汽車,隻有一輛馬車。那會兒,紐約到處都是賣馬肉的,馬也沒用了,後來出現了很多新的工作。1900-1990 接近 90 年,同樣的規律,世界人口繼續高速增長,每一個人創造的價值繼續高速地增長。
30 年前,我們這一代人親身經曆,也就是我大學畢業前後,什麽工作消失了?打字員的工作消失了。現在年輕一代沒有見過打字機的,但也出現了很多新的工作。同樣的規律,世界人口繼續高速增長,人均 GDP 繼續高速增長。
曆史雖然不會重複,但是确實有它的規律。那麽這一次,爲什麽那麽多人會擔心 AI 會讓工作機會減少呢?我覺得是因爲,大家能夠看到現在的工作會消失,但是我們看不到什麽新的工作機會會被創造出來。就像 100 年前、200 年前那些人,看不到後來産生的新的工作機會一樣。我個人是屬于樂觀派,我不擔心大模型會導緻人類工作機會減少、生活會變差。
那麽大模型怎麽重新定義的人工智能?剛才萬鋼主席也講了,人機交互的方式發生了變化。其實過去幾十年信息産業的發展,人機交互的方式發生了三次變化。
更早我們就不說了,命令行是我讀大學讀研究生的時候,主要的工作界面。人機進行交互,是通過命令行。我輸入一個命令,它給我想要的反應。我當時覺得這個東西效率很高,但是大多數人不會這種操作。
更簡單的人機交互方式是什麽?是圖形用戶界面(GUI)。這個起碼很多人能看懂了,比第一個要更友好一些。但它仍然不是最自然的交互方式。我要想搞清楚怎麽重設一下電腦的自動睡眠時間,我得經過四級菜單,一層一層地點進去,才能找到這個位置。有多少人能記住四級菜單以後,每一個功能在哪?
人工智能的誕生,讓我們可以用自然語言跟電腦進行交互。當我有需求的時候,比如說我想查一下上個月,2023 年 4 月,我的公司每一個産品線,有哪些産品的毛利率超過了疫情前的水平?這樣一個課題,在過去很可能需要我的助理花半天一天的時間才能獲得。今天,如果計算機懂你的自然語言,一秒鍾之内就可以給你一個表格。
大模型也會重新定義營銷和客服。其實道理很簡單,就是誰擁有最佳的跟客戶溝通的方式,誰就會擁有這個客戶。這個道理不是因爲 AI 的産生,不是因爲大模型的産生,隻不過技術使得我們實現的可能性,變得比以前多了很多。今天即使你有 70 億個客戶,你的每一個客戶也都可以有一個專屬的 7 × 24 小時的、什麽都知道的助理去服務他。
大模型是一個基礎,大模型之上會有各種各樣人工智能的應用。最近這段時間讨論比較熱的是,AI 時代的原生應用到底長什麽樣子?我給大家舉幾個例子:
比如說像 DoNotPay,這是什麽呢?比較典型的應用場景是人工智能律師。比如說,你在美國開車超速了,超速之後警察給你一個罰單,一般交幾百塊錢。其實你可以不交,你請一個律師幫你打官司,就可以不交了。但是請一個律師的錢,可能是罰單錢的兩倍,所以你不請了。今天請 AI 當律師,你就可以不交那個錢。
Jasper 是營銷創意的生成工具,你的公司想要出什麽樣的創意,它來幫你出,所以效率高很多。
Speak 是韓國的軟件應用,實際上是教你學外語的,模拟各種場景,你要到餐館點餐,跟對方談判,你要跟對方怎麽交互,上百種語言都可以做得非常好。
對于百度來說,我們的大模型叫文心一言,兩個月之前發布的,應該說是在全球大廠當中是第一個發布的。之所以我們要盡快地發布出來,是因爲市場有非常強的需求。目前有 200 多萬的用戶在排隊等待進行測試,也有十幾萬家企業希望接入文心一言進行測試。
當然百度在這方面的投入,實際上不是剛剛開始的,不是這半年才開始的。我們從 2019 年發布了文心大模型的 1.0,到現在已經有四年的時間。更早的時候,我們從 2013 年左右就開始人工智能投入了。
人工智能之所以有這麽大的變化,其實不僅僅是它的應用場景的變化,實際上背後的技術棧也發生了非常根本的變化。
我們每個人都熟悉的 IT 的技術棧是這三層,底層是芯片層,典型的公司是英特爾、AMD、高通,它的芯片叫做 CPU;中間層是操作系統,在 PC 時代就是 Windows,在手機時代是安卓和 iOS;上面是應用層,PC 時代所有的人都給 Windows 開發軟件,在移動時代所有的人都給安卓和 iOS 開發應用。
今天人工智能時代的到來,改變了這個格局。現在的 IT 技術棧變成了四層,底層仍然是芯片層,但是主要的芯片已經不是 CPU,而是以 GPU 爲代表的,新一代适合并行大規模浮點運算的芯片。上面我們叫做框架層,就是深度學習的框架,像百度的 PaddlePaddle 飛槳,Meta 的 PyTorch,谷歌的 TensorFlow 都是在這一層。再上面一層是模型層,今天的 ChatGPT、文心一言等等,這些是屬于模型層,以後 AI 時代的原生應用,都會基于大模型來進行開發。
這方面百度有比較明顯的優勢,我們在四層當中每一層都有比較領先的産品,比如說芯片層有昆侖芯。這個也做了有十年之久,最早是因爲搜索應用需要,我們買别人的芯片,畢竟太貴了,所以自己開發了。框架層是飛槳,飛槳今天在中國的市場份額第一。在模型層是文心大模型,其實除了文心一言,它是對标 ChatGPT 的之外,我們還有很多行業大模型,如交通大模型、能源大模型等。應用層的話,像百度搜索等都是我們比較領先的應用。
這四層都有比較領先的産品或者技術,有什麽好處呢?就是你可以進行端到端的優化,每一層可以給其他層反饋,根據這些反饋你可以綜合的、統籌的去考慮怎麽優化。
百度在芯片層的布局,就是昆侖芯,我們已經有兩代産品,幾萬片的部署,無論是公司内還是公司外都在應用。昆侖芯第三代,會在明年年初上市。
在框架層,飛槳的框架在中國人工智能領域已經有了 500 多萬開發者,也越來越獲得大家的認同。
模型層剛才講了文心一言,在各種使用場景都有不少的應用。未來,我相信會有更多的應用會基于文心大模型開發出來。
在應用層大家比較熟悉的是百度的搜索,百度不可能在應用層什麽都做,我們除了搜索之外,還做了跟交通有關的應用。交通也是非常複雜,而且影響非常廣泛的方向。
百度做的其實主要是兩件事,一個是自動駕駛,或者是無人駕駛的技術,一個是智能交通。無人駕駛我們做了有十年時間,現在在武漢、在重慶都可以進行商業化的無人的運營。智能交通我們也做了有好幾年了,在不少城市都證明了效果,通過智能的調整紅綠燈變燈的時間,可以讓我們的城市的交通效率有 15% 到 30% 的明顯提升。五一長假之前最後一個工作日,很多人也注意到,北京是大堵車,從二環到五環,甚至在六環都是紅的,唯一一片綠的是亦莊,亦莊有智能交通的人工智能系統,可以動态調整交通流,所以效率确實是被證明有明顯的提升。
我們也很期待未來在大模型之上,會有各行各業各種應用能夠找到好的應用場景,能夠獲得效率大幅度的提升。
最後,我想說對于人類來說,最大的危險,最大的不可持續,并不是創新帶來的不确定性。相反的,我們停止創新,不發明不創造不進步,按照慣性走下去,所帶來的各種各樣不可預知的風險,才是人類最大的威脅。這就是爲什麽,百度在這麽多年長期持續的在人工智能方面進行投入,也是我們爲什麽要把百度的使命,在多年前就定義成 " 用科技讓複雜的世界更簡單 "。
謝謝!