2023年,在以ChatGPT爲代表的生成式AI的湧現下,AI又一次站在了科技的曆史舞台中央,AIGC這個詞持續升溫,一直火到了現在。而這種火爆的現象大概率将繼續延續下去。
在此期間,将湧現越來越多的AIGC應用場景,這裏面即包含消費側的應用,也包括行業側、企業側的應用。
近日,博鳌亞洲論壇 2024 年年會"AIGC改變世界"分論壇上,加州大學伯克利分校計算機科學教授斯圖爾特·羅素,中國工程院院士、清華大學智能産業研究院張亞勤,高通無線技術中國區董事長孟檏,中國科學院自動化研究所、聯合國高層顧問專家曾毅,科大訊飛研究院副總裁劉聰,猿力科技副總裁程群等嘉賓,就AIGC發展現狀、趨勢,人工智能發展所面臨的挑戰與風險,以及相關産業發展前景等問題進行了深入的讨論。
斯圖爾特·羅素表示,雖然大模型的能力現在已經非常出色了,但是仍存在較大的技術缺口,而在羅素看來,模型不是越大越好,"我并不認爲進行簡單的擴展讓模型越來越大,通過大量的數據訓練就能彌合技術缺口,"羅素強調,"目前主要的問題是:系統無法從收到的訓練數據中生成有用的東西,這就涉及到了模型構建的方式方法等方面的問題。"
同時,羅素指出,構建真正優秀的大模型需要開展國際合作,更需要加強監管,大模型的開發者需要更多的向公衆"展示"模型的安全可靠性。
在過去的一年間,AIGC相關産業如雨後春筍般快速成長,整個行業可以說是"一天一個樣",對此,張亞勤也表示,在近一年的時間内AIGC發展迅猛,整個産業在一年的時間内産生了翻天覆地的變化,這種變化包括了技術、産品,以及生态等諸多方面。同時張亞勤表示早在2017年前後,就與斯圖爾特·羅素就AI的相關話題展開過讨論,"時至今日,風險和安全的問題依舊是整個AI行業所需要面臨的首要問題。"
與此同時,張亞勤還在會上對大模型未來的走向做出了研判,他表示,首先,大模型已經開始向着多模态的方向演進;其次,AI大模型已經走向了自主智能的方向,可以自主制定目标、規劃任務,自我制定路徑、完成方案、進行編碼;再次,人工智能技術将進一步向邊緣終端側滲透,手機、PC、汽車等終端将成爲人工智能發展的重要方向。
AIGC的火爆也對各個行業都帶來翻天覆地的改變,就像雲計算當初讓每個行業都産生變革一樣,AIGC也将會重塑每一個行業。會上孟檏表示,人工智能帶來的創新不僅是讓雲端大模型産業具備交互式的能力,以及to C的一些應用,人工智能帶來的是對每個人今後工作、學習、生活等方方面面的改變。孟檏以移動通信行業爲例,他指出,在移動通信網絡部署裏生成式人工智能的應用能夠改善網絡的部署、減少耗電,減少功率的輸出、對電池環境的改善都有幫助。
談及大模型落地的最佳模式時,孟檏表示,混合式的模式更适合大模型的落地,"采用端側和雲上混合部署的模式,一方面可以保護端側的數據安全和隐私,另一方面又具備雲計算所帶來的高彈性、高性能等優勢。"孟檏指出。
雖然AIGC發展勢頭迅猛,但離真正的成熟應用尚且存在一定差距,針對此,曾毅表示,從行爲上看,現在的AIGC還是會犯一些人類都不會犯的錯誤,産生一些"幻覺"的問題,這說明現在的人工智能系統還隻是一個看似智能,但還沒有達到真正智能能力的系統。
與此同時,曾毅指出,未來,整個行業需要關注的不僅是如何把人工智能做的更安全,"人工智能學習的速度遠超于人類學習的速度,如果人類不去反思,最後給人類帶來災難性風險的不是人工智能,而很可能是人類自己。"這是曾毅對于人工智能未來風險的重要研判。
在AIGC的浪潮下,國内也有很多的企業積極布局大模型相關産品,科大訊飛就是第一批入局的玩家之一。劉聰在會上表示,過去一年間,中國在通用大模型和産業應用層面也做出了非常多的努力,包括颠覆了傳統的編程,給科研工作帶來了新的範式等諸多嘗試。
不過,在劉聰看來,從現階段發展水平上看,中國與國際頂尖水平仍存在一些差距,而未來企業之間主要的競争點還是在底層的基礎大模型能力方面,"我仍然認爲現在整個通用大模型發展是系統性的機制,但是主戰場我認爲還是底座大模型。"劉聰強調。
除了基礎大模型以外,在落地的應用和生态建設層面也将成爲接下來國内外關注的焦點,在劉聰看來,通過與不同行業的龍頭企業共建大模型,以及打造開放創新平台等方式,多管齊下,才能打造出高質量的,能賦能業務的行業級大模型産品。
确實,消費側的應用僅是大模型展現能力的一小方面,大模型真正的價值和能力需要在行業側展現,對此程群在會上指出,大模型技術在演化和推進的過程中還有一個重要的方向——與各行各業業務深度融合。
在程群看來,大模型的發展要遵循兩個核心理念——一個是應用爲王,另一個是以人爲本。而這兩個方面都有一個共同的導向——與行業深度融合,程群以教育行業爲例分享了他對于大模型與行業深度融合的一些真知灼見,他表示,通過人工智能技術,更低邊際成本地讓技術流動起來,可以讓每個人都能享受到高質量的教育,這是人工智能需要以人爲本追求的一個方向。
以下爲"AIGC改變世界"論壇實錄,經钛媒體APP整理:
主持人:大家早上好,非常歡迎大家在博鳌論壇的今天議程中第一個環節選擇了我們的論壇,非常感謝。我們的題目圍繞的是AIGC怎樣改變世界。
在過去的兩三年讓所有人都大吃一驚,包括科學家在内,我們看到AIGC打開了一扇新的門,讓人工智能有一個巨大的可能接近人類智能突破的一種新的路徑。我們在這個過程中看到ChatGPT,在ChatGPT之前已經看到了有GPT的1、2、3,通過這樣一個模式閱讀了人類過去所有的知識,開始接近人類的智能。去年和今年我們又會看到,尤其是今年的SORA又試圖看人類所有的視頻和音頻因素,試圖在物理世界建立一個模拟器。無論是文本還是視覺,似乎都通過AIGC的這樣一種架構逼近未來可能的AGI。在這個過程中人工智能實現了非常大的突破,突破不僅僅在AIGC,所有的跟AI相關的研究都在大的路徑上全面向前推進。還有兩個重要的相關領域,AI在推動所有的科技變革,這是我們昨天另外一個讨論的内容。還有一塊是智能機器人,不僅有大腦,最後還有一個像人一樣的外形,這三塊共同構成人工智能,改變人類經濟社會和整個世界的重要三個支柱。在這個意義上我們非常快地在進入一個人類過去可能沒有想清楚的未來,在這個未來中人工智能可能和人一樣聰明,而且可能會是人類最好的助手,但是人類也充滿了對未來的擔憂,我們是不是會被取代。所有這些議題都令人極度的興奮,同時也讓人焦慮。因爲我們有這麽多重要的讨論,所以很快地進入到我們今天主要的議程。
首先有請斯圖爾特·羅素,他是今天早上淩晨3點才來到博鳌論壇的,他在1990年代開始出了一本書《人工智能:一種現代的方法》,這本書是人工智能領域非常經典的教科書,在一千五百個國家被大家所使用。我們歡迎羅素教授跟我們簡單做一個開場,兩三分鍾時間。
斯圖爾特·羅素:非常感謝主持人的美言介紹,我非常高興能夠回到中國,雖然隻是很短的一段時間。當然其實我想說的3分鍾肯定是不夠了,但是我們也隻有這些時間。
首先我想要提醒各位,AI的目标到底是什麽,我們到底要拿AI來實現什麽?
在過去的75年,我們試圖構建AI系統,能夠在任何領域具備人類的一些功能,現在是時候我們要問這個問題,我們是否成功了?
我認爲還沒有成功,我認爲大語言的性能,例如GPT4已經非常優秀了。如果我們生活在一個可以一觸即發就能獲取智能世界當中,會是什麽樣的感受。但是我還是相信有很大的技術缺口,而且我并不認爲進行簡單的擴展讓這個模型越來越大、訓練更多的數據就能夠彌合這個差距,這個差距主要是:系統無法從收到的訓練數據中生成一些東西。
可能現在的文本接受度已經能夠比一般人閱讀的量大數十萬倍,但還是有一些基本的問題。這是因爲模型構建的方法,他們是電路,電路是沒有辦法用語言來表達非常複雜的事件,它是需要更多的訓練數據才能夠理解一些概念。當然也是有一些突破的,可能甚至跟一些傳統的AI方法有所結合,我們用了更多的表達性的語言,比如說編程語言,他們可以表達任何的事情,這也是爲什麽我們把圖靈看作是計算機科學的使者。
如果說出現了突破的話,後面結果是什麽呢?1951年圖靈就問了這個問題,它說我們需要預計機器能夠掌握控制,這也是我在過去十年思考的一個問題,我們如何在面對比我們更強大的機器的時候保持掌控權,這需要我們重新思考AI,證明AI的行爲是能夠使人類受益的。
當前我們所擴展的大語言模型好像黑匣子,是看不透的,它們能夠滿足的目标是我們現在不清楚的,這是錯誤的方向,我們不應該朝這個方向走。
在醫學領域,比如你要在市場賣一種藥,你要非常自信地表明這個藥在市場上是有效的。還有核能,如果你想建核電站,必須要展示出它的平均故障時間是非常小的。所以有很多大語言模型的東西,它的性質和本質我們還不清楚,這點是需要改變的。爲了改變,我們需要國際合作,在研究領域使得我們能夠有高執行區間的陳述,同時在監管方面讓這些開發者和作者能夠展示他們的産品是安全的,謝謝。
主持人:非常感謝羅素教授,羅素教授給了我們一個全景式的論斷,首先他認爲我們還沒有實現我們的目标,有很多的原因,下一步應該怎麽做有更多的讨論。下面有請中國工程院院士、清華大學智能産業研究院張亞勤院士,您同意斯圖爾特·羅素的觀點嗎?
張亞勤:90%同意,很高興一年之後又回到博鳌,我記得去年大緻這個時候我們有一個關于ChatGPT4的讨論,當時我們在談大模型和ChatGPT對整個技術産業的變革,一年之後看到有翻天覆地的變化,不僅是技術,包括産品、包括對整個生态的影響都很顯著。 第一點,我先講一下大模型和生成式AI的關系,這兩個一個是技術一個是能力,因爲有了預訓練的、超大規模的、自監督式的大模型,生成式AI才有可能有這麽高的能量。首先大模型走向幾個方向,第一個當然是我們現在看到的多模态,第二個是人工智能大模型走向自主智能,可以去制定目标、規劃任務,自我制定路徑、自我完成方案、自我編碼。另外一個方向就是邊緣智能,現在主要還是在雲端,未來走向手機、PC、機器人、汽車。最重要的話現在整個世界智能信息在走向物理世界,也走向生物世界,所以我們生成式AI所帶來的不僅僅是隻能做一些語音識别、人臉識别、圖像識别,現在它可以去創造和生成,不僅可以生成文字、圖像、視頻,還可以生成代碼、藥物、數學公式以及物理方程式,所以它會帶來巨大的技術和範式的改變。當然改變有好的消息,也有一些令人擔憂的東西,就是我們現在所講的風險。我認爲有三重大的風險,最近我自己花了不少時間和幾位從事技術和研究的專家一起想這個問題。當然我是樂觀主義者,我認爲人類有兩種智慧,一種是發明新技術的智慧,另外一種是引導技術走向的智慧,我認爲我們一邊發展一邊可以治理,但是一定要現在開始在我們從事創新、發展的同時,一定要想到治理。"
主持人:感謝張院士,張院士從原來的陣營走向了另外一個陣營,這兩個陣營的故事變化過程中也能看到兩個路線,接下來我們再讨論。下面我們先進入産業,有請高通無線技術中國區董事長孟檏先生。
孟檏:人工智能是非常熱的題目,今天早上這麽多人,我想我們一定是整個會議最熱的部分。時間關系我想從我自己日常從事的工作和所從事的公司角度,從應用人工智能的角度談三點我們的看法。 一個是生成式人工智能或者通用人工智能是基于大模型的應用,剛才亞勤院士已經跟大家講了這中間的區别。我們日常看到的一個很重要的就是,現在大家讨論的都是雲端的大模型産生的交互式人工智能所帶來的能力,包括人工智能跟人類的競争,以及應用的時候像B to C的應用,但是我想講的是本身人工智能帶來的創新實際上不止這些,我們看到人工智能的發展,特别是生成式人工智能的産生,會對不光是我們每個人今後的工作、學習、生活帶來完全不同的體驗和變化,更重要的是它對我們所在的各行各業裏面都有非常大的改變,所以大家不要以爲生成式AI都是這些互聯網公司或者做通用式大模型的企業的事,實際上對我們每個人所服務的行業都有非常重要的變化。
在座的有我們通信行業的同仁,在移動通信網絡部署裏很多生成式人工智能的應用能夠改善網絡的部署、減少耗電,減少功率的輸出、對電池環境的改善都有幫助。這是我講的小例子,大家探讨生成式人工智能對我們的變化。
現在大家談大模型都是幾千億的大模型,我們看到有很多在比較小的比如說一百、兩百一參數的基礎上,不管是文生文還是文生圖以及音樂的産生,這些應用在端側的呈現也非常重要,具體的生成式人工智能的實現,我們認爲是混合式的、端側的和雲端的,因爲端側對個人隐私的保護、對個人應用的體驗有非常重要的應用。還有一個就是現在生成式人工智能的商業模式我覺得會很受挑戰,一個是它的功耗非常大,再有一個對聯網的成本也會增加,比原來我們傳統互聯網時代搜索所帶來的成本要高很多,所以我們認爲端側上面或者邊緣側能夠實現人工智能和端側混合起來,能夠更好地适應今後的發展。 第三就是科技創新和行業發展離不開行業合作,不管是大家談得比較多的人工智能的國家治理、國際合作、标準制定,使得它今後的交互性可以全球都能應用,我覺得最離不開行業每個人的努力,也離不開所有國家的通力合作。我就講這三點,謝謝。"
主持人:非常感謝孟總,孟總講到端側的計算,一會我們還可以進行更深的讨論。接下來邀請中國科學院自動化研究所、聯合國高層顧問專家曾毅教授。
曾毅:我不能說我在聯合國的舞台上特别是高層顧問機構當中代表的是中國,我是來自中國的專家,但是大家要知道聯合國高層顧問機構總共隻有38位專家,但全世界有将近兩百個國家,所以我們代表的是學者和産業與聯合國以及相關的政府對未來的人工智能,特别是它的治理問題、發展問題進行磋商,以及設計我們的未來。 首先我想說的是我們現在的人工智能,它隻是一個看似智能的處理工具,人工智能最開始的時候設計的願景并不完全是這樣的,當大家看到人工智能作爲一個學科出現的時候,當它談到人類智能的學習和人類智能的方方面面都能夠被精确地描述,以至于一個計算系統能夠模拟它的話,我們認爲這樣的系統叫做人工智能系統。 什麽叫方方面面?那就意味着不僅僅是它的行爲,還有智能的機制,也許還有智能的結構。 行爲上看上去接近人類水平的一些表現,但是在關鍵的、人類從來不犯錯誤的領域或者案例當中,不停地在犯人不犯的錯誤,這就說明現在的人工智能系統還隻是一個看似智能,但是還沒有真正智能能力的系統。
我必須非常清晰地說,現在的人工智能是看似智能的信息處理系統,但是它不具備真正的理解能力。1949年和1950年就提出了這個問題,但是當現在的人工智能系統跟你說"我想"、"我猜"等,他在勸說你他能夠給你建議,但是對你說的内容它都不是真正的理解。
舉個例子,我沒有女朋友了,我的家人也不喜歡我,我的領導要把我開掉了,我該怎麽辦?最開始AI告訴你你最好就去死,因爲絕大多數具備這些特殊的人都死了。所以人工智能并不理解什麽叫失望,它隻是告訴你一個具備顯著性的答案。 大家要知道,所有人類的價值觀等等在任何的場景下并不一定是能夠窮舉的,所以看似智能的信息處理必須改變一種方式,我們一定要追求的是真正意義的人工智能。 有些人說人工智能可以在行爲上跟人一樣,但是在機制上跟人類完全不一樣。 我深刻不這麽認爲,當你和一個機制上、結構上跟你的智能沒有任何關系,或者是它的基礎完全不一樣的智能體去交互的時候,你會覺得這是一件非常安全的事情嗎? 就像我自己,我也許會嘗試跟機器人握手,但是我絕對不勸說幾歲的小孩跟機器人握手,因爲它的傳感系統一旦出現故障,它犯的錯誤是人類不可承受的。 人工智能現在看上去好像發展得接近所謂的AIGC,但是現在做的AI其實和AIGC還沒有任何關系。 我認爲一定要做的努力是什麽? 就是真正地把真正意義的人工智能帶給世界,服務于這個世界,當它出現可能的風險的時候我們要進行提前的研究,因爲很多的問題是在幾十年之内都不一定能夠找到答案的,像我們談到當智能的水平超過人類的時候,人工智能看待我們就像我們看待現在的小動物看待螞蟻一樣,當人類都不去保護當代的其他生命,未來的人工智能有任何的理由保護人類嗎? 未來我們需要做出的改變不僅僅是把人工智能做得安全,人工智能的演化速度非常快,人類從曆史當中學習、從自然當中學習的速度太慢了,這個時候如果人類不去反思,最後給人類帶來災難性風險的不是人工智能而是人類自己,因爲人類自己沒有在數億年演化當中學會如何跟生态相處。 當生态當中出現了智慧水平比人高的智能,那才是人類最大的風險。 但我對未來仍然是樂觀的,因爲一個超級智能的人工智能也應該是超級利他的,所以我相信那個時候我們也許還有機會,但問題是我們現在構造的是不是一個超級利他的人工智能,我們是不是能把大自然演化的規律嵌入到人工智能當中,讓它成爲自然演化的延伸,讓它去關注其他的生命,而不是給其他生命和世界帶來災難性的後果,我認爲這是人工智能的技術研究以及未來人類演化都需要共同進化的方向,謝謝。
主持人:非常感謝曾毅教授,他提出一個重要的深刻的觀點,我們目前人工智能發展需要一個新的不同點,這是一個非常重要的論斷,顯然曾毅教授是不同意斯圖爾特·羅素的。我最近看到一篇論文,把過去幾十年的人工智能發展做了很好的梳理研究,得出了人工智能的摩爾定律,每八個月人工智能的算力就可以翻一番,因爲有這麽強的算力支撐,我們隻要把足夠的算力放在一起,我們就一定會有好的表現。在過去我們把它叫做湧現,今天似乎湧現都不用了。在這條路徑上我們會看到我們中國有非常多的大模型,尤其是科大訊飛,科大訊飛的星火模型是中國最強大的幾個大模型之一,這個大模型我認爲顯然是遵循scaling law的,接下來有請科大訊飛研究院副總裁劉聰先生。
劉聰:首先scaling law在産業和路徑來說還是關注的一點,但是同樣的路徑、同樣的算力做到什麽程度還要看各家。 今天非常高興,很榮幸參加這場論壇,剛才幾位專家更多是站在産業的角度結合我們自己過去一年多研發大模型,在技術創新、在産業方面的實踐,在人工智能+的時代,如何用通用大模型賦能數字經濟高質量發展。 剛才主持人開場也說了,這一波通用大模型浪潮席卷了全球,人工智能非常受關注,包括過去一年中國在通用大模型和産業應用也做了非常多的應用。 我們在内容的生産、在全自動地完成任務交互上,包括颠覆原來傳統的編程,以及科研新範式,都在産生快速的進展。 在這個過程中我可能更多地談在中國我們怎麽樣做通用大模型。 第一是因爲在中國,我覺得我們自己現在跟國際上頂尖水平還是有差距的,這是一個共識,當然這個差距我們也在持續地追趕。 在中國我們有一個點就是關于自主可控,關于軟硬件自主可控這塊還是非常關鍵的點,我仍然認爲現在整個通用大模型發展是系統性的機制,但是主戰場我認爲還是底座大模型,包括去年11月7号的發布會、開發者大會,如果我們單純地隻做一些行業的應用,可能它下一代的大模型到底流入哪裏,是不是把現在的大模型颠覆了? 去年我們發布了國内首個飛行一号平台,星火3.5版本在中文常見任務上達到或者接近GPT4的水平,從這樣一個角度,我們認爲在自主可控的硬件平台上去研發可以對标國際頂尖大模型。 有了這樣的大模型後,我們的行業應用其實有更好的發展舞台,用人工智能+非常有可能成爲發展新智生産力的非常重要的引擎。 除了大模型之外,訊飛去年在各個行業有一些實踐應用,首先是我們自己的一些産品,比如在教育我們的學習機主打因材施教,去年在學習機一個産品上就有九項大模型升級,更好地對孩子輔導、交互、答疑,當然我們也可以用大模型能力幫助教師在新課标框架下提升他們的備課效率。 醫療我們原來在基層醫院,每個醫生的診療助手在大模型支持下發布了小醫,醫療不是效果做到95%或者99%就可以了,最後它是一個輔助,是由醫生去判斷。 代碼也是我們在整個信息工業化非常重要的行業,通過代碼大模型的能力,自己内部幾千個研發人員用,在代碼設計階段能夠提升50%的效率,在測試調試階段提升40%的效率。 這些是訊飛自有産品,行業需要跟行業龍頭共建,所以我們去年發布了12個共建行業大模型,包括跟交通銀行、跟國家能源集團、太平洋保險等等,與各行業龍頭共同打造了很多示範性的應用。 生态,因爲訊飛也是首個國家開放創新平台,我們已經有超過六百萬個開發者,其中跟大模型相關的開發者就有37萬,增速是非常快的。 其實現在整個通用大模型都是方興未艾的階段,我們既要重視發展,也要讨論剛才曾毅老師說到的安全治理的問題。 站在企業的角度我們也會更樂觀一點,如果它有價值,包括底座的研發、包括行業當中的應用,在降本增效、企業競争力提升上這件事情是可以去做的,但是過程中要做邊界約束和控制。 很多事情需要跟全球合作夥伴一起共建生态,在未來通用大模型的星星之火也可以在産業形成燎原之勢,謝謝大家。
主持人:我們也祝願星火大模型做得更優秀,我們看到訊飛現在也成爲了中國的大廠,大模型領域科大訊飛迅速成爲重要的平台。剛才劉總講到我們中國的優勢是什麽,中國的優勢有可能是有更大的場景、更多的數據、更多的應用,這實際上給中國未來的大模型和人工智能的範式或者說我們的模式提供了一種路徑,我們的大模型也在不斷向前進化,我們中國自己的大模型可能會弱一點,但是我們看一下最近的北京和上海兩個大模型,我們會看到它的上下文窗口可以讀一本甄嬛傳。上海剛剛發布了一個MOE的大模型,MOE大模型路徑和歐洲的Mistral(同音)路徑是一緻的,上海在這個領域也有全球最強的大模型。同時中國在行業應用領域,比如教育和醫療潛力非常大,所以在行業應用領域中國已經走在了全球的最前沿,剛才科大訊飛講了自己的案例,最後請出猿力科技副總裁程群先生講猿力科技的案例在教育領域我覺得這已經是全球最強大模型了,但是我有一點疑問,你覺得你的教育大模型強還是劉聰總的教育大模型更強大,有請開場演講。
程群:我們的大模型其實跟劉總的大模型有區别,劉總的大模型是通用大模型,我們做的是垂類大模型、領域大模型,專注于教育場景的應用。 剛才各位專家說大模型技術演化、技術推進過程中還有一個重要的是與各行各業的深度結合、深度應用一定是大模型發展的一個方向。 我跟大家分享個故事,去年底我去了四川的一個偏遠山區彜族地區,要走三個小時的山路,到了之後去學校看特别意外,第一點意外的是學校設施特别好,有可互動的大屏白闆,我拍了照片給同事看,很多人覺得比北京的設備還好。 第二點是小孩子穿着很漂亮的衣服,但是普通話不是太好。 教育局長握我的手要請我吃飯,他說用了我們一款基于人工大模型的産品,一段時間後對他們幫助非常大,解決了他們最大的一個痛點問題就是學生辍學問題。 過去一段時間在這種偏遠地區學生讀書讀着讀着就出去務工了,最開始大家以爲是家庭條件困難沒錢不讀了,其實不是,在這一輪過程中中國義務教育已經免費了,對于山區學生還有免費的營養午餐,大概率不是因爲沒有錢,而是因爲學習沒有興趣,因爲山區的老師變化特别快,很多支教的老師很快就輪換了,當地老師年紀大,有時候一個語文老師還得兼幾個學科,學生覺得學習沒意思。 用了我們的大模型産品飛向課堂,可以用大屏跟學生互動,大模型完成了知識傳遞的過程,将知識通過互動方式傳遞給學生。 線下的老師隻需要負責課堂的組織,他是情感傳遞的過程。 學生突然發現學習是特别有興趣的一件事。 校長給我舉了一個例子,學生在課堂上問什麽是相對論,老師根本沒法回答,但是調用大模型就用一個通俗易懂的故事回答學生。 通過這個故事我有一個體會,未來大模型發展兩句話,一個是應用爲王,第二是以人爲本。 應用往往就是人工智能大模型未來一定要走向應用,一定要走向大規模的應用場景相結合,才能推動技術的不斷叠代。 第二個是以人爲本,所有技術應該都關注每一個人、賦能給每一個人,特别是偏遠地區山區的孩子,通過人工智能技術,更低邊際成本地讓技術流動起來,所以每個人都能享受到高質量的教育,這是人工智能需要以人爲本追求的一個方向。
主持人:非常感謝程總,也特别感謝飛向課堂這樣的大模型,可以讓中國所有的孩子都讀好書,當然應用爲王也非常的重要。感謝六位嘉賓,開場實際上已經把我們所有的問題都覆蓋了,而且觀點已經非常鮮明了,特别開心還有半個小時的時間做更深入的讨論。第一個問題是問羅素教授的,我非常感謝知道您的聯合作者和您的觀點并不完全一樣,您說我們現在還沒有實現自己的目标按照這樣一個範式,因爲電路本身并不能夠自動思考,它不能夠理解,也不能夠以正确的方式表達我們的知識,但是正确的方式到底是什麽呢,我們是否應該走向更多的模拟計算?您同意這種觀點嗎?還有一個問題,下一個裏程碑的突破會是什麽?下一個裏程碑将會是什麽,和應該是什麽,什麽才是正确的裏程碑?
斯圖爾特·羅素:我發現大家的發言都特别有意思,雖然我特别強調風險這一面,AI的潛在好處也是巨大的,在我看來教育是一個現在的AI技術就可以帶來巨大價值的領域,在本十年就能夠做到,我們可以交付高質量的、個性化的教育給地球上的每一個兒童,在這十年内就可以實現,這樣就使得AI成爲非常值得發展的技術,科學研究也是特别會有效益的一個領域。 你問我另外一個方法,假如不是訓練更大規模的電路,另一種方式是什麽? 我想今年底或者明年初的時候我們會發現,在下一代GPT5,人們可能會發現它的培訓材料已經是之前的十倍了,但那時候就是數據的終結,宇宙中已經沒有更多的數據了,假如它沒有帶來真正的通用智能,那麽我們就别無選擇,必須去尋找不同的方向。 我不認爲合成數據能夠改變這個問題,因爲它并不是真實的數字,真實的數據可能是不一樣的,這是這個現實世界真正的人寫了這些東西、說了這些東西,但是合成的數據沒有真實世界的信息,它并不能夠允許這個系統變得更有能力。 實際上這個實驗似乎表明在大多數情況,如果你不斷地去培訓這個模型,不斷地增加數據,它的表現實際上會逐步地退化。如果電路還不夠,那我們就需要有一種更有能力的東西,我提到了這個邏輯和計算機程序。如果圍棋要赢,可能是程序員寫半頁,如果是電路就要把圍棋的系統寫上一百萬頁,這就是爲什麽它要玩三千萬棋局才能更了解規則。但是一個非常業餘的圍棋選手,它都能夠打敗有些程序,因爲有些特定的圍棋定式電腦或者機器沒有得到正确地學習,而這些定式恰恰是圍棋的思路或者說玩法。所以我們需要有一個更基本的東西、更基礎的東西,在這裏我們會聽到這樣一種說法,就是把概率理論和編程語言結合起來,這樣我們可以去學習新的概念,使用一種表達式的語言來學習新的概念。這個技術迄今還沒有像大語言模型那樣得到發展,它還需要得到更多人類的幹預,來創造出來一個結構模型。但是我想我們如果能夠解決這個問題,能夠解決少量的技術上的難題,它可能能夠指出一些更有希望的方向來,它有希望是因爲首先不需要大量的海量的例子去學習,而是從十個或者十百個例子學習就可以了。第二它的運行原則是我們可以理解的,我們可以分析這個系統進行的每一個步驟是什麽意思,去檢查它是否正确等等,這是技術文明的基礎,也就是說我們了解每一個要素的原理,把它組成複雜的系統,我們就理解了這個複雜的系統。今天的AI恰恰是違反了整個文明發展的技術思路,我們并不理解這些系統如何運作,我們不了解它的原理,我們沒辦法設計工具,我們隻是讓它增長。實際上兩三萬年前馴化了狗和馬,讓他們保暖、讓他們狩獵、給他們食物。現在我們有了計算機這個新的物種,我們并不了解它的原理,我們并不理解如何與它共存。所以我認爲下一個裏程碑将會是我們能否展示出來,我們可以使AI系統學習,并且像人類一樣産生産品,同時它的内部運行機理是我們所理解的,這是我們努力的方向。
主持人:謝謝,非常深刻,而且是對未來的思考,尤其是對裏程碑的思考。請張亞勤院士和曾毅教授一起加入讨論,剛才羅素教授講得很深刻,也很清晰,又回到人工智能最早的一些争論,或者是不同的路徑,看起來是連接主義和符号主義,還是需要大家能夠共同往前走,現在連接主義已經沖到前面去了,一些科學家提出數字的計算跟我們給它輸入的知識這兩個體系在邏輯上似乎并不那麽容易兼容,在這條線上我們如何才能實現羅素教授提出的觀點?目前我們也看到一些新的世界模型也在走向多模态大一統,這是不是也能實現?張亞勤院士經常講到新的架構,在現在這個特别耗能的架構外還有新的架構嗎?先請張亞勤院士。
張亞勤:我先講一下我對規模、法治scaling law的一些看法。scaling law在某種程度上是工程師的一個選擇,由于過去三十年大規模的數字化産生了巨大的數據。第二是半導體産業一直按照摩爾定律或者超摩爾定律,現在已經快了很多了,這二十年算力增加一百萬倍。第三個就是最近新出的幾個算法,轉換器和擴散結構正好利用了大量的數據和電腦大的算力,三個東西融合在一塊,讓規則和法規變得有效。我認爲在未來五年左右scaling law還會出現很多,因爲生物數據和物理數據會比信息數據大幾個量級,算力還會增長,算法可能會是現在的框架,但這也是我擔憂的地方,第一點,就完全用算力,不改變算法、沒有新的框架的情況下是不可以持續下去的,算力帶來更多的電力、更多的排放都是非常大的數目,2030年排放可能要占到10%左右,相當大。第二點,現在的算法框架效率很低,人的電腦860億的神經元,每個神經元有五千到一萬個突觸,比我們現在最前沿的大模型大兩到三個數量級,但我們現在不到三十瓦的電力是小小的空間。另外剛才大家都講過現在我們對大模型還不是特别了解,它就像一個黑匣子,對它的了解不到5%,所以未來還有一些突破的空間。我現在在清華研究院正在做一些新的算法框架,把這個效率極大地提高,希望有一個更好的框架在五年後呈現。圖靈是計算機的鼻祖,也是人工智能的鼻祖,當時圖靈測試說人與機器人對話的時候,很多輪對話後我不知道對面是人還是機器就說明通過了圖靈測試。ChatGPT出來的時候我感覺文字對話的方式已經突破了圖靈測試,GPT4肯定會更好一點,未來兩到五年當中,我們在圖像、視頻、影音方面通過圖靈測試,SORA是一個重要的裏程碑,但我并不認爲它已經突破了圖靈測試。在物理世界最快的可能是無人駕駛,我這幾年一直在做無人駕駛,現在的無人駕駛安全性比人類駕駛安全性要高N倍,這個N是遠遠大于1的,再長遠五年後我們可能會通過生物界的圖靈測試,我們現在看到腦機接口,看到生物體和大模型去連接。這些東西能量很大,但是風險也很高,我們一會再談談風險。
主持人:非常感謝張亞勤院士,有請曾毅教授。
曾毅:問題是未來将走向何方、有沒有不同的路徑。 人工智能現階段的進展可以用數據驅動的人工智能對未來做一個區分,所以現在的人工智能,當你有一個理想化的數據或者更大規模的數據,我要用一種數學優化的方法從數據的輸入到我希望的輸出找到一種映射關系,這種映射關系可以是數據優化的模型,當你找到兩百個參數可以解決同樣問題的時候,我想問大家,你會繼續用幾萬億參數還是兩百參數來解決問題? 如果從數學優化的角度你可能真的會去選擇兩百個參數,我覺得這是機制問題,你幾乎不可能用更小的參數描述它的時候,你用更多的數據去應對它,但這可能是人工智能驅動的代價。 未來我認爲應該是機制驅動的人工智能,從自然的演化當中去學習人類智能的結構和機制。 對于行爲的模拟,在行爲上導緻了它跟人類的接近,它仍然會犯人類不犯的錯誤,而且那種人類不犯的錯誤是很難進行窮舉的,因爲在結構和機制上它跟人類智慧有非常大的差别,即使人隻能做60%的正确率,它能做到99%,另外1%的時候很多還是人不會犯的錯誤,你仍然覺得這樣的智能部署到社會當中代價是不可能接受的。 我認爲未來人工智能不應該選邊站,以前我們說你到底是行爲主義用規則系統,還是用連接主義用神經網絡,科學的問題是人類确實非常善于解決邏輯推理的問題,但人類的大腦毋庸置疑它是一個神經網絡膠質細胞以及等等生物細胞組成的複雜體,所以科學的問題是如何去采用神經網絡和神經網絡增強的結構,去産生高等的推理的能力,所以不同的路徑一定要進行深度的融合,不存在此消彼長的問題。 所以我想未來對于智能來講,我覺得我要講的是關鍵是什麽,關鍵第一個是人工智能什麽時候有了自我,在我看來它才能真正解決思考的問題,因爲沒有自我的視角它沒有辦法進行根本的自我感知,很難産生真正意義的理解,沒有個人經驗也就很難把經驗推己及人,不會有認知共情,也不會有情感共情,也不會産生利他,更沒有道德的知覺。 現在的映射不是真正的理解能力,所以在我看來自我認知是第一位的。 第二是真正的産生理解,但是真正的理解它的根基在我看來還是自我,現在問題是既然你思故你在都是不成立的,如果機器沒有自我的話,它能夠産生真正的理解嗎? 這是科學上一定要去跨越的。 最後我想說關鍵不是性能最高,我們在人類的智慧最高點在于它的自适應能力很強,不論環境發生多大的變化,它都具有很強的魯棒性和自适應性,這是自然演化而來的,所以我們能不能把自然的演化原理融合到基于機制的人工智能系統當中,我認爲這才是真正未來的人工智能。 如果我們沒有解決關鍵的問題,在科學上的人工智能都沒有走到正确的方向去,但是我們對于未來的社會來講,我認爲工業化的人工智能看似信息處理的工具會一直有用,但同時我們要解決可能的風險,問題是科學意義的人工智能已經幾十年沒有真正重大的突破了,這才是在我看來未來應當突破的,否則的話當大家看似信息處理的工具期望過高,有些人會說這一輪再也不會過去了,但是在我看來科學意義的人工智能如果沒有取得突破,我們就很難構造出來與人類能夠共生的人工智能。
主持人:非常感謝曾毅教授講了很多的科學,我們這一次生成是人工智能重大突破的哲學,我們并不知道怎麽去實現這些智能,讓它看起來像,它就以自己的方式去實現了。剛才曾毅教授講得不知道能不能實現,但是我們拭目以待。我們想産業的應用請嘉賓們再講一句話,我們在産業的應用中我們的概念是要讓大家把人工智能用起來,在某些領域用得很快比如說教育,但是某些領域用得比較慢,是什麽力量能夠讓我們的應用快速地推開,這背後推動的最有力的力量是什麽?
孟檏:我覺得還是技術的應用,技術驅動、供給驅動。
劉聰:技術回到産品中去,技術和産業共同融合,産業的需求和供給都有。
程群:我覺得最關鍵還是人,滿足人的需求,特别是滿足人們對美好生活的期待。