GPT-4 的發布一石激起千層浪,相比 GPT-3.5,新一代的 GPT 不但能看圖說話、分析圖表,甚至 SAT 數學能考 700 分,生物奧林匹克競賽排名前 1%,司法考試排名前 10%。GPT 正在以一種人類無法匹敵的速度地進化出越來越多讓人歎爲觀止的能力,但這也助長了許多人的失業焦慮、對于數據安全的焦慮,以及對于 GPT 時代産業發展的焦慮。
于是,未來科技力在上周邀請了山景智能創始人 & 董事長黃勇,PingCAP 副總裁劉松,深勢科技戰略部負責人王小佛,計算美學 Nolibox 技術合夥人付博銘,這四位業内大咖做客未來科技力直播間,聊一聊 GPT、AIGC 和 AGI。
智能是觀察者的幻象
在科幻小說《三體》中,羅輯從休眠中醒來,看到的一切都是數字化的、自動化的、" 先進 " 的。危機紀年的人類科學早已止步,可還是被基于已知技術開發出來的各種應用所造成的 " 紛繁閃耀的華麗 " 迷惑,誤以爲自己處在科技發展的盛世。
這和當下由 GPT 引發的," 被 AI 取代 "、"AI 改變社會構造 "、"AI 大洗牌 " 等種種焦慮有異曲同工之處。人們似乎覺得機器人已經 " 準備好了 "、賽博朋克近在咫尺,可實際上我們所見到的隻是一些能夠寫代碼、繪畫、做視頻和聊天,可謂被予取予求的 AI 工具。
GPT-4 的熱度,在計算美學 Nolibox 技術合夥人付博銘看來,很像三體中這種絢爛的 " 科技大爆發 "。"GPT 相關的這些技術的話可能都基于若幹年前的深度機器學習模型 Transformer,但這個算法其實一直沒有更新," 付博銘認爲,"GPT 的亮點在于有人類監督的強化學習," 而非算法本質的升級。
山景智能創始人黃勇也認可這一點。" 通用人工智能其實是個僞命題 ",因爲 " 它是一種技術上的發展和變化,但它也是個過渡階段。"
的确如此。近日微軟研究團隊的一篇論文,針對 GPT 的 " 智能 " 做出了如下謹慎的描述:" 這 ( GPT-4 ) 可以被合理地看作是人工通用智能(AGI)系統的早期(尚不完整)版本。"
"GPT4 的強推理能力其實是一種用參數算法結合數據的反饋構建出來的’僞智能‘,離真正的通用人工智能還遠着呢 ",PingCAP 副總裁劉松說,并引用了機器人專家羅德尼 · 布魯克斯的一句話:" 智能是觀察者的幻象 "。
布魯克斯是 MIT 人工智能實驗室的教授,他的原句是:" 每一個機器人看起來都像是按照一套集中的目的行事,但這隻是一個幻象,無論是在人造智能物或是自然生命中,智能都出自觀察者之所見。" 他不認爲機器要學會思考才能做事,還制造過一系列奇奇怪怪的機器人,雖然沒有思考能力,但卻能偷桌上的蘇打罐,穿越四周發燙的地面等。
這位教授還說過一句話:"AI 是工具,不是威脅。"
完形填空和 " 填鴨式教育 ",AGI 沒你想的那麽近
毋庸質疑,GPT 是一個裏程碑,也是一個拐點,但可能不是你想象的,通用人工智能(AGI)的拐點。
GPT、Stable Diffusion 這類大模型的橫空出世,極大程度上省去了其他入局者 " 重複造輪子 ",開發自研大模型、底層大模型的功夫。開發自研大模型的說法雖然在投資市場很受歡迎,但如果隻是做一些小修改,增加一些業務模塊,或者能力不變、在參數量和訓練時長上堆積,更像是 " 浪費資源 ", 付博銘分享道。
" 具備行業知識的模型價值是會比從頭做一個基礎大模型的價值要更大。"
爲了理解方便,我們暫且把高考能超過半數考生的 GPT 看作一個具有一定智力的 " 人 ",把給喂 AI 數據看作是這個 " 人 " 學習的内容和方式。那麽 GPT 這個 " 人 ",也更像是通過完形填空和 " 填鴨式教育 " 成長起來的應試型人才,而非具有創造力的全方面人才。
據深勢科技戰略部負責人王小佛描述,近年來一個比較好的 AI 訓練方法就是給 AI 做 " 完形填空 "。" 原來訓練的時候,是一個數據用一次就必須要換下一個數據。完形填空的意思是說,一篇文章 100 個字,把第 1 個字蓋上,剩下的 99 個字用來預測第 1 個字。然後再把第 2 個字蓋上,用 99 個字預測第 2 個字。"
雖然對于 AGI 的實現學術上尚存争議,但許多人認爲這樣的訓練方式并不符合 AGI 的實現路徑。理論上來說,AGI 的實現首先需要理解人類智能是如何實現的,再将人類智能的實現機制複制到機器上。而 GPT-4 目前展現出的 " 類智能 " 是算法複雜度量變到質變的一種 " 湧現 "。"GPT-4 的推理能力有很大進步,但它依然缺少對事實知識的基本常識," 劉松解釋道。
" 一本正經的胡說八道 " 也許是産品設計?
人們現在使用 AIGC 工具經常發現生成的内容有不準确、與事實不符、或自相矛盾之處,通常把這種現象稱爲 "AI 在一本正經地胡說八道 "。ChatGPT 在收獲鋪天蓋地的贊譽的同時,也不少被诟病這個 " 緻命 bug"。
但王小佛有不同看法。" 這可能是一個産品本身的設計,可以把它定位成一個陪聊。聊天的時候對準确度的要求是沒有那麽高的。但如果把它變成一個助手,有功能性的要求,不準确的話體驗就會差很多。這個不一定是技術的問題,或許是一個産品 pm 的選擇。"
黃勇也認可這種猜測:" 它希望更多地得到使用者的反饋,反饋就是對它的一種收斂,能夠更好的讓産品叠代。"
據黃勇表示,在山景智能針對企業級軟件領域的實踐過程中,常常會發現金融或是其他細分專業領域雖然門檻高,但是有邊界的。因此這類軟件的開發 " 困難沒有想象的那麽大 ",可以人爲畫出邊界," 能夠讓模型在這個範圍内去做收斂,這個時候效率就非常高了。"
所以,GPT 這類模型除了 chat,能做什麽?
AI 發展的三大要素,數據,算法,算力,缺一不可。
用黃勇的話來說," 算力是基礎,算法是精髓,數據決定了技術發展到什麽階段。"
黃勇分享,作爲一家企業級 " 業務智能決策自動化 " 平台服務商,山景早期和客戶合作時,經常聽到對方說 " 我們的數據不好 ",或者覺得門檻太高,無法适用人工智能平台、機器學習平台或者 PaaS 平台。觀察到這類痛點後,山景推出了數據治理的預訓練大模型,可以用來解讀數據,從而找到數據的标準。同時,爲了保證客戶的信息安全,也可以做到自動标注、自動脫敏。
這件事相當于把本來雜亂無章,連篇累牍的數據标準化、結構化。結構化的數據加上 GPT 類模型的自然語言處理功能,就可以把使用門檻降低、效率提升。劉松舉了兩個例子:" 一個企業的 CEO 想最快地總結出公司目前的情況,可以直接向模型提問,不用翻看報表。一個外賣小哥送餐時,不用看路況和取餐地點,直接問模型如何規劃路徑。"
" 所以未來最有價值的東西一定是以這種 GPT 爲界面,把結構化數據的嚴肅性和非結構化數據的補充性結合在一起的産品。"
劉松所在的 PingCAP 是一家企業級開源分布式數據庫廠商。據劉松分享,在 ChatGPT 問世的第三天,PingCAP 就決定将 OpenAI 的能力集成到自身的數據庫服務 TiDB Cloud 中,并在 1 月 10 号已經上線,能夠幫助用戶将自然語言轉化爲 SQL 語言,在數據庫中進行查詢,可以在幾秒鍾内分析公司的運營數據。用戶可以無需掌握複雜的數據庫 SQL 語言。
而深勢科技的藥物計算設計平台 Hermite 則是通過融合 AI 模型與分子模拟技術,來加速創新藥研發流程中靶點研究、虛拟篩選、先導優化等關鍵步驟的效率。" 這不是一步到位的。并不是比如我有一個病,然後 AI 直接能生成一個藥。" 王小佛表示,而是能解決一部分藥物研發成本高周期長的痛點。
付博銘則表示類似計算美學 Nolibox 其他的 " 畫宇宙 " 和 " 圖宇宙 " 等 AIGC 工具能讓高質量和低成本劃等号,讓創意市場從專業化走向全民化,并且讓 " 創意工作者從一些重複繁瑣的工作中解放出來,聚焦在創造性的工作上,并且更多的關注工作的商業化成果。"
注:封面圖來自于 Pexels,版權屬于原作者。如果不同意使用,請盡快聯系我們,我們會立即删除。