本文來自微信公衆号:字母榜(ID:wujicaijing),作者:畢安娣,頭圖來自:視覺中國
扔給聊天機器人一張圖表,它不但能看懂,還能給你如此這般做一番運算,發來一段對圖表的解讀。
你不服氣,又扔過去一張無厘頭的梗圖,它不但能看懂這張圖裏有車有人,還能告訴你之所以好笑是因爲 " 這個男人在出租車上面熨衣服 "。
這不是暢想,而是 OpenAI 最新發布的大型多模态 GPT-4 已經具備的能力。北京時間 3 月 15 日淩晨,OpenAI 正式發布了該模型。
簡單來說,GPT-4 與前代相比可以接受的文本輸入上限更高,回答的準确性提高,能夠生成歌詞、創意文本等多樣化風格的内容。最最最令人振奮的是,GPT-4 有強大的識圖能力,可以解讀圖片。
過去 ChatGPT 能做到的,新模型做得更好了;ChatGPT 做不到的,新模型也可以做到了。
開通了 ChatGPT Plus 的付費用戶已經可以選擇 GPT-4 模型,其他用戶則可以加入候補名單等待。但目前 Plus 用戶隻能使用文本輸入,讀圖的功能尚未全面開放。
外界用極大的熱情迎接了 GPT-4。在消息公布之後,OpenAI 官網一度發生擁堵,很多用戶在社交媒體表示這下秒開了 Plus 服務。"GPT-4" 登上推特美國、日本等地區熱榜,也登上了國内的微博熱搜榜、抖音熱榜社會榜等。
颠覆 ChatGPT 的,果然還是 OpenAI 自己。
一
GPT-4 究竟有多厲害?
在官方演示視頻中,OpenAI 總裁兼聯合創始人格雷格 · 布羅克曼(Greg Brockman)用筆和紙畫了個網站展示給 GPT-4,後者僅用 1 到 2 秒的時間,就生成了網頁代碼、制作出了幾乎與圖中一模一樣的網站。
GPT-4 可接受的文字輸入長度提升到了 2.5 萬個單詞,允許長内容創建、擴展對話以及文檔搜索和分析等。在高級推理能力上,GPT-4 也有提升。它可以更準确地解決難題,具有更廣泛的常識和解決問題的能力。
OpenAI 表示,GPT-4 在專業和學術方面表現出接近于人類的水平。其給出的例子稱,在模拟律師考試中,GPT-4 的得分能排進前 10% 左右,而 GPT-3.5 的得分隻能排在倒數 10% 左右。
而且 GPT-4 不僅是能對文本或圖片進行單獨的識别,而是可以接受圖文混排的内容。
" 請記住,GPT-4 不僅僅是一個語言模型,它還是視覺模型。實際上,它可以靈活地接受如文檔中那樣任意散布的圖像和文本。" 演示視頻中出現包含各種圖片和文字的電腦屏幕截圖時,格雷格如是強調。
在 OpenAI 官方介紹顯示,GPT-4 可以對插入了多個圖表的論文進行解讀,并用精煉的語言總結論文的内容。
OpenAI 表示,公司花了 6 個月的時間,利用 ChatGPT 的經驗教訓以及對抗性測試調整 GPT-4,使其在真實性、可操縱性和拒絕超出設定範圍方面取得了有史以來最好的結果。
" 至少對我們來說,GPT-4 訓練運行前所未有的穩定,成爲首個能夠提前準确預測其訓練性能的大型模型。"
但 OpenAI 也表示,GPT-4 并非完美,仍然不能完全摒除人工智能的 " 幻覺 ",而且訓練數據的時間依舊停留在 2021 年 9 月,可能會出現推理錯誤:" 有時會出現簡單的推理錯誤,會輕信用戶的虛假陳述,會像人類一樣解答不了難題。"
二
值得一提的是,GPT-4 在不同語種上的能力表現也大幅提升。
過去使用基于 GPT-3.5 的 ChatGPT 時,要特别注意中文的表達規範、流暢,即便如此它依然會時不時地突然用英文作答,好像一着急就要 " 蹦母語 "。
根據 OpenAI 的技術報告,GPT-4 的中文準确度已經達到了 80.1%,這個數字比 GPT-3.5 的英文表現還要好,後者隻有 70.1%。
爲了看看 GPT-4 的中文能力究竟如何,字母榜也簡單地問了幾個問題。
我們先将一段報道 GPT-4 推出的英文發給 ChatGPT,要其翻譯。這部分 GPT-3.5 和 GPT-4 的整體區别存在但是不明顯。如 GPT-4 翻譯爲 " 人工智能驅動的法語或西班牙語的對話 ",GPT-3.5 翻譯成了 " 法語或西班牙語的 AI 驅動對話 "。
當我們進一步提出要求時,新模型的表現開始明顯好于前代。比如 " 給年輕的朋友轉述這個消息 ",GPT-4 的回答很本土化:" 嘿,哥們 "" 得告訴你個牛 X 的事兒 "" 這貨還能識别圖片 "。
再讓它針對老年朋友編輯個信息,它的回答則有那種正經的味道,如 " 親愛的朋友 "" 告訴你個好消息 "" 感歎時光荏苒啊 "。
反觀 GPT-3.5,回答得就略顯生硬了,雖然也努力地加入了語氣詞等,但是整體文本還是欠缺重新梳理,依舊是對原文本的簡單複制。
當我們讓 GPT-4 模仿莎士比亞轉達這個消息時,其回答頗爲驚豔:" 哉!衆生皆驚,乃 OpenAI 新奇之作—— GPT-4 誕生矣!其智慧之光,如同破曉之陽,識圖問答皆無往不利…… " 但 GPT-3.5 則顯示發來一大段英文,當我們要求用中文時,文本不能說和莎翁有什麽關系,最多是有點譯制片腔調:" 哦!快來聽聽這個消息…… "
接下來,是社交媒體文案比拼。我們讓 ChatGPT 将之前的消息壓縮爲 100 字左右的小紅書文案,GPT-4 直接給出了完整的标題、文案甚至是話題标簽。而且文本中插入了很多小紅書常見的 emoji 表情,達到了可以直接拿來用的程度。
GPT-3.5 雖然也知道小紅書的風格是更親和的,但是文本簡潔度明顯差很多,也不懂得 emoji 的奧妙。
我們還讓 ChatGPT 爲一款遊戲手機的新顔色起名字,GPT-3.5 給出的 10 個名字中,隻有 1 個不帶 " 綠 " 字,如翡翠光芒綠、草原之綠、碧海琉璃綠,和遊戲的聯系也不緊密。GPT-4 給出的名字則可以直接取用:極速碧輝、虛拟翠穹、綠焰戰魂、綠光戰神。
爲結束這段小小的測試,我們假設李白穿越到現代,并和 ChatGPT 進行了一場對話,讓它以李白的角色作一首詩:
仙人撫我頂,托我躍千年。一覺醒來世事變,靈犀探盡塵間塵。玉宇瓊樓矗立地,鐵馬火車踏空間。時光如夢,逐浪逝,李白驚歎人間情。
這 " 仙人撫我頂,托我躍千年 " 可比 GPT-3.5 開頭給出的 " 深閨無物我獨來,相見 ChatGPT 意外來 " 頂多了。
三
去年 11 月 30 日,ChatGPT 上線得靜悄悄,OpenAI 的官方推特賬号發布了一篇文章,宣布産品發布的好消息。
短短不到三個月之後,當 OpenAI 發布新一代大型多模态模型 GPT-4 時,情況大有不同:
OpenAI 在推特、YouTube 等平台發布了宣傳短視頻、産品介紹短視頻,還由公司總裁兼聯合創始人格雷格親自進行了長達近半小時的直播。
除此之外,OpenAI 還在官網發布了長達 98 頁的技術報告,并同步開放了 GPT-4 的 API(應用程序編程接口)以幫助開發人員構建應用和服務。
GPT-4 讓 OpenAI 的商業前景廣闊了起來。在針對 C 端每月 20 美元的訂閱使用以外,外部合作也有更多可能性。
已經有多個合作夥伴接入了 GPT-4。微軟确認了必應的聊天機器人使用的正是 GPT-4:" 如果您在過去五周内的任何時間使用過新版必應,那麽您已經體驗過 GPT-4 的早期版本。"
語言學習軟件多鄰國(Duolinguo)宣布将在其付費訂閱 MAX 版本中,爲學習者提供 AI 驅動的新功能。比如學習者可以和軟件中的 " 世界人物 " 進行角色扮演,練習對話技巧。AI 會在對話後給出反饋,告訴學習者其回答的準确性和複雜性如何,還會對未來的對話予以提示。
另一款産品 BeMyEyes 也将搭載 GPT-4,而且側重的是其圖像識别和解讀的能力。BeMyEyes 不是一款新應用,它推出于 2015 年,爲視障人士服務:沒有視力障礙的人可以申請成爲平台志願者,接聽視障人士的視頻通話,通過攝像頭遠程幫助視障人士識别物品、閱讀文本等。這款應用在中國也有使用者,小紅書、豆瓣等平台都有相關讨論。
可以想見,有了 GPT-4 的讀圖能力,視障人士有望在平台獲得更及時、私密的幫助。
對于其他想要合作的開發者,需要進入 GPT-4 的 API 接口申請頁面,填寫姓名、郵件、公司組織編号以及使用計劃等問題。
已經有公司迫不及待。
人工智能公司 DoNotPay 的 CEO 喬舒亞(Joshua Browder)在推特上表示,正在緻力于用 GPT-4 打擊騷擾電話,将其稱爲 " 一鍵訴訟 "。針對騷擾電話和自動撥号軟件起草起訴書,要求對方賠償 1500 美元:" 想象一下,你接了個電話,按了一個鍵,然後 1000 詞的起訴書就寫好了。"
此前,這家公司基于包括 ChatGPT 和 Davinci 在内的文本生成器,訓練和開發了 " 全球第一個 AI 律師 "。本來有計劃今年 2 月在美國出庭辯護,卻因争議不得不擱置。
有人興奮,有人發愁。谷歌此前以聊天機器人巴德(Bard)迎戰與 ChatGPT 深度合作的微軟,但還沒對外公開發布産品,就因爲演示頁面中的錯誤一夜蒸發千億市值。
而就在 GPT-4 發布之前,谷歌才宣布了一個新消息,稱将推出一系列 AIGC(人工智能生成内容)的功能,将 AI 應用到包括谷歌文檔(Docs)、郵箱(Gmail)等的生産力工具當中,并于月底提供給 " 可信賴的開發人員 "。然而這個消息還沒掀起多大波浪,就被 GPT-4 的出世沖淡了。
另一邊,在國内,百度也将于 3 月 16 日舉行文心一言發布會。這是百度備受矚目的大語言模型産品。轉眼間,扳手腕的對象從 GPT-3.5 升級成了 GPT-4,實在不算是個好消息。
對于 ChatGPT 和微軟的競争對手來說,GPT-4 再一次搶了先機。對于你我來說,究竟是應當興奮于科技的發展,還是恐懼于被替代,不妨先讓子彈飛一會兒。
本文來自微信公衆号:字母榜(ID:wujicaijing),作者:畢安娣