AI 熱潮以來,「突發」就成了我們标題的常客。
昨天,來自 Google 的大語言生成類 AI 模型 Bard 又迎來更新,新增了「Google it」按鈕,增強了數學與邏輯能力,并發布了一個全新的功能更新公告闆。
發布以來就飽受争議的 Bard,如今能在數理邏輯領域,與 GPT-4 一較高下嗎?
三個更新點,做數學題是重點
爲了讓用戶更方便的了解 Bard 更新變化,Google 上線了 experiment updates(實驗更新)界面,展示 Bard 的最新消息。網址如下:
https://bard.google.com/updates
相比其他廠商「提高系統穩定性,優化系統流暢度」的更新對聯,Bard 不僅告訴你更新了什麽,還告訴你爲什麽更新。Google 表示,這是爲了讓用戶更快的進行測試、提供反饋。
順着更新公告往下看,「Google it」是這次的第一個功能更新,當你問過 Bard 後,可以在答案下方看到「Google it」的按鈕,點擊後 Bard 會生成幾個相關主題,以便你使用 Google 進行更多元的搜索。
這樣一來,Google 搜索就變成了 Bard 的補充,如果在未來,Bard 完全替代前者我也不會感到意外。
不過,Google it 在提取複雜問題的主題時準确性還不夠高,比如在我詢問奧數題時,Google it 的主題幾乎沒有價值。
最後,也是最大的更新,Bard 的數學和邏輯能力得到了升級,以前一道 123456*654321 就開始亂說的大語言模型終于站起了身,開始實踐「學好數理化,走遍網絡都不怕」的道理。
光說不練假把式,Bard 的數理能力夠不夠強,我們給它出了 20 道題,看看它的表現如何。
GPT-4 出了 20 道題,Bard 滿分
▲
第二題答案有誤,應爲(2,-1)
我們用 GPT-4 整理了 20 道數學、邏輯類問題,用于測試 Bard 的數理能力。
先不說對不對,Bard 的反應速度着實很快,即使是加速後的 GPT-3.5 也不是它的對手。
先來看看 Bard 的表現,Bard 不僅完全答對了所有題目,還給出了詳細的解題過程。
ChatGPT 的表現也不錯,數學題全對,邏輯題隻錯了一個。
我們也把同樣的問題翻譯成中文去提問了百度的文心一言和阿裏的通義千問,10 道數學題,通義千問僅對 1 題,文心一言則對了 4 題;10 道邏輯判斷,通義千問 3 題正确略勝一籌,文心一言 2 題正确屈居第二。
不得不說,數理計算對大語言模型來說,門檻确實比較高。
▲
10*3.14=314
▲
無中生有的兔子
從我們簡短的測試來看,Bard 的表現相比它剛發布時确實有了顯著的提升,在回答問題的邏輯性和正确性上已經逐漸趕上了 GPT-3.5。
比 ChatGPT 表現更好的是,Bard 在回答問題時還會加入引用信源,降低了編造事實的可能。
目前 Google 對 Bard 的試用申請似乎放松了不少,隻要申請加入 Waitlist 後再刷新幾次界面,就能馬上體驗 Bard。
感興趣的朋友可以在下方地址體驗。
https://bard.google.com/
如果你的試用申請一直都沒通過,也不用着急。
Google 的 CEO Sundar Pichai 最近在接受采訪時透露,Google 計劃将 Bard 整合到搜索引擎中,以應對 ChatGPT 等聊天機器人帶來的競争壓力和更爲廣泛的商業問題。
未來 Google 應該會像 Bing 那樣開放一個聊天搜索界面,直接在搜索引擎就能調用 Bard。
目前 Google 并沒有給出明确的時間表,也許在 5 月 10 日召開的 Google I/O 2023 大會上會透露出更多的信息。
AI 不會畫手、AI 不會做數學題,這些問題已經慢慢成爲了曆史,那麽問題來了,AI 的下一個突破點,又會在哪裏呢?
點擊「在看」
是對我們最大的鼓勵