GPT-4 再次遭網友 " 群攻 ",原因是 " 懶 " 得離譜!
有網友想在 Android 系統開發一個能夠與 OpenAI API 實時交互的應用。
于是把方法示例鏈接發給 GPT-4,讓它參考用 Kotlin 語言編寫代碼:
沒成想,和 GPT-4 一來二去溝通半天,GPT-4 死活給不出一個能正常運行的完整代碼。
反而解釋了一通 " 應該怎麽做 "。
這讓網友着實惱火,發推文吐槽 " 兩周前能寫好的代碼,現在卻不行了 "。
結果一下子炸出來更多網友:
終于有人調查這事兒了。
大夥兒連連表示遇到了類似問題:
據網友所述,似乎從11 月 6 日 GPT-4 大更新起,就開始出現這種情況了。
目前有 OpenAI 員工出面回應,表示已将問題反饋給團隊。
隻要代碼,完整代碼!
也難怪網友會 " 破防 ",就說上面網友把方法示例鏈接發給 GPT-4,讓它用 Kotlin 語言編寫代碼之後。
GPT-4 給出的回複是這樣嬸兒的,足足列了 7 條步驟,都在解釋 " 應該怎麽做 ":
直到最後才給出代碼,但隻是一個基礎 " 模版 ":
網友起初還比較有耐心,告訴它 " 不需要解釋,隻要給我代碼,完整的代碼,能 100% 正常運行的代碼 ":
結果 GPT-4 張口又在解釋、舉例子:
網友氣不打一處來,直接打斷它,并再次強調 " 不要解釋,給我代碼 ":
GPT-4 這下可是真真明白了,把上面那個模版稍微改動了一下,就發出來了:
這才有了開頭的一幕,網友無奈發帖吐槽。
對于 GPT-4 的回複,網友 " 怒吼 " 了一句:他們都對你做了什麽?抱歉你被削弱了。
GPT-4 此刻也是一臉無辜。
陸陸續續出來吐槽的網友中,更有甚者表示已經不用 ChatGPT 了。
AI 圖像編輯器 dingboard CEO@kache ( yacine ) 在前一天也發帖吐槽,浏覽量達 157000+:
在過去的一個半星期裏,我一直在編寫 " 幼稚 " 的代碼,因爲 GPT-4 不那麽遵循指令了。
巧了不是,如果按網友所說的 " 一個半星期 " 來算,時間還和奧特曼 · 真還傳事件吻合了。
kache ( yacine ) 還有一條帖子滿滿都是情緒," 請把舊的 GPT-4 還給我 ":
這位網友表示 " 我懂你 ":
以前它能做出很好的猜測,現在它會給我十個理由解釋爲什麽它不能做出好的猜測。
上周,我對着聊天框大喊 "f*ing do it!!" 的次數創下曆史新高。
一時間,GPT-4 的 " 懶惰 " 成爲衆多網友 " 讨伐 " 對象。
沃頓商學院教授 Ethan Mollick 也看不下去了,親自上手測試了一下,結果似乎表明這是真的。
Ethan Mollick 重複了一系列之前用代碼解釋器(Code Interpreter)做過的分析。
GPT-4 雖然知道該怎麽做,但會一直提示 " 去完成工作 "。導緻原本的一個步驟變成了許多步驟,而且有些步驟很奇怪。
這下 Ethan Mollick 也是無語住了。
GPT-4 到底是怎麽了?背後原因還不得而知,網友們也是紛紛猜測起來。
OpenAI 員工:已反饋給團隊
Ethan Mollick 還是很嚴謹,認爲即便如此也不足以證明 GPT-4 變得越來越笨了,他推測這可能是系統負載過高的暫時問題。
如果你是在手機(移動設備)上遇到了這種問題,那可能是因爲手機版系統提示的原因,會指示 ChatGPT 生成更簡短精要的答案。
我的測試是在網頁版進行的。
Reddit 上也有人發文讨論,其中有一篇帖子指出 " 并不是新版 GPT-4 懶,隻是我們用錯了 ":
文中指出,GPT-4 自本月 6 号進行了一次大更新後,基礎版本沒有自定義提示,這就導緻 GPT-4 沒有預定義的 " 路徑 " 來指導其行爲。
這讓它非常通用,但默認設置下它的輸出也有些 " 無方向 "。
解決辦法之一,就是使用更新後提供的自定義 GPT 新功能(GPTs),爲每項工作設置一個專門的 GPT。
也相繼有網友分享 " 小妙招 ":
新版 GPT-4 改變遊戲規則的一點是它能一次性解釋的代碼量。明确地說出類似 " 請完整地寫出這個測試 " 的指令,可能會有用。
同時,明确指出 " 不要重寫已經寫過的代碼 " 也很有幫助,這樣可以節省 token,讓模型專注于産生新的輸出。
我還發現,加入 " 一步一步思考 " 的提示會在開始時增加一些計劃性的文本,這有助于後續輸出更好地定位上下文。
但也有網友表示自己在用的時候,無論如何都會留下一些 " 待辦事項 ":
這位網友更是直言 GPT-4 現在像是得了老年癡呆:
OpenAI 暗示的是新版 GPT-4 非常善于遵循指令,但事實并非如此。
我從一開始就一直在使用 GPT-3、3.5 再到後來的 4,從未見過這種程度的阿爾茨海默症。
在網友的激烈吐槽下,OpenAI 員工也出面回應。
起初是讓網友們提供一些具體的例子,說是研究一下,很有可能在下次模型版本叠代中修補這些問題。
此話一出,炸出更多網友 " 上報故障 "。
will depue 再次回應:
感謝反饋,在這裏的所有示例都會幫助我們更快地解決這個問題。我剛剛将其轉發給團隊,後續消息會及時通知。
看來官方後續回應還要再等一波,家人們最近有遇到類似情況嗎?
參考鏈接:
[ 1 ] https://twitter.com/erhartford/status/1729566883350012038
[ 2 ] https://chat.openai.com/share/38e5ec71-a155-4d92-a85c-4b9e598a07fb
[ 3 ] https://x.com/emollick/status/1729358803425001702?s=20