谷歌版 o1 來了!在奧特曼 " 雙十二 " 倒數第二天——
他們發布Gemini 2.0 Flash Thinking,顧名思義,以閃電般的速度解決複雜問題并展示其思考過程的實驗模型。
從姐夫哥展示出的 Demo 來看,它能在幾秒鍾之内解決一個物理問題,并且給出思考過程。
還可以給一張圖,同時涉及視覺和文本線索的謎題。
如何用其中三個數字加起來等于 30?
結果同樣也是短短幾秒,思考了好幾種方案,最終确定是需要将 9 号球翻轉爲 6 号球,以實現 6+13+11 等于 30 這樣一個結果。
所有綜合類别指标中顯示,目前 Gemini 2.0 Flash Thinking 排名第一,包括數學、代碼、指令跟随、長 QA、創意寫作等等各方面。
目前在谷歌 AI Studio 就可以免費使用。
從衆多網友實測中,主要分爲兩大 " 派系 ",一種是純文本型,另一種是視覺類謎題。
最明顯感知的就是一個快字。
它還可以解決像抛硬币這樣的概率問題:如果我一直抛硬币,直到得到 HHH 或 HTH,那麽得到這兩個幾率之比是多少?
甚至它還可以解析摩斯代碼,讓網友直呼:怪吓人的。
有解決這種視覺類謎題的,比如找出這裏面的字母和數字,并且說明出現了多少次。
結果它都一一指出來了。
DeepMind 首席科學家拿出了他當年面試時遇到第一個問題,是用筆和紙寫下的一道關于數論的問題。
結果它也秒秒鍾回答了出來。
目前僅支持 32k 上下文窗口,也不支持聯網。不過主創表示接下來會在新的一年裏快速跟進,提供更長的 token、更多的工具支持等。
今天之所以推出這個實驗版,主要是爲了接受大家的反饋意見。
也有網友反饋,它沒有考慮到一些關鍵的物理因素。
△沒有考慮到河流流動所暗示的海拔
不過也有不少網友反應,有個 bug 是,它似乎還是搞不清楚 Strawberry 有多少個 r。
但如果進一步「仔細思考一下」,它就能回答出來。
姐夫哥還透露,未來還會有更多功能,可以在這裏期待一下子。
好了,感興趣的小夥伴可以前往去試試。
體驗鏈接:
https://aistudio.google.com/prompts/new_chat
參考鏈接:
[ 1 ] https://x.com/OfficialLoganK/status/1869789820308074837
[ 2 ] https://x.com/JeffDean/status/1869789813232341267
[ 3 ] https://x.com/lmarena_ai/status/1869793847548817563
[ 4 ] https://x.com/drjwrae/status/1869806621024772096/video/2
[ 5 ] https://x.com/catebligh/status/1869823074809647589
— 完 —
點這裏關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~
>