Gemini 2.0說說話就能一鍵 P 圖的功能爆火,把玩不了的大夥兒都饞哭了!
比如一輛小車車:
輸入指令 " 把這輛車改裝成敞篷車 ",它就能立馬将文字指令和圖片結合起來,完成一鍵 P 圖。
讓我們來找茬兒,發現除了車變成了敞篷的,其它元素木有變化,很好地保持了一緻性。
不僅于此,Gemini 2.0 還有點 " 多模态版 o1" 那味兒。
繼續輸入指令:想象一下,這輛車内裝滿了海灘用品。接着,将車身顔色改爲一種令人聯想到夏日的顔色,并在改變過程中進行說明。
然後 Gemini 2.0 就開始圖文并茂地一步步推理生成了,先把車變成了明亮的黃色,接着又再車裏裝滿了遮陽傘等海灘用品
這就是 Gemini 2.0 系列的原生圖像輸出能力。
評論區底下,一水兒都是求具體上線時間的:
被谷歌挖走的 OpenAI 大将 Logan Kilpatrick 回應,大夥兒别急,明年年初将更廣泛地推出。
除了上面展示的簡單 P 圖,你甚至可以同時 P 圖片中的多個元素,還能把一個物件變成另一個。
比如,把蓬松的夾克變成一個小枕頭,并且拿掉毯子:
這還沒完,結合不同的圖來 P也行。
貓和抱枕結合,就得到了一個很有質感的貓貓抱枕:
把貓貓和滑闆結合就得到了貓貓代言滑闆。
遵從文字指令,Gemini 2.0 成功将貓貓變成了插畫貼紙形态。
除此之外,Gemini 2.0 P 圖時還能更有想象力。
比如一個箱子,把箱子打開就變成了醬嬸兒:
開頭展示的小車車,也能變成 " 飛車 ":
另外,還有一種玩法。
在圖像中圈出需要 P 的區域,隻需 "Open this",Gemini 2.0 可以直接結合文字指令理解圖像,知道 "this" 的指代:
不得不說,那些有内測資格的玩家,可算了把大夥兒饞壞了。
參考鏈接:https://x.com/OfficialLoganK/status/1868364831948251419
— 完 —
點這裏關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~
>