中新經緯 12 月 10 日電 ( 林琬斯 ) 近日,AI 擴圖火爆出圈,抖音話題 "AI 擴圖 " 累積 9.2 億次播放量,"AI 擴得很好下次别擴了 " 的話題在抖音超 7.7 億次播放。
不少網友也在社交平台分享了自己擴圖後的照片,有人稱 " 拯救了我的廢片 ",也有人直呼 " 别太離譜 "" 根本不管人的死活 ""AI 比人還癫 "。目前,AI 擴圖的市場熱度還在發酵,吸引了互聯網巨頭及一些上市公司布局。
頻出意外,原因何在?
AI 擴圖,是将一張照片按照等比例或者自由角度擴展,AI 會根據圖像内容,預測和補充擴展出來的部分。
目前 AI 擴圖的用法,一種是單張圖擴圖,另一種是用一張圖片,不停擴圖。
對比擴展前後兩張圖片可以發現,部分需要擴大背景範圍的照片出圖效果較爲合理,但當原圖出現額外元素需要補充完整時,AI 很難根據細節,想象出相應的人、物形象,比例和位置也不太準确。
在網友上傳的部分作品裏,AI 擴圖直接給人修改了物種:對于拍照不露臉的人長啥樣,AI 擴圖幫你揭曉:" 人模狗樣 ";一女子身着卡其色外套拍照,AI 擴圖直接将上半身 " 嫁接 " 到同色木質栅欄上。更有照片 AI 擴圖後出現不可描述的内容,令網友直呼 " 毀三觀 "。
網友上傳自己的半身照,AI 直接将其變鳥人。圖片來源:社交媒體
這 " 臉牌 " 看着詭異。圖片來源:社交媒體
一位爸爸親吻媽媽的孕肚,AI 擴圖将孕肚當臉用。圖片來源:社交媒體
AI:我是懂脫單許願的。圖片來源:社交媒體
另一種用法是用一張圖片,不停擴圖。根據網友在社交平台上分享的經驗,到最後會變成列車、飛機,變成城市、森林的一角。
一些影視經典名場面也 " 慘遭毒手 ",如甄嬛傳中表情嚴肅,正在回宮路上的甄嬛,擴圖後身穿運動服與運動鞋在深宮中打籃球;第一次 AI 擴圖,躺在枕頭上的皇上出現孕肚,再次擴圖後,AI 給皇上加了腿又加了行李箱,故事更新成 " 孕期離家出走 "。
實際上,走紅的 AI 擴圖,是 AIGC ( 生成式人工智能 ) 領域促生的衆多熱門賽道之一。針對擴圖後出現意料之外的情況,矽基智能 CTO 林會傑在接受中新經緯采訪時指出,這與 AIGC 算法仍未發展成熟,無法做到精準控制生成的圖片内容有關。
林會傑認爲,AI 擴圖與 AI 文生圖技術同源,AI 文生圖需要通過語義信息的輸入才能生成圖片,文字描述本身相對泛化,很難精準控制 AI 呈現的内容,而 AI 理解的内容也很難精準呈現人類的想法,不像人類繪圖一樣精準。AI 擴圖在原有圖片的基礎上擴充一些圖片信息,本質上與 AI 文生圖的技術原理類似。
多家廠商布局 AI 擴圖
實際上,AI 擴圖并不是新鮮事物。中新經緯不完全統計,目前包括 Midjourney、StabilityAI、Adobe、美圖秀秀、Wink 等已試水相關應用産品和場景,涉足 AI 擴圖領域。
今年 3 月,Adobe 發布 AI 創意生成工具 Firefly,并于 5 月底宣布全面開放。其中就有一鍵擴展現有照片和圖像的功能。今年 7 月,Midjourney 更新了 " 平移擴圖 " 功能,可以将圖片自由前後平移。
7 月中旬,港股上市公司美圖公司旗下産品美圖秀秀上線 AI 擴圖功能。目前在美圖秀秀 APP 首頁仍有 AI 擴圖的入口,每人每天有 3 次免費機會,可對圖像進行 110%、125%、150%、200%、300% 不同比例的擴圖。
另外,AI 擴圖在 B 端的應用還包括營銷海報設計、電商圖片制作、遊戲素材設計等。
不過目前,一些個人創作者開發的 AI 擴圖小程序和網站并不多見。中新經緯在微信内進行搜索,以 "XXAI 擴圖 " 命名的微信公衆号、小程序并不多,其中不少也并非免費使用。
下一個熱點在哪?
實際上,就在 2022 年年底,AIGC 另一賽道 AI 繪畫成爲社交平台上的流量密碼,也被衆多網友吐槽 " 多少有點離譜在身上 "。
今年 7 月,妙鴨相機走紅,用戶選擇 20 張以上照片,支付 9.9 元,再選擇喜歡的模闆,就能生成自己的 " 數字分身 ",效果堪比市場價幾十元甚至幾百元的藝術照。
近日,據 " 妙鴨相機 " 公衆号,妙鴨又上線了新功能 AI 修圖。用戶上傳滿意的照片制作一個數字分身,就可以獲得一個量身定制的 AI 修圖師,實現一鍵精修,這讓過去 1 個女生要花 1 小時的美顔修圖幾秒鍾就能完成。
發展至今,AIGC 下一個熱點在哪?
林會傑指出,AIGC 技術未來将更多地往視頻領域發展。他表示,視頻才是使用最普遍、用戶接受程度最高、想象力最豐富的應用場景,遠大于圖片的表現力、互動性與想象力。相比圖片,視頻更能将内容進行高維度呈現。
實際上,今年爆火的 AIGC 還有圖片生成視頻。
近日,阿裏推出了 Animate Anyone,該項目由阿裏巴巴智能計算研究院開發,用戶隻需提供一個靜态的角色圖像和一些動作、姿勢,便可将其動畫化,同時保留角色的細節特征。
11 月中旬,社交媒體巨頭 Meta 發布工具 Emu Video,能夠基于文本和圖像輸入生成視頻剪輯;字節跳動發了 PixelDance 模型,通過描述 ( 純文本 ) + 首幀指導 ( 圖片 ) + 尾幀指導 ( 圖片 ) ,即可生成包含複雜場景和動作的視頻。
另外,Runway 在 Gen2 中上線 Motion Brush 動态筆刷功能,隻需對着圖像任意位置一刷,就能讓靜止的一切物體動起來;Stability 推出 Stable Video Diffusion,可以從圖像中生成高品質的視頻剪輯。
另外,數字人方向也是 AIGC 技術發展和應用方向,數字人技術能夠結合 AI 生成的形象應用于視頻場景。
10 月,明星跨語言翻譯視頻在全網瘋傳,視頻中郭德綱飙英文、歌手泰勒•斯威夫特用流利的中文接受采訪,不僅音色與本人相似,甚至連口型都能對上,這讓不少人表示 " 配音演員要失業了 "。在今年 6 月的上海電影節期間,矽基智能成功 " 複活 " 已逝的人,讓已故導演謝晉通過數字人的形式和現場觀衆見面。
( 更多報道線索,請聯系本文作者林琬斯:[email protected] ) ( 中新經緯 APP )
( 文中觀點僅供參考,不構成投資建議,投資有風險,入市需謹慎。 )
中新經緯版權所有,未經書面授權,任何單位及個人不得轉載、摘編或以其它方式使用。
責任編輯:羅琨 常濤
作者:王永樂