大火的AI擴圖，爲何被網友直呼“離譜”？

中新經緯 12 月 10 日電 ( 林琬斯 ) 近日，AI 擴圖火爆出圈，抖音話題 "AI 擴圖 " 累積 9.2 億次播放量，"AI 擴得很好下次别擴了 " 的話題在抖音超 7.7 億次播放。

不少網友也在社交平台分享了自己擴圖後的照片，有人稱 " 拯救了我的廢片 "，也有人直呼 " 别太離譜 "" 根本不管人的死活 ""AI 比人還癫 "。目前，AI 擴圖的市場熱度還在發酵，吸引了互聯網巨頭及一些上市公司布局。

頻出意外，原因何在？

AI 擴圖，是将一張照片按照等比例或者自由角度擴展，AI 會根據圖像内容，預測和補充擴展出來的部分。

目前 AI 擴圖的用法，一種是單張圖擴圖，另一種是用一張圖片，不停擴圖。

對比擴展前後兩張圖片可以發現，部分需要擴大背景範圍的照片出圖效果較爲合理，但當原圖出現額外元素需要補充完整時，AI 很難根據細節，想象出相應的人、物形象，比例和位置也不太準确。

在網友上傳的部分作品裏，AI 擴圖直接給人修改了物種：對于拍照不露臉的人長啥樣，AI 擴圖幫你揭曉：" 人模狗樣 "；一女子身着卡其色外套拍照，AI 擴圖直接将上半身 " 嫁接 " 到同色木質栅欄上。更有照片 AI 擴圖後出現不可描述的内容，令網友直呼 " 毀三觀 "。

網友上傳自己的半身照，AI 直接将其變鳥人。圖片來源：社交媒體

這 " 臉牌 " 看着詭異。圖片來源：社交媒體

一位爸爸親吻媽媽的孕肚，AI 擴圖将孕肚當臉用。圖片來源：社交媒體

AI：我是懂脫單許願的。圖片來源：社交媒體

另一種用法是用一張圖片，不停擴圖。根據網友在社交平台上分享的經驗，到最後會變成列車、飛機，變成城市、森林的一角。

一些影視經典名場面也 " 慘遭毒手 "，如甄嬛傳中表情嚴肅，正在回宮路上的甄嬛，擴圖後身穿運動服與運動鞋在深宮中打籃球；第一次 AI 擴圖，躺在枕頭上的皇上出現孕肚，再次擴圖後，AI 給皇上加了腿又加了行李箱，故事更新成 " 孕期離家出走 "。

實際上，走紅的 AI 擴圖，是 AIGC ( 生成式人工智能 ) 領域促生的衆多熱門賽道之一。針對擴圖後出現意料之外的情況，矽基智能 CTO 林會傑在接受中新經緯采訪時指出，這與 AIGC 算法仍未發展成熟，無法做到精準控制生成的圖片内容有關。

林會傑認爲，AI 擴圖與 AI 文生圖技術同源，AI 文生圖需要通過語義信息的輸入才能生成圖片，文字描述本身相對泛化，很難精準控制 AI 呈現的内容，而 AI 理解的内容也很難精準呈現人類的想法，不像人類繪圖一樣精準。AI 擴圖在原有圖片的基礎上擴充一些圖片信息，本質上與 AI 文生圖的技術原理類似。

多家廠商布局 AI 擴圖

實際上，AI 擴圖并不是新鮮事物。中新經緯不完全統計，目前包括 Midjourney、StabilityAI、Adobe、美圖秀秀、Wink 等已試水相關應用産品和場景，涉足 AI 擴圖領域。

今年 3 月，Adobe 發布 AI 創意生成工具 Firefly，并于 5 月底宣布全面開放。其中就有一鍵擴展現有照片和圖像的功能。今年 7 月，Midjourney 更新了 " 平移擴圖 " 功能，可以将圖片自由前後平移。

7 月中旬，港股上市公司美圖公司旗下産品美圖秀秀上線 AI 擴圖功能。目前在美圖秀秀 APP 首頁仍有 AI 擴圖的入口，每人每天有 3 次免費機會，可對圖像進行 110%、125%、150%、200%、300% 不同比例的擴圖。

另外，AI 擴圖在 B 端的應用還包括營銷海報設計、電商圖片制作、遊戲素材設計等。

不過目前，一些個人創作者開發的 AI 擴圖小程序和網站并不多見。中新經緯在微信内進行搜索，以 "XXAI 擴圖 " 命名的微信公衆号、小程序并不多，其中不少也并非免費使用。

下一個熱點在哪？

實際上，就在 2022 年年底，AIGC 另一賽道 AI 繪畫成爲社交平台上的流量密碼，也被衆多網友吐槽 " 多少有點離譜在身上 "。

今年 7 月，妙鴨相機走紅，用戶選擇 20 張以上照片，支付 9.9 元，再選擇喜歡的模闆，就能生成自己的 " 數字分身 "，效果堪比市場價幾十元甚至幾百元的藝術照。

近日，據 " 妙鴨相機 " 公衆号，妙鴨又上線了新功能 AI 修圖。用戶上傳滿意的照片制作一個數字分身，就可以獲得一個量身定制的 AI 修圖師，實現一鍵精修，這讓過去 1 個女生要花 1 小時的美顔修圖幾秒鍾就能完成。

發展至今，AIGC 下一個熱點在哪？

林會傑指出，AIGC 技術未來将更多地往視頻領域發展。他表示，視頻才是使用最普遍、用戶接受程度最高、想象力最豐富的應用場景，遠大于圖片的表現力、互動性與想象力。相比圖片，視頻更能将内容進行高維度呈現。

實際上，今年爆火的 AIGC 還有圖片生成視頻。

近日，阿裏推出了 Animate Anyone，該項目由阿裏巴巴智能計算研究院開發，用戶隻需提供一個靜态的角色圖像和一些動作、姿勢，便可将其動畫化，同時保留角色的細節特征。

11 月中旬，社交媒體巨頭 Meta 發布工具 Emu Video，能夠基于文本和圖像輸入生成視頻剪輯；字節跳動發了 PixelDance 模型，通過描述 ( 純文本 ) + 首幀指導 ( 圖片 ) + 尾幀指導 ( 圖片 ) ，即可生成包含複雜場景和動作的視頻。

另外，Runway 在 Gen2 中上線 Motion Brush 動态筆刷功能，隻需對着圖像任意位置一刷，就能讓靜止的一切物體動起來；Stability 推出 Stable Video Diffusion，可以從圖像中生成高品質的視頻剪輯。

另外，數字人方向也是 AIGC 技術發展和應用方向，數字人技術能夠結合 AI 生成的形象應用于視頻場景。

10 月，明星跨語言翻譯視頻在全網瘋傳，視頻中郭德綱飙英文、歌手泰勒•斯威夫特用流利的中文接受采訪，不僅音色與本人相似，甚至連口型都能對上，這讓不少人表示 " 配音演員要失業了 "。在今年 6 月的上海電影節期間，矽基智能成功 " 複活 " 已逝的人，讓已故導演謝晉通過數字人的形式和現場觀衆見面。

( 更多報道線索，請聯系本文作者林琬斯：[email protected] ) ( 中新經緯 APP )

( 文中觀點僅供參考，不構成投資建議，投資有風險，入市需謹慎。 )

責任編輯：羅琨常濤

作者：王永樂