不久前人們還忙着在妙鴨相機排隊生成寫真,轉眼間又開始到美圖秀秀使用 AI 擴圖了。
早在 7 月,美圖秀秀官方微博就曾發文,稱 "AI 擴圖 " 功能現已上線,美圖秀秀 App 和 Wink App 均可以立刻體驗 AI 擴圖功能。而最近,妙鴨逐漸淡出互聯網,AI 擴圖卻接替了讨論熱度。
而近日,快手自研文生圖大模型 " 可圖 "(Kolors) 也開啓内測。
事實上,從 ChatGPT 火爆全網後,國内的 AI 相關應用也相繼出現在大衆視野,但從此前的妙鴨,再到如今的美圖秀秀,在 C 端出圈的多以圖片生成類應用爲主。
美圖秀秀 " 截胡 " 妙鴨,快手在後?
"AI 擴圖也太牛了,直接拯救旅遊廢片 "
" 我真的要報警了,AI 擴圖出來的效果又搞笑又離譜 "
"AI 擴圖擴得不錯,下次不擴了 "
……
最近在各大社交媒體平台,不難見到類似的美圖秀秀 AI 擴圖分享。
據官方介紹,該功能基于 AI 算法智能識别,可根據圖像的上下文和紋理,預測、生成缺失的部分,能夠爲原始圖片帶來更大畫幅、更廣視角。
目前在美圖秀秀 App 首頁可找到入口,每人每天有 5 次免費體驗機會,可對圖像進行 150%、200%、250%、300% 四種不同比例的擴圖,系統預設比例爲 125%。
鋅刻度留意到,在微博、小紅書等社交媒體平台,已有不少網友發布自己的 AI 擴圖圖片。小紅書上 #AI 擴圖 # 話題已有高達 2128.4 萬的浏覽量,而抖音上同樣的話題則有超兩百萬次播放量。其中在小紅書上,最熱的一篇相關筆記 " 被 AI 擴圖吓暈,AI 你的審美别太好 " 點贊量達 3.3 萬。
不過,AI 擴圖出圈也呈現出兩極評論,大部分需求爲 " 調整構圖,完善背景 " 的圖片之所以出圈是因爲效果不錯,但也有不少令人直呼 " 離譜 " 的圖片催化了 AI 擴圖出圈,其中包括擴圖時被補充了奇怪的衣服、增加了奇怪的肢體、出現了陌生的臉龐、懸浮在水中的頭顱等等。
部分出圈的 AI 擴圖照片
事實上,AI 擴圖并不算新鮮事物。早在今年五月底,Adobe Photoshop 測試版上線了一個名爲 "Generative Fill" 的 AI 圖像合成工具;今年七月份,Midjourney 則更新了 " 平移擴圖 " 功能,可以将圖片自由前後平移,相較于之前推出的 "Zoom Out" 功能裏隻能固定的 " 擴圖 1.5 倍 " 或 " 擴圖 2 倍 ",顯得更加人性化。
但對于國内的大部分人而言,對 AI 擴圖的應用還是從美圖秀秀開始的。目前對 AI 擴圖的讨論也主要聚焦于美圖秀秀。
值得一提的是,上一次引發對 AI 圖片應用讨論熱潮的,還是可以生成個人寫真的妙鴨相機和生成芭比寫真的 "45AI"。然而,幾個月過去,在社交媒體上,這兩款小程序的讨論度已然下跌,取而代之的是或離譜、或吓人或 " 真香 " 的 AI 擴圖。
如果說目前美圖秀秀憑借 AI 擴圖順利 " 截胡 " 妙鴨,那不得不提醒一句,還有快手在後。
9 月,快手在短視頻評論開始内測 " 快手 AI 玩評 ",而據官方介紹,快手 "AI 玩評 " 依托于快手自研文生圖大模型 " 可圖 "(Kolors)強大的圖像生成能力,用戶可以通過輸入各種創意文字,一鍵生成海量風格圖片,可以更輕松、便捷地在評論區進行趣味互動。
不過,目前在各大社交媒體平台關于 " 可圖 " 的讨論還較少。
爲何圖片生成類應用更易出圈?
回溯近幾年來,國内 AIGC 真正意義上破圈的現象級産品似乎大多都誕生在圖片這條賽道。
"AI 對話類的也玩過,但總覺得對話很傻,也并不如想象中有趣。但是像妙鴨、AI 擴圖我都用過,确實會經常收到意料之外的圖片啊,不管是離譜的還是效果不錯的,在社交平台發出來的讨論度都還不錯。"20 歲的桃子常年刷社交平台,對一切新鮮事物都很好奇,但相較于 ChatGPT 這一類的對話式 AI,她更樂于嘗試圖片類應用。
" 圖像相關的應用軟件确實更容易被用戶接受和使用,因爲在應用層面,人們對圖像 ai 功能的要求偏工具化,用戶對 ai 的預期是很明确的。" 祁隋是國内一科技企業的算法工程師,他告訴鋅刻度,圖片類應用更容易出圈還有技術方面的原因," 從全球來看,近 10 年的 AI 浪潮是從 2012 年的一場名爲 ImageNet 的圖像識别比賽中萌芽,所以 AI 模型結構也更适合在圖像上應用,效果和效率都比文字更好,而在文字上的應用一直到 2018 年 Transformer 結構被發明出來後,才算勉強勢均力敵,應用領域離 C 端也相對較遠,直到最近找到了生成式 AI 這個突破口,被大衆所熟知。"
而在中國,文字内容生成比圖像内容生成的難度也更大," 因爲文本訓練需要大量高質量的數據,中文數據從質和量上肯定都比英文數據更有挑戰性。尤其是對話式 AI 是開放式的,任務也更爲多元,對于數據質量和數量的需求更是躍升了一個量級。" 祁隋稱。
不過,在祁隋看來,未來 AI 的發展方向是圖像 + 文本的多模态大模型。"36 氪 " 此前也曾提到,想要更接近通用人工智能,提高 AI 對圖像、語音、視頻等多模态内容的理解不可或缺。相較于注重文本交互的單模态語言模型,多模态模型能将 AI 領域拓展至識别、檢測等更廣泛的領域。
那麽,下一個引發現象級關注的 AI 應用又會是什麽呢?