最新 AI 文生圖模型Flux1.1,一夜刷屏。
隻需一個簡單技巧,就能去除圖中的 "AI 味 ",無論人物還是風景都能達到照片級效果。
評論區網友的反應 be like:我分不清,真的分不清啊。
這個技巧用起來也非常簡單,在提示詞中模仿單反相機的文件命名格式即可。
比如"CR2"就是佳能相機使用的原始圖像文件格式,輸入"IMG"+ 随機編号 +".CR2",再加指定的内容,就能獲得一張寫實圖像了。
後面也陸續有嘗試過的網友反饋,換成索尼相機的"ARW"、尼康相機的"NEF",甚至蘋果的"HEIC"格式,都能獲得不錯的結果。
以至于有人都開始懷疑,不會是模型随機吐出來一張訓練數據裏的真照片吧?
不過放大看一些特定細節,還是很容易看出确實是 AI 生成的,比如車牌号上的文字都是亂碼。
那麽是否 Flux1.1 模型本身能力就很強大,這個技巧在其中起到了多大作用呢?
一位資深修圖師傅曬出了對比,左邊加了 IMG_1018.CR2,對比右邊不加的,他認爲差别巨大。
我們的實測結果也能看出,加上這個技巧能顯著提升畫面真實性。
現在想免費試玩這個 Flux1.1 模型,可以來到together.ai平台,注冊即送 5 美元的積分。
随便生成一張在長城的遊客自拍照,乍一看像那麽回事,但仔細觀察人物皮膚質感、背景山和植物都有還是有一股 AI 味。
換成 "IMG_0314.cr2: selfie on The Great Wall",是不是立馬就不一樣了?
代号藍莓,最新 SOTA 文生圖模型
随着 FLUX1.1 的正式發布,此前在文生圖模型排行榜上屢占榜首的兩個無人認領的" 藍莓 "模型的神秘面紗也被揭下,正是它。
官方不藏了,直接放出數據,在 Artificial Analysis image arena 上,FLUX1.1 [ pro ] 以 "blueberry" 爲代号,超越所有其它模型,獲得最高的整體 Elo 評分。
相比之下,FLUX1.1 [ pro ] 價格也更低,速度更快,各項指标超越 Midjourney、SD3、Ideogram 等。
生成速度上,FLUX1.1 [ pro ] 在保持圖像質量、指令響應和多樣性提升的同時,速度是前代 FLUX.1 [ pro ] 的 6 倍。
順便提一下,現在 FLUX.1 [ pro ] 也進行了更新,速度是之前的 2 倍,FLUX1.1 [ pro ] 的速度是目前可用的 FLUX.1 [ pro ] 的 3 倍。
此外,官方表示即将推出快速高分辨率生成,FLUX1.1 [ pro ] 可原生支持的那種,在不犧牲任何指令響應情況下,能生成 2k 圖像。
FLUX1.1 [ pro ] 将通過 Together.ai 、Replicate 、fal.ai、Freepik 等在線平台提供。
同時官方還推出了 BFL API,可供其他開發者集成到自己的應用程序中,API 定價是:
FLUX.1 [ dev ] :每張圖 2.5 美分(約 RMB 0.18 元)
FLUX.1 [ pro ] :每張圖 5 美分(約 RMB 0.35 元)
FLUX1.1 [ pro ] :每張圖 4 美分(約 RMB 0.28 元)
Stable Diffusion 原班人馬打造
FLUX1.1 [ pro ] 的背後是Stable Diffusion 原團隊,成員包括 Robin Rombach、Andreas Blattmann、Dominik Lorenz 等。
△Robin Rombach
其實 Stable Diffusion 最初是一個學術研究項目。
由 Bj ö rn Ommer 教授領銜,Robin Rombach、Andreas Blattmann、Dominik Lorenz 等幾位慕尼黑大學機器視覺與學習研究小組成員,以及 Runway 的研究人員 Patrick Esser 完成。
研究論文發表七個月後,Stability AI 開始介入,提供計算資源,以進一步開發文本到圖像生成模型。2022 年,上述幾位論文作者加入 Stability AI。
團隊一同創建了 Stable Diffusion XL、Stable Video Diffusion 等。
ICML 2024 最佳論文之一、Stable Diffusion 3 技術論文的 Rectified Flow Transformers,還有 SDXL-Turbo 使用的對抗擴散蒸餾方法(Adversarial Diffusion Distillation),也是這幫子人在研究。
今年三月份這些核心研究團隊成員被曝集體辭職。
而後,他們組成了新團隊名爲Black Forest Labs(黑森林實驗室),總部位于德國。
今年 8 月初剛剛宣布成立,并發布了其初代文生圖模型 FLUX.1,FLUX.1 有三個變體:FLUX.1 [ pro ] 、FLUX.1 [ dev ] 和 FLUX.1 [ schnell ] ,平衡了性能和可訪問性。
目前黑森林實驗室已完成種子輪融資,共融資 3100 萬美元,Andreessen Horowitz 領投,Brendan Iribe、Michael Ovitz、Garry Tan、Timo Aila 和 Vladlen Koltun 等跟投。
據說他們還已經收到 General Catalyst、M ä tchVC 的後續投資。
黑森林實驗室和馬斯克還有合作,将其圖像生成模型引入 xAI 的 Grok 助手中。
接下來,團隊透露将推出 SOTA 級文本到視頻生成模型。
據說他們正在以 10 億美元的估值籌集 1 億美元資金,比之前 1.5 億美元的估值大幅上漲。
從 Pika 1.5 到 Meta Movie Gen,今年下半場視頻生成賽道爆火,黑森林實驗室的加入,或許會帶來不一樣的火花。
Flux1.1 試玩
https://api.together.ai/playground/image/black-forest-labs/FLUX.1.1-pro
參考鏈接:
[ 1 ] https://x.com/fofrAI/status/1841854401717403944
[ 2 ] https://blackforestlabs.ai/announcing-flux-1-1-pro-and-the-bfl-api/
[ 3 ] https://techcrunch.com/2024/10/03/black-forest-labs-the-startup-behind-groks-image-generator-releases-an-api/