從 AI 開源社區 Hugging Face 的最新榜單上,新聞媒體查詢到了該模型。
圖源:新聞媒體
新聞媒體從知情人士處獲悉,字節發布文生圖開放模型 SDXL-Lightning。
從 AI 開源社區 Hugging Face 的最新榜單上,新聞媒體查詢到了該模型。SDXL-Lightning 跻身模型趨勢榜,同時也成爲 Hugging Face Spaces 上的熱門模型。
與 SDXL-Lightning 一同上榜的,是谷歌新近推出的 " 最強開放大模型 "Gemma 系列,以及 Stability AI 的新一代文生圖模型 Stable Cascade。
在圖像生成領域,先進模型的生成技術依賴于擴散過程,就是把噪聲逐步轉化爲圖像樣本的叠代。這個過程通常需要 20 到 40 次調用神經網絡,不僅會耗費巨大的計算資源,生成速度也比較慢。生成一張高質量圖像,大約需要 5 秒。
據知情人士透露,字節跳動的 SDXL-Lightning 通過漸進式對抗蒸餾的技術,實現前所未有的生成速度。該模型能夠在 2 步或 4 步内生成極高質量和分辨率的圖像,将生成速度加快十倍,是 1024 分辨率下速度最快的文生圖模型,計算成本則降低爲十分之一。
一位分析人士表示,對于需要快速圖像生成的應用場景,如實時廣告創意、遊戲角色設計等,SDXL-Lightning 模型表現出一些應用潛力。這項技術也可以被運用于快速且高質量生成視頻、音頻以及其他多模态内容。
字節跳動智能創作團隊對新聞媒體回應稱,開源開放的浪潮已成爲推動人工智能迅猛發展的關鍵力量,SDXL-Lightning 模型基于已有繁榮生态的文生圖開放模型 SDXL,設計之初就考慮到與開放模型社區的兼容。SDXL-Lightning 可以作爲增速插件無縫整合到卡通、動漫等多樣風格的 SDXL 模型中,并支持當前流行的控制插件 ControlNet、生成軟件 ComfyUI,方便開發者、研究人員和創意從業者結合使用這些工具,助力整個行業的創新和協作。