
2024 年快結束了,讓 AI 在圖片上精準生成文字,并且字體和排版都好看,很大程度上還是一個難題。
我們之前測評過 Ideogram、Recraft,它們可以解決部分生成英文的需求。誇完之後,文章裏總要遺憾地補上一句——不支持中文哦。讀者們乘興而來,敗興而歸。
這不怪海外的 AI,中文的偏旁部首,本來就比英文的字母要難。
有了金剛鑽,才能攬瓷器活。生成中文的空白,終于有國内的 AI 文生圖産品填補了:字節豆包。
10 秒出圖,讓我們說中文的表情包神器
豆包的生成中文功能,目前在 app 上線,使用方法很簡單,直接就在文生圖的提示詞裏寫,你要加什麽文字。暫時還不支持,給上傳的參考圖片加文字。

經受過模拟經營遊戲《沙威瑪傳奇》洗腦的朋友,一定把那句沒有一個字在調上的「讓我們說中文」刻在腦海裏了。
那咱們也可以複刻一個手抓餅大王的店面,不同以往的是,這次真的可以說中文,紅色招牌上是工工整整的五個大字,而且 10 秒左右就搞定了。

豆包不偏科,中英搭配也可以,一個凸顯手作感的咖啡店 logo,水靈靈地誕生了。

一兩行字,或許還說明不了什麽,接下來讓我們加大難度,字要多,排版也要到位。
從《再見愛人 4》熏雞事變獲取靈感,我用提示詞給豆包下達了幾個需求。

提示詞寫得很長,但豆包聽懂了,整體的完成度很高,文案也沒有寫錯。

AI 生成具有不确定性,我反複生成了幾次,還是最滿意這張,雖然字體沒有完全符合要求,熏雞不夠寫實,小字亂碼,但畫風賞心悅目,熏雞油光水滑。
俗話說,土到極緻便是潮,老年人表情包就是其中一個例子,大緻包含以下特點:醒目的文字、大吉大利的元素、blingbling 的特效。
習慣了抽象和陰陽怪氣的我們,也可以學習這種有話直說的精神,比如,讓豆包生成一個「相親相愛一家人」。

貓咪、錦鯉、玫瑰、星星點點的閃光,圍繞着漸變色填充的大字,有土味複古的懷舊感了,不多,大概 40% 吧。
豆包的文生圖有一個很方便的設計——選擇風格。不用寫提示詞,點擊一下,我們就可以駕馭電影、卡通、膠片等風格。
将特殊的風格和精準生成的中文字一起用,會有事半功倍的效果。結合像素風格,我們可以讓豆包畫一個四格漫畫。

我的提示詞寫得很簡單,隻是要求了每一格的文字和畫面内容,豆包給的畫面略有偏差,但文字完美,大家也可以參考這個形式,換個主題多試試。

可能有朋友會疑惑,爲什麽生成中文字是個很重要的需求,不能先把圖片生成,再放在 P 圖軟件把文字打上去嗎?
這麽做當然也可以,但讓 AI 直接生成圖案和文字,風格實現無縫的适配,完全沒有 P 圖感,玩法還無窮無盡,何樂而不爲?不過,消除亂碼的小字,還是用得上 P 圖軟件。
哪裏都用得上,人人都能設計海報和壁紙
除了整活,豆包當然也可以做些有用的設計。一鍵生成海報、壁紙、節日祝福,從此不是沒有可能了。
什麽叫有用?對于我來說,群聊的聊天背景就是一個剛需,提醒我不要在錯誤的地點講不恰當的話。
那就讓 AI 來設計一個,并要求把文字放在黃色的警示标志裏,這份打工人打工魂,豆包也應該接收到了。

我怕過年的鞭炮太響,現在就想給你新年的祝福,祥雲和元寶應有盡有。給親朋好友的紅包封面,以後不妨叫 AI 幫忙設計。

A 妹主演的、由百老彙音樂劇改編的《魔法壞女巫》正在北美熱映,國内也已經定檔,和熱度不符的,是海報的簡陋設計。
不如讓豆包重做一次,我從原海報反推提示詞,說明了畫面的要素,接下來就交給豆包。
至少,豆包做了字體設計,更貼奇幻電影的主題和氛圍,原海報反而像用 Word 和 PPT 花體字打出來的。

除了歌舞片,東方美學風格海報,豆包也可以拿捏,呈現大氣磅礴的毛筆字。

寫得好看是一方面,更重要的是豆包聽提示詞的指揮,文字是什麽風格和顔色,把字放在什麽位置,基本都能順從我們的心意。如果一次沒有,那就多生成幾次。
用豆包設計小紅書封面,圖片上下的字體和顔色可以不同,全看我們自己想要什麽效果。

豆包也能做逼真的産品圖,文字根據包裝的角度傾斜,像是印刷在包裝上。

設計 B 站長視頻的封面,當然也難不倒豆包,既專業又有親和力。

所以,技術是到位了,最重要的還是我們自己的腦洞夠不夠大,審美夠不夠好。
設計工作還無法被 AI 替代,但我們每個人最好都要有些設計思維,AI 才能更好地呈現我們的所思所想。
用 AI 産品解決問題,就選接地氣又全面的
國内率先把生成中文字的功能做進産品的,是字節的豆包,可以說,毫不意外。
豆包,是國内大模型産品中,真正既接地氣又全面的,每次推出一個新功能,都讓人覺得,這正是我需要的。
AI 寫作、AI 搜索、文檔和網頁總結,這種大模型标配的功能,豆包當然具備了。

▲用豆包生成一個類似文字冒險遊戲的對話界面
AI 智能體,豆包給了用戶海量的選擇,既能像 GPTs 那樣滿足各種垂直功能,又能類似 AI 陪伴軟件陪你聊天。
拍照搜題、語音通話、圖片生成、音樂生成、視頻生成,各色各樣的多模态功能,豆包都有。

▲用豆包生成一個小紅書流行的動物表情包
我們對于 AI 的所有核心需求,豆包基本都涉及,同時,豆包的渠道也廣闊,實現了移動端和網頁端的全覆蓋,不管是工作還是娛樂,我們都可以随時和豆包聊聊。
值得一提的是,本周豆包 PC 版将内測視頻生成功能。根據我們之前的測評,豆包的視頻生成模型,相較于 Luma、Runway 等國外産品,更懂中文和中文用戶,更适配中文互聯網中的創作工作流。

▲用豆包生成一個古早遊戲裝備欄界面,恭喜你拾取「豆包」一個。細節不完美,但有内味了
這句話放在圖片生成上也是一樣,Ideogram、Recraft 可以生成英文字固然好,但豆包率先把生成中文字的難題解決了,才真正解決了國内用戶的痛點。
不像僞文青們愛說的「你好特别,你給我一種疏離感」,「豆包」從名字到 logo 都讓人覺得格外親切,然後這種溫度也被帶入了産品的設計裏,豆包的功能都非常容易上手,主打一個新手友好,不白來,來了都能用。
中文是一門博大精深且對 AI 精準生成具有一定挑戰性的語言,這世界這麽多人,每個人都可以用 AI 設計一點什麽,無論用什麽設備,說什麽語言。AI 産品都該往這個方向進化,而先爲中文用戶交出答卷的,是豆包。