2016 年,由人工智能撰寫《電腦寫小說的那一天》小說成功通過了日本「星新一文學獎」的初選;Sony 開發的 DeepBach AI 在深度學習巴赫後,創作出的仿巴赫音樂,在 1600 位聽衆裏,騙過了超過一半的人,讓他們以爲這就是巴赫本人的創作。
如今,人工智能已經能生成真假難辨的視頻,極具藝術感的圖像。
人工智能正在挑戰着文學、音樂、繪畫、影視等等這些原本屬于藝術創作的領域。當藝術難以成爲人類對抗 AI 的護城河後,許多人認爲,詩歌或許是智能時代,人類最後被攻克的堡壘。
詩歌被認爲是人類文學最初的起源,在尚未有文字的人類社會,詩歌就以口語的形式流傳在文明裏。它在形式上考驗節奏和韻律,在表達上考驗想象和凝練,它需要表達者把經驗、觀察、意識結合,畢竟詩歌的創作依托于于人類特有的通感,因此我們可以讓 ChatGPT 寫一首關于月亮的詩,它隻會泛泛而談,而無法和人類在當時當刻,設身處地看到獨一無二的月亮。
但是,如果 ChatGPT 有了能「看到」月亮的能力,給它思考賦予觀察呢?
基于這個想法,Kelin Carolyn Zhang 和 Ryan Mather 兩位設計師和開發者鼓搗出了一台設備:讓攝影機去「所見」,讓人工智能去「所感」,用技術的手段去實現文學裏最難以量化的表達。
這就是詩歌相機(Poetry Camera)。
相機與詩
詩歌相機内核搭載了樹莓派,一個隻有信用卡大小的微型電腦,得以成像和調取 GPT-4 的 API,這就打通了設備的「眼睛」和「大腦」。
舉起詩歌相機,随便拍下一張照片,計算機視覺算法會開始分析視覺數據,人工智能模型開始解釋圖像,識别圖像裏關鍵元素、顔色、環境、影調情緒等信息,生成詩,并且以類似超市收銀條的方式打印出來,就好像拍立得「洗」出照片一樣。
拍照出詩不出片,這可比拍立得更讓人有期待和驚奇感。不看宣傳看效果,它能生成怎樣的詩歌呢?
圖源:TechCrunch
有用戶拍下了早上自己在家裏喝咖啡時玩手機的樣子,詩歌相機的創作是:
鏡頭後面,一人調整視線,
在正方範圍裏的像素空間。
……
日光透過褪色的薄紗,
他手上,溫熱的咖啡流轉。
對話傳出,跨過虛拟的邊界,
他的倒影鏡像,在屏幕上出現。
書架上,書本傾斜,無聲的喋喋不休,
茂盛的植物,是唯一的生命。
戴着眼鏡,家成了他平靜的面糊,
在這堵牆裏,他的世界四散開來。
在 2024 年 4 月的一個清晨,
一種新的常态,悄悄地磨損。
@poetry.camera
不難看出,哪怕經過簡單翻譯,它生成的文字依然有詩歌特有的「意象感」。詩歌相機的原文更顯用詞文法上「刻意地精妙」,比如每一段都在押韻腳,比如第一段的 lens,gaze,space,place,race,第二段的 sheers,steers,frontier,appears。在用詞上也會采用詩歌用詞,比如把 morning 寫成 morn,就像中文裏把「早上」寫成「晨」一樣。
圖片來源:TechCrunch
另一演示則是對着紐約公共圖書館的天花闆拍張照,它會解讀并創作出:
「天花闆的影子之舞,
如同金鑲木,
用春日天空欺騙了眼睛
石碑和木梁下
伫足」
兩位開發者表示,由于詩歌相機的開源屬性,用戶其實可以根據個人喜好更改源代碼,重新編程和選擇不同的詩歌形式,不局限于現代自由詩,也可以是日本俳句或七言絕句,後續可能會給用戶不同大模型去選擇,比如從 GPT-4 換到更擅長理解文字和語義的 Claude,或者更擅長寫故事的 Dragonfly。
兩位開發者表示「隻想享受科技的樂趣」|圖源:Poetry Camera
而且詩歌相機不會以任何數字方式保存,用戶既看不到相機拍到了什麽,也不能直接複制粘貼文本,如果想留存一份,隻能拿起手機拍下來這一張詩條。因爲兩位開發者認爲,除了技術問題(需要服務器和雲平台)、隐私問題之外,詩歌的瞬時性給它增添了額外的意義,打印出來的「詩條」是瞬時捕捉,随機生成,獨一無二的實體存在。
在屏幕主宰我們日常生活的當下,詩歌相機這種設計把視覺以詩意用物理的方式呈現,讓它在數字之外,增添了一絲模拟化的浪漫氣息。
你我都能做
「拍下所看到的景觀,讓相機生成詩歌」這一想法不僅富有創意,似乎看着還挺難實現的?但實際上,你我都可以做出一台詩歌相機。
詩歌相機到現在也還停留在一個「藝術項目」的階段,兩位開發者也暫未有大規模商業化的計劃。他們隻是産生詩歌相機的想法,鼓搗出了一台能實現想法的硬件,他們所用到的軟硬件都是開源的,因此兩位開發者選擇在網站上把詳細的制作過程公開,鼓勵更多的用戶 DIY 自己的詩歌相機。
詩歌相機的内核是微型卡片計算機樹莓派,再附以一些常見配件,再加上樹莓派的相機模塊、一台迷你熱敏打印機、六個電池、一個按鈕就夠了。
官方把詳細的 DIY 教程發到了 GitHub|圖源:Poetry Camera GitHub
而詩歌的生成則要對接到 ChatGPT-4 的 API 密鑰,在按下快門時,會觸發腳本,把采集到的圖片發送到 GPT-4 上創建一首詩,最後在熱敏收據打印機上打印出來。
兩位開發者已經寫好了全流程腳本,隻要按照他們給的詳細步驟逐步設置,不需要會編程和 3D 打印,紙殼裏也能造出一台詩歌相機。
兩位開發者的調試用機|圖源:flomerboy
如果說喬布斯所信奉的「技術和人文的十字路口」讓他造出了極具美感的數碼産品,那詩歌相機則是用一種互動形式上的創新,給予我們另一種技術和現實交互的可能,突破界限,創造新的表達形式,甚至進一步反向激發人類的觀察和想象。
這也是兩位開發者秉持的理念:技術應該融入生活,讓我們能更好地欣賞日常,而不是擠壓人類的生存空間。
聯合創始人 Kelin Carolyn Zhan 坦言道詩歌相機的意義所在「對我來說,這仍然是藝術,它是關于表達的。詩歌相機是一台塑造我們想要看到的世界的工具,這也是一個人們可以把玩新技術的世界:人工智能并不全是厄運和悲觀,也不僅僅是用更深、更快、更糟糕的方式模仿人類,而是用新技術創造全新的工具,再讓工具再次帶出人類内心的孩子。對于這個項目來說,這不是爲了賺錢——而是爲了讓那些天真的奇迹再次成爲可能。」
但在創意之外,我們又不得不産生疑惑:GPT-4 生成的詩已經模有樣,那在詩的創作上,超越人類是否隻是時間問題?
人工智能寫的詩,能和人比嗎?
當我們站在賞鑒的角度再看詩歌相機的成詩,可以感受到人工智能和詩人作詩上的差異所在,人工智能寫的詩有更明顯地「描述」和「順序」,用詞上更連貫,比如「日光透過褪色的薄紗」「天花闆的影子之舞,」,更像是用文雅的詞描述一個場景,其中缺少了詩歌難以描述的抽象感和意象美。
就像詩刊社在《GPT 時代,詩歌的意義和價值所在?》裏提到的,「GPT 的出現是對文本順序的改變,它省略了世界與作者的概念,中間加入的是标準化、數字算法,卻沒法模仿詩歌的意象。」
詩人夏宇所寫的現代詩|圖源:夏宇
詩人歐陽江河也曾在采訪裏說到「寫作背後的廣闊性是人的生命、人的世界觀。這些包括了生命的感動、生命的升華、生命的傷痛、生命的恐懼、生命的黑暗、生命的愛、生命的愚蠢、生命的局限性。但人工智能不可能有生命,人工智能太聰明了,它沒有疼痛,沒有生命的脆弱感和恐懼,而詩歌正是這些的産物。如果沒有這樣的來源,隻剩下漂亮的句子是沒有意義的。」
詩不像圍棋或公式,詩沒有确定的答案,當我們質疑人工智能寫詩的能力,我們更多是在質疑它詩的由來。
就像在 1982 年的科幻電影《銀翼殺手》裏,人造人羅伊 · 巴蒂在死前留下了全片最富有詩歌氣息的台詞,這意味着人類,至少《銀翼殺手》的創作團隊相信,在共同經曆了對生命的感受之後,人工智能體也能創作出優美且富有人性的詩歌。
羅伊 · 巴蒂死前獨白|圖源:銀翼殺手
回到詩歌相機上,在我們了解這個設備後,并沒有感受到一種「被人工智能挑戰」的緊迫感,反而是新奇更甚,畢竟當我們觸手可及的設備能進行一種藝術的表達時,它也随之解鎖了我們看待周遭的一種獨特的方式。
就像詩人夏宇在 2023 年與 ChatGPT 合作完成了一冊詩集《驗證您是人類》,她和 ChatGPT 探讨詩、評論、語言、機器、笑話……最終她在采訪裏說道「人類至上的人類又在搞機器人,處處代入人的語法人的意圖動機人的情感……與 ChatGPT 的溝通,透過它習得的人類語言,它也學得很快,我還是希望它保留它的機械性不要輕易進入人性。」
與其去較真人工智能和人類在寫詩上還有多少差距,甚至産生精神危機感。我們更應該關注,用算法和數據喂飽的人工智能是怎樣觀察被我們忽視的周遭,它又能否激發出人類的詩性。
頭圖來源:Poetry Camera