圖片來源 @視覺中國
文 | Alter
在 ChatGPT、Midjourney、Stable Diffusion 等新事物的作用下,不少人或多或少聽說過 Prompt 的概念。
雖然 OpenAI 掀起的大模型浪潮再度刷新了人們對 AI 的認知,但現階段的 AI 終歸還不是強人工智能,大模型裏的 " 知識 " 存儲在一個隐性空間裏,需要輸給 AI 正确的指令,也就是過去幾個月中頻頻被讨論的 Prompt。
有人将 Prompt 翻譯成 " 提示詞 ",也有人翻譯爲 " 激發詞 "。再感性一些,就像童話故事裏的魔法一樣,Prompt 是 AI 時代的魔法,擁有它就擁有 " 巫師 " 一樣的能力。
01 Prompt 是什麽?
并不難理解 Prompt 的字面含義,可爲何會出現 Prompt 這個概念?既然是 ChatGPT 炒熱的新名詞,不妨讓 ChatGPT 自己來回答。
這個回答中規中矩,但還是可以提取到一些有價值的信息:一,Prompt 繼承了計算機編程裏的命令行提示符,可以理解爲控制 AI 的指令;二,在生成式 AI 的語境裏,Prompt 的價值在于引導,而非計算機裏的命令。
打個比方的話:大模型就像是人類的大腦,知識被存儲在神經元聯接中,隻有當你遇到具體的問題時,就像 " 你最喜歡的食物是什麽?" 大腦才會給出确切的答案,Prompt 等于是一個個具象的問題。由此産生了一種流行的說法,即提問比回答更重要。你使用 ChatGPT 所遇到的 " 邊界 ",實際上是你自己的 " 邊界 "。
但 Prompt 的價值體現,并不在于 ChatGPT 代表的對話機器人,而是 Midjourney 爲首的圖像生成類應用。
簡單來說,你要告訴 AI 想要什麽樣的圖,想要把自己腦海裏的東西變成肉眼可見的圖案,需要幾十個單詞作爲 Prompt。哪怕隻有一個提示詞的差異,AI 所生成的圖像都可能有着質的差别,怎麽正确地給 AI 投喂 Prompt,逐漸成了一門深奧的學問,并衍生出了提示語工程學(Prompt Engineering)的說法。
以至于在衡量大模型的能力時,出現了三個标準:一是大模型的預訓練水平;二是用來進行預訓練語料數量和質量;三是提示語的水平。直接的例子就是外界對文心一言文生圖的質疑,即使不考慮前兩個因素,單單在提示詞方面,就足以讓文心一言和 Midjourney 拉開幾條街的距離。
因爲在文心一言上想要生成圖片,普遍給的指令是:幫我生成一張 XXX(這也是百度官方的示例),解析爲 Prompt 時注定隻有幾個提示詞,遠不足以表達腦海裏想要的畫面;同樣的需求給 Midjourney,可能是十幾個乃至幾十個提示詞,大模型可以更準确地理解并輸出用戶想要圖案。
理解了這些差異,便不難讀懂 Prompt 走紅的原因。
目前大模型對算力的要求很高,以 OpenAI 的 DALL・E 爲例,生成一張圖片的收費約 0.02 美元,如果讓不懂 Prompt 的人去調用模型,大概率會浪費掉一次次算力。何況當前想要生成滿意的圖片,需要不斷重複調整,能否熟練運用 Prompt,直接左右了大模型所能釋放的生産力。
02 Prompt 還能賺錢?
利用信息差賺錢向來是最容易做的生意,生成式 AI 也不例外,Prompt 作爲 AI 時代的魔法,已然成了不少人用來 " 賺錢 " 的生産資料。
第一種:直接售賣 Prompt。
國外已經出現了 PromptBase 等明碼标價的平台,涉及 Midjourney、Stable Diffusion、DALL・E、GPT 等多個模型,而且适用的場景越來越細分,包括音樂創作、兒童插畫、油畫藝術、人物肖像等等,即便是不擅長整理提示詞的普通用戶,也可以直接複制 Prompt 生成相對不錯的作品。
其實國内也有類似的現象,一些商家早已在電商平台上兜售 Prompt,也有一些人将 Prompt 做成面向垂直任務場景的應用,比如 AI 寫評語、AI 寫郵件、AI 翻譯等等,吸引剛需用戶按月付費使用。
第二種:用 Prompt 換流量。
國内最早一批售賣 AI 課程的自媒體,多半将 Prompt 作爲吸引用戶付費的籌碼;小紅書等年輕人紮堆的平台上,早早出現了分享 Prompt 的筆記;B 站、抖音等視頻平台上,教用戶使用 Prompt 的教程已不可計數。
個中邏輯并不複雜。Prompt 是駕馭 AI 的 " 咒語 ",但提示詞本身并沒有版權效應,或許直接兜售 Prompt 可以快速變現,終歸是不長久的買賣。将 Prompt 作爲漲粉工具,趁機吸引到可觀的粉絲群體,在流量變相高度繁榮的互聯網江湖,無疑更符合市場規律,也是 Prompt 被廣泛讨論的另一重誘因。
第三種:靠 Prompt" 找工作 "
正如前面所提到的,正确使用 Prompt 已經是提升生産力的前提,不單單産生了提示語工程,還醞釀出了一批 " 提示詞工程師 "(Prompt Engineer)。
國外一位名叫 Riley Goodside 的小哥,靠 ChatGPT 的 Prompt 快速漲粉,然後被矽谷獨角獸 Scale AI 聘請爲 " 提示詞工程師 ",據說年薪高達百萬人民币;另一位名爲 Jason M. Allen 的藝術家,則使用 Midjourney 赢得了 Colorado State Fair 周年藝術比賽……如果說計算機時代的能力密碼是編程,在生成式 AI 席卷全球的當下,Prompt 正悄悄成爲數以萬計打工人 " 傍身 " 的工具。
至少就目前來看,程序員群體裏已經漸漸興起兩股風潮:一類人瞄準了 OpenAI 等大模型企業的 API,想要坐在人工智能的副駕駛上創業;另一類人打起了創造 Prompt 的主意,想要利用信息差賺到第一桶金。
倘若 ChatGPT 的出現當真是所謂的 iPhone 時刻,圍繞 Prompt 的生意其實才剛剛開場。
03 Prompt 隻是過渡?
相對應的一個問題是,Prompt 是否是人工智能大衆化不可或缺的一環?這個問題的答案直接影響着 Prompt 和 Prompt Engineer 的紅利周期。
Open AI 的 CEO Sam Altman 曾公開表示:五年後,就不再需要 Prompt Engineering。也許在接下來的一段時間裏,我們仍需要提示語,需要去創造 Prompt,但生成式 AI 的發展速度可能超乎想象,AI 對人類的理解力遠未觸達天花闆。
可以佐證的是,第一代 iPhone 上市時還沒有 App Store,僅預裝了浏覽器、iPod、郵件等少量應用,想要安裝其他應用,需要在電腦上安裝 iTunes,用 USB 線将 iPhone 連接到電腦……爲了解決用戶體驗上的局限性,越獄工具和第三方應用商店應運而生,但在蘋果引入 App Store 後,越獄工具漸漸被丢進了曆史的故紙堆。
同樣的問題詢問 ChatGPT,答案似乎客觀了許多。
想要不用特定 Prompt 就能和 AI 流暢對話,ChatGPT 認爲需要解決四個挑戰:
1、AI 需要更好地理解語境和連貫性,哪怕用戶像《大話西遊》裏的唐僧一樣喋喋不休,或者語無倫次,AI 也可以準确理解用戶的意圖,這樣就不需要精确的提示詞,用自然語言進行提問。
2、AI 需要有豐富的常識和推理能力,即根據特定的信息和場景做出合理的回應,而非像現在的模型那樣 " 對牛彈琴 ",比如中文裏的多義詞、不同場景下不同含義的語氣詞,非常考驗推理能力。
3、AI 需要理解和處理情感信息,這也是當前 AI 研究的重心所在。人的情感可以有很多種表達方式,文字隻是其中重要的一種。在大模型不斷向多模态演進時,視覺和聲音是否也可以傳遞信息?
4、AI 需要有主動學習和适應能力。主動學習是指 AI 系統在學習過程中,能夠主動選擇最具信息量的樣本進行學習,在數據稀缺的情況下做出更好的決策;适應能力是指 AI 在面臨新的任務、場景或環境變化時,能夠自我調整并優化其行爲。
按照 ChatGPT 的标準,在 Prompt 消失的時候,勢必已經進入到了強人工智能時代,目前還有很長一段距離。
Prompt 及其衍生機會的消亡是一種曆史必然,在時間上仍有很大的不确定性,也許會很快出現另一場技術爆炸;也許 AI 會進入新一輪的瓶頸期, Sam Altman 的五年預期不過是 " 盲目樂觀 "。
04 寫在最後
或許可以借用科技媒體《VentureBeat》的說法:現在已經到了 AI 藝術的轉折點,未來的藝術家無論是自學成才還是科班出身,都需要有創造 Prompt 的能力,需要理解和學習數據科學,以及大模型的工作原理。
進一步延伸的話,需要有這些能力的絕不隻是藝術家,任何職業、任何行業的工作都不可避免和 AI 協作,将人類的思考和需求注入給 AI,不斷更新、創造 Prompt,将是大多數人必須要掌握的一種技能,就像現在必須要用輸入法打字一樣。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App