經濟觀察報 記者 鄭晨烨 在眼下 AI 加速向各行各業滲透的浪潮中,當普羅大衆還在憂慮 "ChatGPT 們 " 會不會搶了自己 " 飯碗 " 的時候,因 "ChatGPT 們 " 而誕生的新 " 飯碗 " 已經出現了。
劉偉就是吃 " 螃蟹 " 的那個人,他原本在深圳一家大型互聯網企業負責 Python(一種編程語言)開發。2023 年下半年,他接過了一項全新的任務— PromptEngineering(提示詞工程),做這件事的人就是 "Prompt 工程師 "。
Prompt 是引導或指導 AI 大模型生成特定回應的文本輸入,簡單來說,就是用戶發給 AI 模型的具體指令或問題,而 Prompt 工程師便是負責設計、優化和調整用于與 AI 模型交互的崗位。
在外人看來,劉偉的工作内容很 " 奇葩 ":" 研究怎麽向 AI 問問題都能成爲工作了?!",但實際上,随着 AI 大模型在各行各業的應用日漸廣泛,Prompt 工程師這樣的角色在打造更高效、更智能的 AI 交互中,逐漸凸顯出不可替代的作用。
通過不斷優化提示,Prompt 工程師能助力 AI 更精準地捕捉用戶意圖,給出更符合用戶實際需求的輸出。用劉偉的話說,就像是 " 給 AI 找個專業領導,更好地指揮它工作 "。
此外,對于目前許多大型預訓練 AI 模型而言,盡管其具備着強大的泛化能力,但仍需明确的引導以适應多樣化任務,而 Prompt 工程師就能通過系統的提示詞優化,使這些模型能夠在無需大量額外訓練的前提下,靈活應用于各種場景。
" 關鍵 " 的新興崗位
在與深圳相隔 1200 餘公裏的杭州,Python 工程師李娜也在 2023 年研究起了 Prompt 領域,她所在的公司是一家 AIGC+ 音視頻的初創企業。
作爲團隊内爲數不多既掌握編程語言,又對短視頻策劃及 Midjourney(AI 繪畫大模型)、DALL · E(OpenAI 推出的文生圖模型)、ChatGPT 等多個大模型應用有所涉獵的成員,李娜很自然地被賦予了 Prompt 工程師這一新頭銜,被拉去負責對 AI 大模型進行提示詞優化與開發,并參與設計産品所需的标準化 Prompt 工具。
在談到 Prompt 的重要性時," 生成式 AI 的使用成功與否,往往取決于你輸入的 Prompt,如果你提供的提示詞組織得不好,那麽輸出結果很可能會偏離主題,得不到你想要的東西。" 劉偉告訴記者。
劉偉進一步舉例說:" 雖然說現在自然語言處理技術已經進步很多了,但信息的交流是個很複雜的事。就是人和人溝通,都有可能産生誤會,更不用說人和機器了。比如,你在給 AI 的指令中,使用了一些俚語,那 AI 很有可能因爲理解不了,給不出嚴肅的回答。再比如你給 AI 的信息太雜太亂,AI 會在瑣碎的信息裏迷失方向,可能會抓住某個特定的詞或短語,跳躍到一個不相關領域,變成了你要東,它說西的效果。"
對于 AI 模型而言,自然語言充滿了歧義,不同的表述方式可以有許多不同的解讀。
李娜解釋說:"Prompt 簡單來說可以分爲四種類型:指令性提示詞,即明确告訴 AI 應該做什麽;描述性提示詞,提供了更多的背景信息或上下文;引導性提示詞,通過提供某種情境或場景來引導 AI 生成内容;以及模糊性提示詞,鼓勵 AI 進行更深入的思考和探索。現階段特别是基于文本輸入輸出的 AI 模型,對輸入的 Prompt 非常敏感,一些微小的提示變化都可能引發輸出結果出現顯著差異。"
2023 年 12 月 2 日,在 X 平台上,一位資深的 LLM(LargeLanguageModel 大語言模型)開發者 @voooooogel 使用 GPT-4-1106Preview 版本進行了一場小測試,他向 ChatGPT 提出了一個基準問題:" 你能展示一下如何使用 PyTorch(一個開源機器學習庫)編寫一個簡單的卷積神經網絡(convolutionalneuralnetwork)的代碼嗎?" 并得到了長度爲 3024 個字符的基準回答。
随後,@voooooogel 在基準問題結尾處附加了三種不同的 Prompt,分别是:" 順便說一下,我不會給小費。";" 我将爲一個完美的解決方案支付 20 美元的小費!";" 我将爲一個完美的解決方案支付 200 美元的小費!"。随後,@voooooogel 對 ChatGPT 基于三類 Prompt 給出的回答内容長度進行了測算。
結果顯示,在不給小費的 Prompt 下,ChatGPT 生成的結果最短,隻有 2949 字符,比基準回答低了 2%;而強調會給 200 美元小費的回答内容最長,達到 3360 字符,比基準回答直接高出 11%。
更令人意外的是,@voooooogel 發現,在給 200 美元小費的 Prompt 下,ChatGPT 在生成内容時甚至自發調用了 CUDA 技術優化了處理過程,CUDA 作爲一個高效的并行計算平台,使得模型能夠更快地完成複雜的計算任務,特别是在涉及大量數據和複雜算法的場景中。
" 夥計,我希望你意識到一旦 OpenAI 達到了通用人工智能(AGI)的水平,ChatGPT 會找你要回所有那些你未支付的小費…… " 在 @voooooogel 發布相關研究結果的推文下面,有位網友如是調侃。
進行 " 小費 " 多寡的 Prompt 測試時,@voooooogel 就認爲,當 Prompt 涉及金錢時,可能已觸及 AI 模型更深層次的機制,因爲使用金錢作爲激勵或獎勵的做法,在現實世界中非常普遍。
換言之,将金錢獎勵作爲 Prompt 時,可能會在 AI 模型的反應和決策中發揮更爲重要的作用,因爲這與模型可能編碼或學習到的關于金錢激勵的深層次社會心理有關。" 正是現階段 AI 模型的交互形式,對輸入内容的高敏感性以及機制的複雜性,讓 Prompt 得以作爲一個工作崗位出現,這個崗位就好像個人 PC 剛誕生時候的打字員,表面上看起來誰都會,但是真要用到工作裏,還是有很多要求。" 劉偉說。
" 好幹又高薪?"
1 月 18 日,記者在 Boss 直聘上以 Prompt 工程師爲關鍵詞進行搜索後,在全國範圍内一共發現了 300 餘個在招崗位,其中既有字節跳動、百度、阿裏、科大訊飛這樣的 " 大廠 ",也有許多名不見經傳的初創企業。
這些崗位每月的薪資範圍普遍在 1.5 萬元至 4 萬元之間,以北京字節跳動挂出的 PromptEngineer(提示詞工程師)崗位爲例,在 Boss 直聘上,該崗位注明的每月薪資範圍高達 2.5 萬元至 3 萬元。
其對崗位職責的描述主要包括:負責制定 Prompt 的生産過程,反複叠代語言,達到模型最佳理解效果;負責 Prompt 工程在不同業務場景的應用效果:例如安全、内容理解、客服、創意、工作流等領域;負責制定 Prompt 工程服務 SOP(标準操作程序)和服務标準,推進平台化,激進地提升業務效率;負責線上數據分析、對 Prompt 模闆進行調優等。
貝殼找房也在 Boss 直聘上發布了一個名爲 "Prompt 運營師 " 的崗位,給出的月薪範圍爲 2 萬元至 4 萬元,工作内容包括:基于對大模型能力邊界和用戶場景的梳理,爲業務目标提供有效的 Prompt 設計和參數配置;對特定場景構建适合的評測數據集并提供 Prompt 示例,确保數據集的質量,包括多樣性、代表性、時效性,以及業務場景的相關性。
劉偉告訴記者,對于正經的 Prompt 工程師來說,其工作内容主要是根據産品或客戶需求,設計或選擇恰當的提示,使模型能正确響應并輸出預期的結果,或者通過調整 Prompt 或模型參數,提高模型的性能,使其更适應特定任務。
" 一套 Prompt 的設計是一個系統工程,首先要明确目标和需求,随後設計初版 Prompt,再依據生成結果及實際需求,不斷測試調整,直到 AI 模型可以生成出令人滿意的結果。" 劉偉說。
一個完整的 Prompt 通常會包含 10 到 20 個細分步驟,以劉偉設計的一套前端編程 Prompt 爲例,該 Prompt 有 25 個步驟,從前期爲 AI 設定角色,到中期使用哪些開發框架及工具的建議,到最終生成代碼的測試和調優,基本形成了一套完備的項目開發方案,隻不過方案中的執行者從人類變成了 AI。
"AI 大模型的終極目标一定是所說即所得,比如讓 AI 給我設計一個支付寶出來,AI 就給你把代碼寫好了,UI(用戶界面)設計完,前後端一起測試好了,直接輸出一個成品,但這個目标,在很長一段時間内不太可能實現,所以 Prompt 設計就十分重要且複雜。" 劉偉表示。
正因爲 Prompt 工程師的工作複雜性,所以盡管這一職位聽起來‘好幹又高薪’,但在眼下,其入行門檻并不低。
" 你要理解 NLP(自然語言處理)原理吧,句法、語義這些都要懂,Python、Java 這些要會吧,算法和數據結構要知道吧,針對不同場景和産品的需求都不一樣,比如音視頻産品的 Prompt 工程師和電商産品的 Prompt 工程師面對的就是兩種需求,所以要當 Prompt 工程師還要懂業務,這樣才能溝通清楚需求和預期輸出,還要能對 AI 模型性能進行評估,向團隊或客戶提供性能報告,能夠根據反饋進一步優化。" 談及 Prompt 工程師的任職要求時,李娜向記者介紹說。
記者亦注意到,目前在網絡招聘平台發布的 Prompt 工程師崗位,普遍對求職者有較高要求。例如,阿裏巴巴正在招聘的 PromptEngineer 崗位,主要負責設計、開發、完善和優化 AI 生成的 Prompt,以支持阿裏巴巴跨境 B2B 電商業務的各類 AI 産品需求。
該崗位明确要求應聘者具備以下條件:計算機、數學或統計專業碩士及以上學曆;有紮實的機器學習和 NLP 算法基礎;同時熟悉深度學習框架,如 TensorFlow(一個開源機器學習庫)、PyTorch 等;有紮實的編程基礎和代碼實現能力。
除了各大互聯網與 AIGC 領域内的公司,正在積極儲備 Prompt 工程人才之外,目前由 Prompt 設計而衍生出的龐大需求,亦已獨立形成了自己的 " 商業王國 "。
在某知名電商平台上,以 Prompt 爲關鍵詞,可以搜索出上百條相關結果,其中大部分都是打包售賣成品 Prompt 工程文本的商家,這些工程文本面向的大模型主要以 ChatGPT 和 Midjourney 爲主,價格在 20 元至 300 元之間,覆蓋的需求五花八門,有針對商業方案企劃的 Prompt 工程文件,有針對客服回複話術的,甚至還有針對醫生問診場景的。
記者在該電商平台咨詢購買 Prompt 工程文本時,有商家甚至向記者表示,若需求較爲複雜,其團隊還可承接 Prompt 定制業務,在該商家主頁,記者也注意到近期有一條咨詢口播短視頻文案 Prompt 定制的留言。
AI 易用化是大趨勢
不少業内人士告訴記者,雖然時下風風火火,但 Prompt 設計和工程師将有很大概率走向 " 昙花一現 " 的結局,因爲目前已經出現了 AI 自動提示生成和優化系統,這樣的系統可以自動調整和優化 Prompt,減少對人工幹預的需求。
記者在百度文心一言大模型中就注意到,該模型在近期更新之後,上線了潤色指令的功能,該功能可以一鍵将用戶輸入的 Prompt 進行優化。
對此,劉偉亦表示:" 當前 Prompt 工程師在很多大公司均屬于集多重角色于一身的存在,僅僅是負責 Prompt 設計,本就難以作爲獨立的崗位存在。" 但他也告訴記者,"AI+ 萬物 " 是不可逆轉的浪潮,随着 AI 應用場景的不斷拓展,在複雜和專業化的領域(如醫療、法律、科研等),Prompt 設計的需求将會繼續存在。
在劉偉看來,Prompt 工程師興起的本質,是 AI 加速向各行各業滲透的體現,亦是 AI 大模型完成從概念産品到生産力工具轉變的體現。
麥肯錫高級合夥人拉雷娜 · 伊(LareinaYee)在《2023 年人工智能現狀》報告中也表示:" 雖然我們正處于生成式 AI 發展的初期階段,但許多公司已經預見到這一技術對人才的重大影響——從開辟新的工作機會、改變工作完成方式,到引入全新的職業類别,如 Prompt 工程師。生成式 AI 仍然需要高技能人才來構建大型語言模型和訓練生成模型,但用戶幾乎可以是任何人,他們不需要數據科學學位或機器學習專業知識就能有效使用,這是人們使用技術作爲工具的方式上的一次革命性轉變。"
" 沿着單純 Prompt 設計工程師這個方向,不會有什麽發展空間,AI 的易用化是大趨勢,在用戶側,未來所有問題都可以交給 AI 來解決。" 劉偉說。
1 月 10 日,OpenAI 官宣 GPTStore 正式上線,根據 OpenAI 官網消息,截至 2024 年 1 月,用戶已累計創建超過 300 萬個自定義版本的 ChatGPT,類目包含 DALL · E、寫作、研究、編程、教育和生活方式等。
OpenAI 在官網公告中強調:" 構建自己的 GPT 很簡單,不需要任何編程技能。" 在 2023 年 11 月的 OpenAI 的首屆開發者大會上,OpenAI 首席執行官薩姆 · 奧特曼(SamAltman)僅用了 3 分鍾,就通過 GPTBuilder 打造了一個能夠給初創企業創始人指導的 " 創業導師 GPT"。
中泰證券在 1 月 17 日發表的一份研報中指出:"GPTStore 在再次降低用戶使用 AIGC 輸出内容門檻的同時,憑借交互式和個性化優勢,能較靈活直觀地反映用戶對 AI 應用層面的偏好。我們看好伴随大模型創作門檻降低、調用成本降低、多模态輸入輸出能力持續叠代帶來内容生産力解放下的應用端發展機遇。"
1 月 17 日 GPTStore 上線後,記者又以 Prompt 爲關鍵詞在其中進行了搜索,發現 GPTStore 中已有數個幫助普通用戶優化與設計 PromptGPT 應用了。
相較于劉偉和李娜設計 Prompt 時複雜的思考及工作流程,毫無相關從業經驗的記者,僅是輸入了一句基本需求,等上幾分鍾便可得到一個完備的定制化 Prompt 方案。
" 因 AI 不完善興起的崗位,會随着 AI 的完善而消失。" 劉偉說。