圖片來源 @視覺中國
文 | 自象限
" 人均月薪兩萬、本科以上學曆、直通百度字節。"
有些許荒涼的年底招聘市場,在最近的短短一周之内,突然冒出了一大批 "AI 數據标注員 " 的崗位,正在火熱招聘中。
據「自象限」搜索,這些崗位不僅有百度、字節、京東、滴滴、美團等 " 夢中情廠 ",工資月薪十分亮眼,都在 1 萬到 2 萬元之間,且發布時間很短,都在 1 周到 1 個月之間。
除了新以外,崗位招聘顯然非常急迫。據招聘軟件顯示,HR 們都異常活躍,一天 24 小時幾乎全程在線,日均回複次數在十次以上,隔幾分鍾就回複一次。
" 最近隻要一上線,有關 AI 數據标注員的招聘消息就瘋狂彈,重複地彈。" 不少正在求職的人向【自象限】反映," 上次這麽瘋狂的打招呼,感覺還是主播招聘。"
▲圖源 Boss 直聘截圖
招聘的火熱,很難不讓人想到大廠的大模型之戰。
不過,據「自象限」觀察,"AI 數據标注員 " 招聘不是由這些大廠直接操辦,而是通過獵頭公司來負責招聘。崗位的名字也是五花八門,有 " 數據标注 "、"AI 話術編輯 "、" 數據标注分析師 "、" 标注員 "、"AI 訓練師 " 等等。
雖然叫法不同,但關于這些崗位的職能描述卻大差不差,據招聘軟件信息顯示,其中很大一部分崗位跟現下大熱的大模型有關,入職的數據标注員們的日常工作包含,大模型的編輯校對、大模型的數據标注管理、大模型的内容質量評估等。
「自象限」向多位招聘 HR 進行了咨詢," 工作的主要内容是對文心一言大模型回答結果的分析和判斷,工作的地點在百度科技園。" 有獵頭回複道。
高薪資待遇、挂鈎大模型、大廠哄搶……有求職者看到了機會," 大模型的風,要帶動新一批大廠人紮根了,普通人的機會來了嗎?"
但事實上,時間緊、任務重的崗位招聘,要求卻并不算低,基本學曆要求本科起步,985、211 優先本科和碩士優先,在具備語言學、中文信息處理、計算語言學、文學等相關專業背景的同時,還得對一些 AI 技術的原理有了解。
花椒科技告訴我們,面試的基本流程是," 簡曆初篩 - 發筆試題 - 筆試題通過一輪面試 - 直接發 offer- 培訓 ",在學曆方面,獵頭強調 " 必須得是一本才行,211/985 優先 "。
嚴格準入門檻,招聘軟件上神秘的 "AI 數據标注員 " 背後,藏着大廠的大模型棋局。
我,給大模型當 " 考官 "月薪兩萬
曆時一個多月的面試,中文系畢業的羅文(化名)最終敲定了自己的 offer ——百度文心一言的 AI 數據标注員。連她自己都不敢相信,一個純技術小白現在的日常竟然是給大模型當 " 考官 "。
" 畢業三年,沒有任何 AI 經驗,轉行漲薪,幅度近 50%,月薪在 9k-15k 左右 ",羅文告訴我們。
坐在兩台電腦前,羅文每天的主要工作有兩項:一是做題,直接給大模型進行 " 填鴨式 " 教育;二是給文心一言當 " 判官 ",評判給出的答案對不對、好不好。
所謂 " 填鴨 " 就是強行把寫好的答案喂給大模型,這樣的好處就是從數據源上不會出錯,以此來提升大模型的訓練效果。羅文告訴「自象限」,數學題、常識題、作文題她都做過,但這還遠遠不夠," 理論上,越專業越好,比如我擅長文學領域,那就專攻文學題,有的同事專業是醫學,那就做醫學問答題 ",羅文道。
羅文的話已經在一些社交平台得到驗證,有人曾發布帖稱," 急需招募金融專業人員,有償給文心一言答題,一天 30 多道,每道題價格在 1.5-2.4 元。"
▲圖源社交媒體平台小紅書截圖
另一項工作就是給大模型當 " 判卷老師 ",就像學生考試一樣,每天大模型會生成各種問題的答案,羅文就需要承擔老師的角色,判斷其生成的答案與題目是否一緻,答案是否正确。
若遇到諸如作文一類沒有标準化答案且開放性的問題時,則需要評判答案的好壞,比如,系統會随機給一組數據,包含 1 個問題和 3 個回答。羅文需要先标注出這個問題屬于什麽類型,随後給 3 個回答分别打分并排序。分數區間爲 0-5 分,如果打分低于 3 分,還要标注出具體原因,例如 " 答非所問(0 分)"、" 嚴重跑題(1 分)"、" 存在邏輯問題,存在事實性錯誤,比例較小給 2 分 " 等。
這個工作雖然看上去并不難,但卻異常重要,甚至可以從外包直通大廠的機會。據上述獵頭告訴我們," 雖然合同跟我們獵頭公司簽,但是還是有六分之一的幾率轉正,進入百度集團 "。這或許也是嚴格控制學曆的原因。
爲此,「自象限」也了解到,由于百度地圖的數據标注,有穩定的地圖業務需求及自動駕駛模型、算法模型的訓練需求,所以對數據标注的質量要求更高,的确搭建了專門的數據标注團隊。
市場上對 " 羅文 " 的需求,不止大模型公司。據「自象限」統計,目前,市面上的數據标注崗位大緻分爲兩種。
一種以 NLP(自然語言)爲主要方向,百度、字節、京東、美團等一批大模型科技公司一擁而上,給自家大模型找人工數據訓練師。這其中又分爲幾個細分的方向,譬如數據分析、大模型生成結果判定、輔助大模型邏輯推理等等。
另一個方向則是 CV(圖像),存在已久,人們更加耳熟能詳的是 "2D 拉框 " 和 "3D 拉框 ",主要是滿足滴滴、毫末、輕舟智航等這類車企,爲其智能駕駛業務提供圖像數據質檢和标注幫助。
「自象限」觀察發現,十一月是 NLP 方向數據标注的轉折點,此前,百度、京東等大廠無論是校招還是社招,都僅開設了很少或壓根沒有 AI 數據标注崗位,招聘軟件上也隻是零星地開放了實習生的崗位,通常不設學曆上限,大專學曆封頂。
毫無征兆地突然冒出一批崗位需求,這背後或許與大模型廠商的研發受阻有關。多位行業人士曾向「自象限」透露,截至目前,國内的大模型水平或許僅能達到 GPT-3.5 水平,發展的核心還是數據質量問題。
一邊是國外 OpenAI 連放猛招,直逼 GPT-5,一邊是國内企業喊着 " 要落地 "、" 要用上大模型 ",雙重壓力下,又用起了 " 人海戰術 "。
技術研發水平不夠,人工能力來補齊,國内大模型廠商開始瘋卷 "AI 數據标注員 ",爲大模型能力 " 飛升 " 再加一把燃料。
大廠卷精标,粗标 " 割韭菜 "
事實上,數據标注并不是新鮮事兒,早已有之。以前的形式是粗标,主要表現爲 " 拉框 ",但現在粗标發展得亂了套:一是此前大廠粗标多爲衆包标注平台,工單分散,人員不專業,導緻标注質量不行;二是随着大模型的精進,粗标變得越來越不夠用,精标的地位由此直線上升。
針對粗标和精标的差異,某大廠員工解釋道:" 一般廠商的外包團隊,能做标注,但他們就是按照框定的規則标注,如果出現規則之外的數據,标注就會存在通過率不高的情況來回反複,但是由工程師團隊來做,特别是針對自動駕駛輔助駕駛等回傳的數據,他們知道背後的原理,可能不會按照常規的思路标注,會帶解決問題的思路來标注,可能需要跳出之前制定的标注規則,這樣标注數據的質量會更高。"
大模型爆火,也爲粗标刮起了一陣 " 新錢風 "。
目前,粗标求職陣地已經從招聘軟件轉移到了快手等短視頻平台。以快手爲例,粗标求職熱度與快遞員并列,大量數據标注公司入駐快手,覆蓋京津冀、長三角和珠三角地區。
▲圖源快手截圖
據「自象限」了解,快手的直播招聘業務 " 快聘 " 曾在發布會中特别提到:" 要解決數據标注職類線下招聘難,應聘者少的核心訴求問題 。"
落實到實處,快手從公司資質審核、流量扶持、公司推薦到數據标注職業推廣都給予了支持,「自象限」注意到在快手官方招聘直播間中,有時也在全天無間斷地滾動地播報有關數據标注求職信息。
這一定程度上也成爲了某些數據标注公司的 " 尚方寶劍 "。在招聘時候,宣傳之詞毫無遮攔," 無需學曆,上手即會,小學生都能做 "," 拉一個框,打一個标簽,就是半個毛 "," 拉 3000 個 150 元,6000 個 300 元,月入 7000-8000 灑灑水,隻要手速夠快 ",極盡誇張之詞。
但事實究竟如何呢?一萬塊錢能拿得如此輕松嗎?
爲探究真假,「自象限」在快手報名聯系上了一家熱門數據标注公司。該公司聲稱與比亞迪、理想、小鵬、特斯拉等車企直接簽單獲得一手數據任務,且出示了大量的證書、憑證強調其正規性。入職後的主要任務就是接任務包,在圖片上拉框、标注和打标簽。
▲圖源微信截圖
總結下來,有幾個基本點:打框按計件算錢,一個框價格在一毛到一毛五;薪資首月按周結,第二個月以後按月結算;新手小白需要先繳納 2580 元培訓費用,一年内工資累計達到 1 萬,才能退還;平均七天左右學習培訓時間就能上手做任務;分兼職和全職,兼職按框計算,全職線下坐班,另免費提供住宿;在其展示的員工工資截圖中,月工資在 5000-6000 元不等。
但在黑貓投訴平台上,上述公司成爲了數據标注投訴的重災區。
一些投訴用戶的經曆與我們相吻合。綜合用戶的反饋,投訴主要集中在以下幾個問題:第一,不會拉框需要先繳納 2580 元費用,一年做拉框任務滿一萬元,但是出現了拒不退款的問題;第二,培訓内容非常簡單,且耗時長,耽誤用戶上崗;第三,不給通過和達标,總是卡拉框的合格率,最終影響收入;第四,态度豪橫,無視用戶的訴求,不處理、不退款。
▲圖源黑貓投訴平台截圖
以上的問題也隻是冰山一角,「自象限」雖然沒有繳費報名成功,但在咨詢後的一段時間内,也頻繁地收到電話、微信的輪番轟炸,從早安到晚安,問候從未落下,還時不時地用其他員工的工資表進行挑逗、刺激。
一次嚴肅的數據标注求職,俨然淪爲了一場 " 割韭菜 " 遊戲,老老實實拉框的員工顆粒無收,反而是收培訓費的數據标注公司賺得盆滿缽滿。
數據質量決定了大模型走得速度,即使是 OpenAI 也不例外。外媒報道稱,OpenAI 一方面找了多家知名的數據公司來數據标注,一方面也自己組建了一個幾十名哲學博士團隊來做數據質檢。
大模型的根基在數據,數據質量直接決定了大模型進化的速度,從數據标注的亂象中,我們或許能一窺爲什麽中國大模型發展進度慢的原因,但既然大模型廠商們也意識到了數據标注的源頭問題,離我們真正突破到 GPT-4,或許也就不遠了。