九派财經記者 黃夢琪 郭梓昊
兩張路況照片把電腦屏幕填滿,主角是圖片裏的路标。賀傑要做的,是對比出兩張圖片的路标變化,然後做上相應的标記。判斷、打标簽、提交 ...... 賀傑一秒就能完成,一天下來,她要爲 14000 組左右的圖片打上标簽。
在賀傑身邊,32 名員工坐在電腦前,屏幕上不斷閃動着新圖片,敲擊鍵盤的聲音此起彼伏,他們共同身份是 " 人工智能訓練師 ",負責數據标注工作。而在辦公室窗外,則是典型的陝北鄉村光景,春天到來之前,植被稀疏,黃土裸露,成排的窯洞清晰可辨,偶爾,拉貨的驢車從縣城的柏油馬路上走過 ……
2019 年 12 月開始,一家名爲 " 愛豆科技 " 的公司坐落在陝北小城——榆林市清澗縣。超過 170 多名縣城員工在這裏上班,在此之前,他們是縣城上的寶媽、農民、甚至是政府職工。随着 AIGC 領域競争越發激烈,這些身處供應鏈最前端的縣城 AI 訓練師們,成爲互聯網熱議的焦點。
而在另一方面,通過這家數據标注公司,縣城的人與全世界最前沿的技術産生了聯系。縣城電視台的廣告裏,清澗縣城形容爲榆林 " 矽谷 ",号召在外打工的人回鄉就業,喊出了 " 初中學曆也能幹高科技 "" 隻有你才能拯救它 " 的口号。
在刀削面店老闆娘眼裏,愛豆是縣城裏少數 " 敲敲電腦就能完成 " 的工作,非常時髦;一位在縣政府工作人員稱,愛豆公司當地納稅大戶,年營收一千多萬;甚至大馬路邊賣水果的攤販們,都能爲你指明公司的方位 ......
談起所在數據标注行業,愛豆公司負責人魚濤略帶驕傲," 有多少人工,就有多少智能。中國甚至世界上新的技術,像 ChatGPT,社會上可能還沒出現,我們(标注員)已經在爲它做準備了。"
改變發生的背後,這家依托于縣城的 AI 公司,如今也面臨來自縣城的限制。貧瘠的人才現狀、脆弱的産業環境、越來越難的數據标注項目 ...... 在真正與外部世界發生碰撞之前,縣城 AI 公司遭遇了現實的瓶頸。
一、縣城的 AI 初印象
與清澗縣城其它公司相比,愛豆公司幾乎是标準企業的模闆。一切幾乎都是嶄新的——剛建起的辦公大樓、粉刷白亮的牆體、整齊劃一的電腦辦公桌,管理模式也向大公司學習,上班打卡、彈性下班,甚至還有專供女性職工的婦女角。
可這樣一家 AI 公司的到來,起初并沒有在這座陝北小城掀起什麽水花。2020 年 2 月以前,清澗縣還是國家級貧困縣,産業發展仍依賴紅棗、小米、土豆等傳統種殖業。對于當地人來說," 人工智能訓練師 " 完全是陌生的詞彙。
魚濤面對的第一個問題是,如何盡可能讓縣城人知道 "AI"。
易拉寶從廣場等公共區域,擺到年輕媽媽聚集的學校門口;電線杆上的廣告位也被愛豆公司占上;就連縣長都在朋友圈都發出了招聘通知,要求 " 初中學曆以上,會計算機 "...... 大力宣傳下,前兩次的招聘結果卻有些慘淡。
轉機發生在 2020 年 4 月,疫情稍稍緩和的那個春天,一則 " 爆炸性 " 新聞在縣城傳開:一位名叫楊彥軍的愛豆公司員工,拿到了超萬元的月薪。
(清澗愛豆公司 黃夢琪 / 攝)
在當時,想在小縣城裏找份體面工作并不容易。對當地女性而言,月薪在兩三千元的服務員、售貨員是最爲普遍的選擇;男性則多從事體力活,做電焊、搞裝修、下地開荒,收入也勉強夠溫飽。有人在縣城 " 玩玩電腦 " 就能拿到上萬的月薪,無疑突破了清澗人的認知。
消息一傳十、十傳百,愛豆公司一下子成了當地的明星企業——三四百人向清澗縣愛豆科技有限公司投去了簡曆,求職者包括帶娃寶媽、回鄉待業大學生、前政府員工等,年齡跨度從八零後到零零後。公司一層的走廊也被擠得滿當,魚濤把三百多人分成好幾撥,花兩三天時間才完成面試。
來公司參觀的縣市政府人員絡繹不絕,魚濤常常從早上接待到晚上。" 幾個領導出門還在納悶,說玩電腦怎麽掙錢 "。更有人向魚濤發出邀請," 能不能也在我們縣城搞一個 AI 公司?"
這也在無意間點醒了魚濤。彼時,呂梁山區發展标注業務的隻有清澗,無論從業務體量還是品牌知名度,都難以和東南部其他數據标注公司競争。
" 如果能把清澗愛豆公司的模式複制到其他縣市,形成一個産業帶,是不是更有競争力?" 魚濤覺得可以一試。2020 年 8 月,在距離清澗 93 公裏的山西永和縣,孵化下一個 AI 公司——永和縣數字就業中心。
二、打開了一扇窗
比起清澗,地處呂梁山脈南端的永和縣更爲閉塞。在當地人的印象裏,十幾年前,永和縣城還是灰蒙蒙的,馬路沒有鋪上柏油、塵土飛揚。由于沒通鐵路,上學、打工的永和縣人習慣坐兩個半小時的大巴,到 200 公裏外的臨汾市轉車。按照永和就業中心總經理李林峰的說法," 正常的企業都不會願意來永和這樣的地方。"
這也導緻當地缺乏提供就業崗位的産業。幾年前,永和中小學附近密集分布着麻将館,縣城裏的女性沒有别的事情幹,送孩子上學後就去打麻将。發展到後來,連同孩子的午餐也在麻将館裏解決。
AI 公司的到來正在悄無聲息地改變永和縣城。數字就業中心成立不到一年,吸納了不少待業女性,麻将館一家跟着一家黃了。" 現在身份變了,公司女員工們都是老公帶孩子、做飯,自己上班工作。" 用魚濤的話說,無論是在永和還是清澗,AI 的工作都給縣城人 " 打開了一扇窗 "。
(清澗愛豆公司業務欄 郭梓昊 / 攝)
在來到數字就業中心前,33 歲的白雪将所有精力都撲在孩子身上。要喂奶、飯打翻,孩子的無時無刻不在觸動這位寶媽的敏感神經,面向丈夫傾訴時,白雪漸漸不能控制自己的脾氣,吵架成爲家常。" 在家待得越久,越是壓抑。" 白雪說。
如今,通過金融風險事件的标注業務這個窗口,白雪第一次認識到了外部世界。
密密麻麻文字占滿了電腦屏幕,一周内的公司新聞,都會出現在需要标注的文本裏。财務信息造假、實際控制人涉嫌違法、稅務非正常戶、延期信息披露、偷稅漏稅 …… 白雪能一口氣背出這串名詞。
朋友們常常驚訝于白雪的見聞——在标注中,白雪了解胡鑫宇事件的前因後果,她甚至清晰記得新聞發布會召開時間;不怎麽追劇的她也知道了近期大熱的《狂飙》,明白了 " 風浪越大魚越貴 " 的道理。" 高啓強犯了罪,涉嫌違法的是公司實控人還是公司高層,這就是我要思考的内容。" 白雪說。
同樣被 AI 喚醒的,還有魚濤。接管愛豆公司時,魚濤對 AI 業務毫無概念,直到訓練機器的數據标注工作擺在他面前,困惑越發濃烈,爲什麽 AI 需要人工?
關于數據标注是怎麽回事,魚濤是從書中看來,辦公室裏,他買來的書擺滿了兩個櫃子。書中的世界給魚濤帶來了沖擊:測試機器是不是具備人類智能的圖靈測試、擊敗頂尖棋手柯潔的阿爾法狗、爆火網絡的 ChatGPT,魚濤驚歎于世界的改變。
(魚濤爲了解 " 數據标注 " 買來的書 郭梓昊 / 攝)
" 以後是不是好多人被 AI 取代了 " 魚濤很長時間一直在想這個問題,但有限的知識很難提供獲得一個答案。他隻能寬慰自己," 火車出來後,趕馬車的人沒了嗎?這是一種時代的進步,如果工作都被機器取代了,人類就坐下來享受。"
三、" 我隻是一個标注工 "
面對 AI 公司的到來,兩地政府、愛豆公司的員工都曾寄予了希望。在公司落地之處,政府提供了辦公場地、電腦等辦公設備;員工們紛紛把待業的家人、朋友介紹到公司裏。清澗公司也很争氣,2 年時間,公司員工來到了 170 人,辦公區從兩層擴充到三層。
可 AI 公司能在多大程度上改變縣城貧瘠現狀?就連魚濤也說不準。說到底,這份工作的本質仍是流水線上的螺絲釘。
到愛豆公司工作前,惠卓覺得 AI 标注工作很 " 高大上 ",而上手一段時間後,她逐漸發現數據标注的另一面——門檻低、且需要忍受不斷循環。在上一個任務裏,惠卓一天要給數千張甚至上萬張圖片打标簽,判斷它們是否涉及暴力。
由于左手腕輕微挪動時會與桌面産生摩擦,工作半年後,賀傑的手腕内側就起了繭,需要在左手腕下墊一條毛巾。她形容,這就像農民幹活,每天都拿着鐵鍬,手也會起繭,歇一段時間 " 護理 " 一下,繭子就能消下去一點。
枯燥、機械 ...... 不可否認,數據标注是一份重複性強的工作,也是消磨人的。" 如果整個人工智能領域是一顆雞蛋,我們連雞蛋皮都沒碰到。" 惠卓說。
(永和縣城裏的 " 人工智能訓練師 " 黃夢琪 / 攝)
對着電腦屏幕,惠卓有過一閃而過的念頭:" 我做的東西到底有什麽用 "" 數據标注以外,上下遊到底是怎麽回事 "" 自動駕駛的汽車,難道不怕撞到人 "" 機器越來越聰明,未來會不會統治人類,像電影裏一樣?"
偶然的瞬間,這些數據标注員負責過的業務會與他們的生活發生映照。一次,員工王慧收到花呗平台的催款電話,聽着客服用生動語氣報出了欠款數目,王慧感到莫名的親切," 我就是喂養 AI 客服催款,它的問題、回答是怎麽形成的,我都清楚。"
但 " 一閃而過 " 也就過去了,循環反複的勞動中,期待也日複一日消失。" 你試試坐在電腦跟前,做一天任務。" 惠卓說,目前都是照貓畫虎,也沒有機會接觸更多的内容。在提及這樣一家 AI 公司給自己帶來什麽時,員工們的答案更多是 " 養家糊口 "。
這一切,魚濤都看在眼裏,但作爲公司負責人,他有着更爲緊急的事情。過去三年裏,辦公場地、設備都由政府提供;接到的業務訂單大多來自起初合作的互聯網大廠。魚濤始終有一層隐憂:" 一旦這些資源都撤了,愛豆公司是不是垮了?好不容易開啓的窗戶是不是就關上了?"
四、縣城的束縛與解放
魚濤所在的數據标注行業無疑還很年輕。2017 年,伴随無人駕駛與阿爾法狗帶來的 AI 浪潮,數據标注開始真正走進大衆視野。如今,經曆過一波洗牌之後,京東、阿裏等頭部公司相繼組建自己的數據标注部門和工具,标注業務也更向龍貓數據、Testin 雲測等頭部企業靠攏。
相較之下,除了扶貧标簽帶來的屬性外,小縣城的 AI 公司在商業競争上顯得毫無競争力。
很長一段時間,像縣城 AI 公司較低端的數據标注業務,隻能存活于産業鏈底層,生存艱難。李林峰坦言,很多業務都需要幾千人的标注平台,體量小的公司能接到的業務可能已經被外包了好幾層。大部分時候,數據标注團隊都會面臨兩個選擇——要麽無訂單可做,要麽接受虧本價。
爲了公司的運轉,魚濤和李林峰都曾寄希望于尋求更多的訂單。
2023 年 3 月,魚濤離開黃土高原,輾轉來到江南水鄉杭州,這裏有着最爲濃厚互聯網氛圍以及最前沿的人工智能領域技術,魚濤此行的目的是,給公司拿下更多訂單。但很顯然,簽下訂單并非易事,推杯換盞間的兩天後,魚濤空手而歸。
魚濤感受到了一定落差。在清澗,魚濤有一定号召力,但到了更大的世界,這份優勢消失了。" 我大專畢業,雖然也願意看一些書,但是眼界沒那麽開闊,很多專業上的問題未必能說得清楚。在商業談判上也會吃很大的虧。" 魚濤說。
來不及多想,更大的危機已經到來。AI 正以可感知的速度替代掉了曾經培育他們的數據标注師——如今,AI 算法從 " 有監督學習 " 升級爲非監督學習或強化學習,這意味數據标注門檻越來越高了。
縣城 AI 公司的業務,從最開始聽語音标注文字的基礎轉換,到需要培訓才能上手的醫療、法律等專業領域标注。再到現在,面對陌生的英語文本,員工們隻能一個一個字母去核對,不少人因爲幹不來,自行選擇了離開。
業務的改變對 AI 公司提出了人才要求。初中以上、高中、大專 ...... 最新一期招聘,清澗愛豆公司要招本科以上學曆的人。但這談何容易," 如果有能耐,誰不想往外走。" 魚濤說。經過三年的運營,兩家公司把縣城裏能招的人都招了一遍,火爆的招聘場景也沒再出現。
依托于偏遠縣城廉價勞動力發展起來的數據标注産業,目前正陷入缺乏高學曆人才而止步不前的困局。這扇窗戶能開多大、開多久,沒人知道,但至少現在,有人從中找到了自己的價值意義。
身處縣城,白雪覺得自己是人工智能産品背後的一個 " 奉獻者 "。他和同事們不知道 ChatGPT 到底是這麽回事,隻聽說這款産品很厲害、在美國很火,聊到最後總結一句話:" 它再偉大,也需要我們這樣的人在背後做标注。"
通過 AI 工作,更多縣城人擁有了自己的生活和世界。永和縣城沒有公園,到了周末,數字就業中心的同事們就開着車,帶上孩子,去臨汾,或者是黃河對岸的陝西,一塊去旅遊。這很日常,卻已經是從前的她們不曾想到的生活。