文 | 商隐社,作者 | 浩然
AI 的發展給人們描繪了科技進步帶來的 " 詩和遠方 ",但這背後卻有着巨大的能源、資源、勞動力消耗,這是 AI 發展的沉重現實。
此外,AI 作爲一種新型 " 巨機器 " 對人和社會的影響也被低估了。
01
谷歌在本周一表示,與 Kairos Power 公司簽署一份從多個小型模塊化反應堆購買電力的協議,以滿足發展人工智能的用電需求。
谷歌計劃買六到七個小型模塊化反應堆的電力,總計 500 兆瓦,首個小型模塊化反應堆在 2030 年之前投入使用。
而在上個月月底,微軟和星座能源公司簽署了一份爲期 20 年的電力采購協議,計劃重啓曾因嚴重核事故而關閉的美國三哩島核電站。
1979 年 3 月 28 日,三哩島壓水堆核電站的二号反應堆由于冷卻系統失靈,造成 62 噸的堆芯熔毀事故,這是人類核能發展史上發生的第一起堆芯熔毀事件。
國際上把核電站事故分爲 7 級,切爾諾貝利和福島的核事故是唯二的兩件 7 級事故,而三哩島核洩露處于第 5 級。
星座能源在 1999 年買下了一号反應堆,就在發生事故的二号反應堆旁邊,後來因爲經濟效益不好在 2019 年關閉了。
跟微軟簽協議後,星座能源将投入 16 億美元對一号反應堆進行翻新,預計到 2028 年才開始重新發電,時間表受到監管批準的影響。
谷歌、微軟搬出來核電站,一下子囤這麽多電,主要将用來驅動 AI 數據中心。而且不隻這兩家,其他在 AI 領域布局的科技大佬都在這麽幹。
今年 3 月,亞馬遜從塔倫能源公司購買了一個自帶核電供應的數據中心園區;甲骨文最近也表示,正在設計 1 處由 3 個小型核反應堆供電的數據中心。
科技巨頭之所以搞得這麽大,是因爲 AI 恐怖的耗電量。
AI 究竟有多耗電?
斯坦福人工智能研究所發布的《2023 年人工智能指數報告》顯示,OpenAI 的 GPT-3 單次訓練耗電量高達 128.7 萬度,相當于 3000 輛特斯拉 Model Y 跑滿 32 萬公裏的耗電量。這也是 120 個美國家庭 1 年的用電量。
這還隻是訓練用的電,相比後面不斷使用的環節隻是小頭。
在使用環節,AI 每次作出回應也要大量耗電。像 ChatGPT 有 2 億多用戶,每天響應這些需求就要耗 50 萬度電。
大模型的參數量越大,需要處理的數據就越多,所需要的計算量就越大,而算力背後是大量的服務器、存儲設備和網絡設備,它們日夜不停地工作,消耗大量電能。
曾有業内人士表示,國内一線大模型的運營成本中,電費占到了總成本的 50% 以上。
國際能源署今年發布的報告中預測,未來三年全球對數據中心、加密貨币和人工智能的電力需求将增加一倍以上,相當于一個德國的全部電力需求。
" 我在一年多前就預測過芯片短缺,下一個短缺的将是電力。我認爲明年将沒有足夠的電力來運行所有的芯片。" 前段時間馬斯克發出了這樣的預警。
OpenAI 首席執行官山姆 · 奧特曼也表示,人工智能将消耗比人們預期更多的電力。
如果說算力是大模型的底層支撐,那電力就是算力的底層支持。能否獲得更清潔、穩定的能源,以及 AI 設備能否做到效率更高、更省電,影響着 AI 發展的可持續性。
02
除了耗電,AI 對資源也有着大量消耗。
比如對水資源的消耗。AI 芯片制造過程中涉及大量的清洗和化學處理步驟,生産一個智能手機芯片就需要大約消耗 5 噸多的水。而 AI 超算數據中心也需要大量水來散熱,研究發現,單是使用 GPT-4 生成 100 字文本就需要消耗多達三瓶水。
有調研估算,到 2027 年,全球範圍内的 AI 需求可能需要消耗掉 66 億立方米的水資源,相當于杭州西湖水量的 450 多倍。
還有礦産資源,任何高科技的起點都是能源和礦産。
從網絡路由器到電池再到數據中心,AI 系統擴展網絡中的每一部分都需要礦産資源。
現代生活的很多方面都被轉移到了 " 雲端 ",但人們很少考慮這些原材料的成本。我們的工作、生活、閑暇娛樂大部分都發生在網絡計算架構的世界,而由雲計算聯通的我們拿在手中的設備,其内核爲锂。
可充電锂離子電池是移動設備、筆記本電腦、家用數字助理和數據中心備用電源的必需品。它們支持着互聯網和互聯網上運行的幾乎所有商業平台。
除此之外,還有很多不可再生的礦物質參與到了 AI 和其他高科技發展中,包括用于 iPhone 揚聲器和電動汽車電機的稀土元素镝和钕,用于士兵的紅外軍事設備和無人機的鍺,可以提高锂離子電池性能的钴。
參與世界科技競争的國家都會根據自身工業要求和對供應風險的戰略評估,制定自己的關鍵礦物清單。
中國、美國、歐盟戰略性關鍵礦産(圖源:國際合作中心網站)
锂、鍺、钴、稀土、石墨等都位列其中,是發展新能源汽車、人工智能、雲計算、光伏、信息通信等高科技不可或缺的。
像稀土,裏面包含 17 種金屬元素,16 種被用在了智能手機裏,這些元素可以在彩色顯示屏、揚聲器、相機鏡頭、可充電電池、硬盤驅動器和其他許多組件中找到。
如果無法保證這些礦物的供應,包括 AI 在内的科技行業都将陷入停滞。這是技術發展最重要的約束條件。
很多礦産都分布于世界上比較偏僻或者經濟不發達地區,像玻利維亞西南部的烏尤尼鹽沼、剛果中部、蒙古國、印度尼西亞。而采礦曆來都是一件極易引發地緣政治沖突和戰争的事情。
但包括 AI 在内的高科技發展給我們帶來了 " 詩與遠方 ",很容易讓我們忽略構成技術 " 肉身 " 的這些原材料,背後的稀缺,以及由此帶來的沖突、饑餓和貧窮。
正如 " 锂電池之父 " 古迪納夫所擔憂的那樣:" 锂的重要性不亞于石油等戰略性資源,一旦開采出現瓶頸,可能會跟石油一樣成爲戰争的導火索。"
這樣看來,高科技幾乎也可以看作是一種資源密集型的提取技術,把不可再生的礦産、水等轉化一些虛拟能力,期間還伴随着環境破壞和地緣沖突。
而且,這種巨大的資源密集型基礎設施幾乎完全是私人的。
03
AI 發展不僅存在能源和資源 " 饑渴 ",還存在數據 " 饑渴 "。
數據、算法和算力是 AI 大模型的三大支柱,而數據是大模型進行訓練的根基。數據集塑造了 AI 的認知邊界,它們決定了 AI" 看 " 世界的界限。
比如,創建計算機視覺系統的第一步,通常是從網上抓取成千上萬甚至數百萬張圖像,然後建立一系列分類體系來對它們進行排序,并以此作爲系統感知可觀察事實的基礎。
如果想構建一個可以檢測蘋果和橙子圖片之間差異的機器學習系統,首先開發人員必須收集和标記數以千計的蘋果和橙子的圖像,并基于此訓練神經網絡。在軟件方面,算法會對圖像進行統計調查,并開發一個模型來識别兩個 " 類别 " 之間的差異。
如果一切按計劃進行,經過訓練的模型将能夠區分它以前從未遇到過的蘋果和橙子圖像之間的差異。
但如果所有蘋果的訓練圖像都是紅色的,而沒有一個是綠色的,那機器學習系統可能會推斷 " 所有蘋果都是紅色的 "。青蘋果完全不會被識别爲蘋果。
因此,訓練數據集是大多數機器學習系統進行推理的核心。它們是 AI 系統用來生成預測基礎的主要原材料。
現在網絡上每天有不可勝數的文本、圖片、音視頻被上傳,AI 參與者就開始了數據掠奪。
科技巨頭在其中占據了優勢地位,像騰訊、字節、Meta 等掌握着各自的數據渠道,分享内容的人越多,他們能用來訓練大模型的力量就越大。人們很樂意免費爲他們的照片貼上姓名和地點的标簽,而這種無償勞動爲機器視覺和語言模型系統帶來了更準确的标記數據。
沒有這些數據渠道的企業就要爲此付一大筆費用或者想其他辦法得到。
OpenAI 就曾被報道其在未得到創作者授權情況下,使用 Whisper 語音識别工具,轉錄了超過一百萬小時的 YouTube 視頻内容,并将這些數據用于訓練其 GPT-4 模型。
但數據,尤其是高質量的數據并非取之不盡的。根據去年 Epoch AI 人工智能預測組織的一項研究,AI 公司可能在 2026 年前耗盡高質量文本訓練數據,而低質量文本和圖像數據的枯竭時間可能介于 2030 年至 2060 年之間。
山姆 · 奧特曼曾認爲 AI 最後應當可以産生高品質的 " 人造資料 ",以便高效地進行自我培訓。
但很多研究者認爲,AI 産生的數據質量太差,再用這樣的數據 " 喂 " 自己就是 " 自我投毒 "。
對高質量數據的饑渴催生了 "AI 錄音員 "" 大數據标注師 ""AI 編輯 " 等衆包工作。
之前就有媒體報道,在一些一二線城市,互聯網大廠正以每次 300 元的價格,招募 "AI 錄音員 "。他們的任務是爲大模型提供定制化的語音數據,通過錄制長達 3 小時的對話,幫助 AI 更好地理解和學習人類語言。
這 300 元不是那麽好掙的,需要提供有充足劇情、嚴格符合規範的高質量内容,可能需要多次重複一些内容以符合要求。
事實上,AI 的一個常被忽視的重大事實就是需要數量巨大的低薪工人幫助開發、維護和測試 AI 系統。比如 AI 錄音員,還有給數千小時的培訓數據做标記,審查可疑或有害的内容。但他們從未因爲使這個 AI 系統正常運行而獲得認可。
此外,像亞馬遜的物流系統,即便配備了大量機器人來做諸如搬箱子這樣的重活,但也需要人來配合完成機器人做不了的特殊、精細的工作,比如機器人識别不了的奇形怪狀的東西。
人去配合機器人,就要不斷适應機器人,還要按照機器的節奏,很難運用自己已有的知識或形成工作慣性。
這顯示出了 AI 發展初期人的改造,把人的勞動和價值之間進行脫節,從而更好地配合機器,也更容易被替代。
而 AI 大多數訓練集是在人們不知情或未經當事人同意的情況下構建的,像家裏的智能音箱、口袋裏的手機、智能手表、監控記錄下的面部表情等,會不會也被拿來作爲數據訓練 AI?
機器學習模型需要持續的數據流才能變得更加準确。但機器隻能漸近,永遠不會達到完全精準,這進一步推動算法從盡可能多的人身上提取信息,來爲人工智能提供 " 燃料 "。人類主體性被進一步消解。
04
寫下這麽多并不是 " 反技術 ",恰恰相反,技術給人類帶來了諸多便利,創造了更多可能性,使人類擺脫了諸多生存和發展難題。
但技術背後是一個涉及能源、資源、人、社會、曆史等各方面的系統性問題。
正如社會學家凱特 · 克勞福德在其所著《技術之外:社會聯結中的人工智能》中認爲,人工智能既是具身的,也是物質的,由自然資源、燃料、人力、基礎設施、物流、曆史和分類構成,這些都是需要付出代價的。
但很明顯,當下人們更多追求技術的軍備競賽和技術狂歡,而忽略了技術之外的一系列問題。
尤瓦爾 · 赫拉利在《今日簡史》裏說,19 世紀工業革命興起之後,當時的社會、經濟和政治模式都無法應對相關的新情況和新問題。封建主義、君主制和傳統宗教不适合管理工業大都市、幾百萬背井離鄉的工人,并面對現代經濟不斷變化的本質。
狄更斯筆下的煤礦童工、第一次世界大戰和 1932 — 1933 年的烏克蘭大饑荒,都隻是人類付出昂貴學費的一小部分。
現代文明有核武器及各種更高級的技術,破壞力也更驚人,我們隻能比面對工業革命時做得更好才行。
人類的行進既充滿智慧,又是盲目的。做任何事都有代價,或許最優的結果是效果和代價匹配,而非不計代價地奔向目标。