這家咖啡廳裏,顧客待了多長時間,店員做了幾杯咖啡,在 AI 攝像頭下是一清二楚。百萬網友圍觀稱太可怕,馬斯克都震驚了。
我們生活的世界,越來越沒有隐私。
今天,網上流出的這段視頻,把許多人都吓到了。
在一個咖啡店裏,每個顧客進店待了幾分鍾,每個服務員給顧客端了幾杯咖啡,都在視頻裏顯示得一清二楚!
視頻發布才十幾個小時,已經有 100 多萬網友圍觀了。
發布視頻的網友表示:這個概念展示了咖啡店是如何使用 AI 分析咖啡師和顧客的。請在咖啡店充分「享受」您的隐私吧。
另一位網友表示,這沒什麽大驚小怪的。作爲消費者,你應該知道很多商店在你進去的一瞬間,就對你的一切了如指掌。
相比之下,「劍橋分析事件」隻是小巫見大巫罷了。
(2018 年,Facebook 承認,這家英國數據分析公司在 2016 年違規獲得了 5000 萬 Facebook 用戶的信息,利用這些資料構建了一個軟件程序,從而預測和影響了投票箱結果,成功地幫助特朗普赢得總統大選。)
連馬斯克本人都現身評論區,連續留下了兩個驚歎号。
如果你覺得在咖啡館裏用 AI 監視員工和顧客已經夠可怕了,現實就是,如果不考慮成本,空中可以有數千架無人機向監管部門發送實時跟蹤數據,一切都會被跟蹤和記錄。
甚至不需要專業部門,任何人都可以在業餘無人機上進行跟蹤,因爲目前的物體檢測和圖像識别技術實在太強大了。
要知道,幾年前在獨立顯卡上運行 1080p 串流時,最大容量也不過就是 6 個對象。
01 無處不在的「眼睛」
現實就是,我們現在的世界,到處都是攝像頭。
其中,已經有不少企業部署了非常隐蔽的策略,用于追蹤消費者,一切都是通過 AI 和視頻源上的視覺識别來完成的。
比如沃爾瑪的智能零售實驗室内,IRL 傳感器和攝像頭,讓工作人員對店裏的一切都了如指掌。
快餐店也采用了 AI 技術進行員工監督。這裏規定員工必須戴口罩,如果誰摘下口罩,經理就會立刻知道。
另外,我們的移動位置數據也在出售。
幾乎所有手機運營商,都在匿名向零售店售賣數據,可以說這是他們的一部分核心業務。
有人表示:既然我的數據被收集了,我可以要求企業向我付費嗎?
關于企業中采用的攝像頭,評論區有人現身說法——
「我在體育場的後端安全攝像頭系統工作,我們向公衆發布的内容,隻有實際數據的 1/3。」
「這簡直就像在電影中,把自己的臉輸進去,系統就會識别出你在哪裏。」
而實現這一切,你隻需要利用任意的攝像頭,安裝一個 300 美元的軟件,然後開始運行,直到磁盤空間用盡。
02 利與弊?
對此,AI 咨詢專家 Diego San Esteban 分享了自己的觀點:
他認爲,AI 監測當然有不少優點,比如能持續監控員工的表現和生産力,讓管理人員更好地制定戰略。
另外,AI 也可以提供客觀的績效數據,避免在評估中出現人爲的偏見。
而缺點也不少,最爲人诟病的自然是對員工隐私權的侵犯,并且還會在企業内産生不信任的氣氛,影響士氣和工作滿意度。
AI 也無法充分理解工作進行的背景,還缺乏人類的同理心。
并且,它很可能會犯錯,受到訓練數據固有的偏見影響,這對員工是極度不公平的。
03 目标檢測算法
其實,這次備受争議的事件背後,就是一種很常見的 AI 技術——目标檢測。
例如,給定一張城市街道的照片,目标檢測模型将返回圖像中所有不同物體的注釋或标簽列表:交通信号燈、車輛、道路标志、建築物等。
這些标簽将包含每個物體的适當類别,比如「人」,以及一個「邊界框」,即完全包含物體的矩形區域。
行業應用
目标檢測對于人類來說是一項關鍵任務:當進入新的房間或場景時,我們的第一反應是對其中的物體和人員進行視覺評估,然後理解它們。
與人類類似,目标檢測在使計算機理解和與視覺世界進行交互方面發揮着至關重要的作用,并且已經在很多行業中得到了廣泛的應用:
- 場所安全:
目标檢測模型可以幫助提高工作場所的安全性和安全性。例如,它們可以檢測敏感區域中可疑個體或車輛的存在。更具創意性的是,它可以确保工人使用個人防護裝備(PPE),如手套、頭盔或口罩。
- 社交媒體:
目标檢測模型可以幫助識别數字媒體中特定品牌、産品、标志或人物的存在。廣告商可以利用這些信息來收集數據,并向用戶展示更相關的廣告。它還有助于自動化檢測和标記不當或禁止内容的過程。
- 質量控制:
目标檢測模型實現了對視覺數據的自動化審查。計算機和攝像頭可以實時分析數據,自動檢測和處理視覺信息并理解其重要性,從而減少了在需要進行持續視覺審查的任務中的人工幹預。這在制造生産質量控制方面尤其有用。它不僅提高了效率,還可以檢測到人眼可能忽略的生産異常,從而防止潛在的生産中斷或産品召回。
04 首次達到 66 AP,最強 SOTA 算法霸榜
當前,在目标檢測算法的性能上,來自國内團隊的「DETRs with Collaborative Hybrid Assignments Training」,憑借了高達 66 AP 的成績霸榜 COCO。該工作已經被 ICCV 2023 錄用。
在論文中,作者提出了一種新穎的協作混合分配訓練方案—— Co-DETR,可以從多樣化的标簽分配方式中學習更高效且更有效的基于 DETR 的檢測器。
通過訓練多個平行輔助頭(受到一對多标簽分配的監督,如 ATSS 和 Faster RCNN),全新的 Co-DETR 可以輕松提升端到端檢測器中編碼器的學習能力。
通過從這些輔助頭中提取正坐标來進行額外的定制正查詢,Co-DETR 還可以提高解碼器中正樣本的訓練效率。
此外,在推理過程中,這些輔助頭會被丢棄,因此該方法不會給原始檢測器引入額外的參數和計算成本,同時也不需要手工非極大值抑制(NMS)。
論文地址:https://arxiv.org/abs/2211.12860v5
項目地址:https://github.com/Sense-X/Co-DETR
- 編碼器優化:
訓練方案可以通過訓練多個平行輔助頭,這些頭通過一對多的标簽分配進行監督,從而輕松提升端到端檢測器中編碼器的學習能力。
- 解碼器優化:
通過從這些輔助頭中提取正坐标來進行額外的定制正查詢,來改善解碼器的注意力學習。
- SOTA 的性能:
搭載 ViT-L(304M 參數)的 Co-DETR 是第一個在 COCO test-dev 上實現 66.0% AP 的模型。
實驗結果顯示,在 Swin-L 骨幹網絡的基礎上,Co-DETR 方法可以将現有的 SOTA 模型 DINO-Deformable-DETR 的性能,從 58.5% 提高到 59.5%(在 COCO 驗證集上)。
在 ViT-L 骨幹網絡的支持下,Co-DETR 在 COCO test-dev 上實現了 66.0% AP,以及在 LVIS 驗證集上實現了 67.9% AP。
此外,與以往方法相比,Co-DETR 還在模型規模更小的情況下,取得了更好的性能。