IT 之家 9 月 9 日消息,以提供新聞、體育和娛樂照片授權聞名的全球最大的商業圖庫 Getty Images 上周宣布推出高畫質照片樣本訓練數據集,供開發者開發和訓練 AI 模型使用。
IT 之家獲悉,該樣本數據集包含 3,750 張照片,分爲商業、教育、醫療健康、運動與健身、物品與物體、插圖、圖标等 15 個類别。數據集提供多種主題的高質量視覺内容,可用于訓練機器學習和 AI 模型,開發多種應用場景。
▲ 相關圖片選集
目前,這一數據集已在 Hugging Face 上線(點此訪問),不過用戶需同意服務條款并提供聯系方式,才能免費訪問該數據集。
Getty 希望通過這個免費樣本數據集吸引企業和開發者使用其付費授權服務。Getty Images 聲稱自家擁有超過 5.72 億張照片,其中 2 億多張可用于商業用途。每張照片附有結構化的元數據,包括年齡、性别等信息,每張圖片平均有 50 個關鍵詞,可保障用戶安全訓練模型,免受侵權訴訟風險。