品玩 6 月 8 日訊,據 arxiv 上的一篇論文顯示,達摩院近日爲了推動視覺語言預訓練以及多模态大語言模型在中文社區的發展,發布了一款視頻語言數據集 Youku-mPLUG。
這個數據集的所有内容均來自優酷,對其中的安全性、多樣性和内容質量有着非常嚴格的标準。據達摩院介紹,Youku-mPLUG 中包含了 45 種不同類型的 1000 萬個視頻文本,這些視頻文本從 4 億個原始視頻中篩選而出,主要用于大規模預訓練。
達摩院表示,Youku-mPLUG 可以幫助研發人員在未來進行更深入的多模态研究,開發出更好的應用。