品玩 6 月 30 日訊,據 Arxiv 頁面顯示,Contextual AI 與斯坦福大學近日聯手公布一款名爲 LENS 的産品,旨在利用大語言模型的能力來解決計算機視覺問題。
研發團隊表示,LENS 使用大語言模型來對一組獨立的、高度描述的視效模塊的輸出進行推理,以提供對圖像的詳盡信息。
研究團隊表示,使用 LENS 的大語言模型在大部分場景中都表現出了高度的競争力,而不需要任何多模态訓練。