品玩 7 月 3 日訊,金山辦公官方公衆号今日發文宣布與英偉達團隊合作,加速 WPS AI 服務。
據介紹,金山辦公與英偉達團隊合作,通過英偉達 Tensor Core GPU、TensorRT 提升圖像文檔識别與理解的推理效率;借助英偉達 Triton 推理服務器的部署,成功優化 GPU 利用率,提供高推理吞吐量。相比于 CPU 其 pipeline 耗時共下降 84%;采用英偉達 Triton 推理服務器部署,其部署成本節省了 23%。