IT 之家 2 月 13 日消息,英偉達今天發布 "Chat with RTX"(與 RTX 聊天)應用程序,這是一款适用于 Windows PC 的聊天機器人,由 TensorRT-LLM 提供支持。
IT 之家獲悉,"Chat with RTX" 聊天機器人被設計爲一個本地化系統,用戶無需上網便可使用,所有具有至少 8 GB 顯存的 GeForce RTX 30 和 40 GPU 都支持該應用程序。
Chat with RTX 支持多種文件格式,包括文本、pdf、doc / docx 和 xml。隻需将應用程序指向包含文件的文件夾,它就會在幾秒鍾内将它們加載到庫中。此外,用戶還可以提供 YouTube 播放列表的 URL,該應用程序将加載播放列表中視頻的轉錄,使用戶能夠查詢它們涵蓋的内容。
從官方描述來看,用戶可以通過不同的查詢,與使用 ChatGPT 相同的方式使用 Chat With RTX,但生成的結果将完全基于特定數據集,似乎更适用于生成摘要、快速搜索文檔等操作。
擁有支持 TensorRT-LLM 的 RTX GPU 意味着用戶将在本地使用所有數據和項目,而不是将它們保存在雲中,這将節省時間并提供更精确的結果。
英偉達表示,TensorRT-LLM v0.6.0 将性能提升 5 倍,将于本月晚些時候推出。此外,它還将支持其他 LLM,如 Mistral 7B 和 Nemotron 3 8B。