中国投资网 快讯 英伟达预告新版 TensorRT-LLM:推理能力飙升 5 倍,支持 OpenAI 的 Chat API

英伟达预告新版 TensorRT-LLM:推理能力飙升 5 倍,支持 OpenAI 的 Chat API

据 IT 之家 11 月 16 日报道,英伟达在今天 Ignite 2023 大会上,宣布更新 TensorRT-LLM,添加 OpenAI 的 Chat API 支持,并增强 DirectML 功能,改善 Llama 2 和 Stable Diffusion 等 AI 模型的性能。 TensorRT-LLM 可以通过英伟达的 AI Workbench 在本地完成,开发者可以使用这个统一、易用的工具包,在 PC 或工作站上快速创建、测试和定制预训练的生成式 AI 模型和 LLM。英伟达将于本月晚些时候发布 TensorRT-LLM 0.6.0 版本更新,推理性能提高 5 倍,并支持 Mistral 7B 和 Nemotron-3 8B 等其它主流 LLM。

本文来自网络,不代表本站立场,转载请注明出处:https://news9.com.cn/n/a62211.html

英伟达预告新版,TensorRT-LLM:推理能力飙升,5,倍,支持,OpenAI,的,Chat,API

中国投资网后续将为您提供丰富、全面的关于英伟达预告新版,TensorRT-LLM:推理能力飙升,5,倍,支持,OpenAI,的,Chat,API内容,让您第一时间了解到关于英伟达预告新版,TensorRT-LLM:推理能力飙升,5,倍,支持,OpenAI,的,Chat,API的热门信息。小编将持续从百度新闻、搜狗百科、微博热搜、知乎热门问答以及部分合作站点渠道收集和补充完善信息。