中国投资网 快讯 蚂蚁集团发布 DevOps 领域大模型评测基准 DevOps-Eval

蚂蚁集团发布 DevOps 领域大模型评测基准 DevOps-Eval

据站长之家 11 月 2 日报道,蚂蚁集团联合北京大学发布了面向 DevOps 领域的大语言模型评测基准“DevOps-Eval”。该评测基准包含了计划、编码、构建、测试、发布、部署、运维和监控等 8 个类别的选择题,共计 4850 道题目。此外,还针对 AIOps 任务做了细分,并添加了日志解析、时序异常检测、时序分类和根因分析等任务。 目前,DevOps-Eval 已发布了第一期的评测榜单,评测了 OpsGpt、Qwen、Baichuan 和 Internlm 等开源大语言模型。DevOps-Eval 的评测方式包括 Zero-shot 和 Few-shot,评测结果显示各模型得分相差不大。

本文来自网络,不代表本站立场,转载请注明出处:https://news9.com.cn/n/a52695.html

蚂蚁集团发布,DevOps,领域大模型评测基准,DevOps-Eval

中国投资网后续将为您提供丰富、全面的关于蚂蚁集团发布,DevOps,领域大模型评测基准,DevOps-Eval内容,让您第一时间了解到关于蚂蚁集团发布,DevOps,领域大模型评测基准,DevOps-Eval的热门信息。小编将持续从百度新闻、搜狗百科、微博热搜、知乎热门问答以及部分合作站点渠道收集和补充完善信息。