中国投资网 快讯 深度求索发布开源代码大模型 DeepSeek Coder

深度求索发布开源代码大模型 DeepSeek Coder

巴比特讯,11 月 2 日,幻方量化宣布“深度求索(DeepSeek)”在成立半年后发布第一代大模型 DeepSeek Coder,1B,7B,33B全系列模型开源且免费商用。公告显示,DeepSeek Coder 模型有指令 Python 快速写出程序、修改 UI(用户界面)、测试 bug(程序错误)以及数据分析,学写 SQL(数据库语言)等技能。 据介绍,与之前最好的开源大模型 CodeLlama 相比,DeepSeek Coder 在代码生成任务上(使用标准数据集 HumanEval、MBPP 和 DS-1000 进行评测)分别领先9.3%、10.8%和5.9%。其中 DeepSeek Coder 的 70 亿参数版本在代码能力上达到了 CodeLlama 的 340 亿参数水平。经过指令调优后的 DeepSeek Coder 模型更是全面超越了 GPT3.5-Turbo。

本文来自网络,不代表本站立场,转载请注明出处:https://news9.com.cn/n/a53370.html

深度求索发布开源代码大模型,DeepSeek,Coder

中国投资网后续将为您提供丰富、全面的关于深度求索发布开源代码大模型,DeepSeek,Coder内容,让您第一时间了解到关于深度求索发布开源代码大模型,DeepSeek,Coder的热门信息。小编将持续从百度新闻、搜狗百科、微博热搜、知乎热门问答以及部分合作站点渠道收集和补充完善信息。