中国投资网 快讯 MiniMax 稀宇科技发布万亿参数 MoE 模型 abab 6.5,核心能力接近 GPT-4

MiniMax 稀宇科技发布万亿参数 MoE 模型 abab 6.5,核心能力接近 GPT-4

4 月 17 日消息,国内 AI 初创企业 MiniMax 稀宇科技今日正式推出 MoE 混合专家模型架构的 abab 6.5 系列模型,核心能力开始接近 GPT-4、 Claude-3、 Gemini-1.5。 abab 6.5 系列包含两个模型:abab 6.5 包含万亿参数,支持 200k tokens 的上下文长度;abab 6.5s 与 abab 6.5 使用了同样的训练技术和数据,但是更高效,支持 200k tokens 的上下文长度,可以 1 秒内处理近 3 万字的文本。 自一月发布国内首个基于 MoE 架构的 abab 6 模型后,MiniMax 通过改进模型架构,重构数据 pipeline,训练算法及并行训练策略优化等,在加速 Scaling Laws 过程上取得阶段性成果。(IT之家)

本文来自网络,不代表本站立场,转载请注明出处:https://news9.com.cn/n/a129218.html

MiniMax,稀宇科技发布万亿参数,MoE,模型,abab,6.5,核心能力接近,GPT-4

中国投资网后续将为您提供丰富、全面的关于MiniMax,稀宇科技发布万亿参数,MoE,模型,abab,6.5,核心能力接近,GPT-4内容,让您第一时间了解到关于MiniMax,稀宇科技发布万亿参数,MoE,模型,abab,6.5,核心能力接近,GPT-4的热门信息。小编将持续从百度新闻、搜狗百科、微博热搜、知乎热门问答以及部分合作站点渠道收集和补充完善信息。