据《科创板日报》1 月 9 日报道,近日,蚂蚁集团宣布开源大模型分布式训练加速扩展库 ATorch,可针对不同模型和硬件资源,实现深度学习自动资源动态优化和分布式训练稳定性提升,帮助提升深度学习的智能性。据了解,在大模型训练中,ATorch 千亿模型千卡级别训练的算力利用率可达 60%。目前,ATorch 已集成到蚂蚁集团大模型训练开源产品 DLRover 中,这是蚂蚁集团基于云原生技术打造的智能分布式深度学习系统。
蚂蚁开源分布式训练扩展库 ATorch,大模型训练算力利用率达 60%
本文来自网络,不代表本站立场,转载请注明出处:https://news9.com.cn/n/a92476.html