中国投资网快讯北大和智源团队提出训练框架 LLaMA-Rider，可让大模型自主探索开放世界

北大和智源团队提出训练框架 LLaMA-Rider，可让大模型自主探索开放世界

作者: hao333 发布:2023-11-07 12:03:14 1294阅读 3141评论

据站长之家 11 月 7 日报道，北京大学和北京智源人工智能研究院的团队提出了名为 LLaMA-Rider 的训练框架，旨在让大型语言模型在开放世界中具备自主探索和学习任务的能力。这个框架通过反馈 - 修改机制来实现主动探索，使模型在环境中接收反馈信息，不断调整决策，从而逐渐适应开放环境。据悉，LLaMA-Rider 采用两阶段训练方法，首先让模型在环境中自主探索，然后将成功经验整合为监督数据集，用于模型微调，提高多任务解决的能力。实验结果显示，LLaMA-Rider 在多任务解决上表现出高采样效率和低训练代价，与强化学习方法相比具有优势。这个研究为大型语言模型在开放世界中的自主学习提供了重要思路。

本文来自网络，不代表本站立场，转载请注明出处：https://news9.com.cn/n/a55592.html

5144赞

北大和智源团队提出训练框架,LLaMA-Rider，可让大模型自主探索开放世界

中国投资网后续将为您提供丰富、全面的关于北大和智源团队提出训练框架,LLaMA-Rider，可让大模型自主探索开放世界内容，让您第一时间了解到关于北大和智源团队提出训练框架,LLaMA-Rider，可让大模型自主探索开放世界的热门信息。小编将持续从百度新闻、搜狗百科、微博热搜、知乎热门问答以及部分合作站点渠道收集和补充完善信息。

北大和智源团队提出训练框架,LLaMA-Rider，可让大模型自主探索开放世界

相关文章