据量子位 11 月 11 日报道,针对Transformer,谷歌DeepMind一项新的发现引起了不小争议:它的泛化能力,无法扩展到训练数据以外的内容。目前这一结论还没有进一步得到验证,但已经惊动了一众大佬,比如Keras之父Francois Chollet表示,如果消息为真,将成为大模型界的一件大事。
谷歌DeepMind 新研究:Transformer泛化能力无法扩展到训练数据以外的内容
本文来自网络,不代表本站立场,转载请注明出处:https://news9.com.cn/n/a59234.html