中国投资网 快讯 清华 KEG 实验室联合智谱 AI 推出图像理解大模型 CogAgent

清华 KEG 实验室联合智谱 AI 推出图像理解大模型 CogAgent

据 IT 之家 12 月 27 日消息,清华 KEG 实验室近日和智谱 AI 合作,联合推出了新一代图像理解大模型 CogAgent。该模型基于此前推出的 CogVLM,通过视觉 GUI Agent,使用视觉模态(而非文本)对 GUI 界面进行更全面直接的感知,从而作出规划和决策。据悉,CogAgent 可以接受 1120×1120 的高分辨率图像输入,具备视觉问答、视觉定位(Grounding)、GUI Agent 等多种能力,在 9 个经典的图像理解榜单上(含 VQAv2,STVQA, DocVQA,TextVQA,MM-VET,POPE 等)取得了通用能力第一的成绩。

本文来自网络,不代表本站立场,转载请注明出处:https://news9.com.cn/n/a86004.html

清华,KEG,实验室联合智谱,AI,推出图像理解大模型,CogAgent

中国投资网后续将为您提供丰富、全面的关于清华,KEG,实验室联合智谱,AI,推出图像理解大模型,CogAgent内容,让您第一时间了解到关于清华,KEG,实验室联合智谱,AI,推出图像理解大模型,CogAgent的热门信息。小编将持续从百度新闻、搜狗百科、微博热搜、知乎热门问答以及部分合作站点渠道收集和补充完善信息。