据站长之家 12 月 4 日报道,哈尔滨工业大学(深圳)近期发布了名为九天(JiuTian-LION)的多模态大语言模型,通过融合细粒度空间感知和高层语义视觉知识,取得了在 13 个视觉语言任务上的 state-of-the-art 性能,尤其在 Visual Spatial Reasoning 任务上实现了 5% 的性能提升。 据称,视觉信息提取不足问题得到解决,九天模型通过渐进式融合细粒度空间感知视觉知识和软提示下的高层语义视觉证据,有效提升了视觉理解能力,减轻了 MLLMs 的幻觉现象。
哈尔滨工业大学(深圳)发布多模态大模型“九天”
本文来自网络,不代表本站立场,转载请注明出处:https://news9.com.cn/n/a73199.html