(综合自财联社、上海证券报、网易科技报道、凤凰网科技、IT之家、新浪科技等)
3月15日,人工智能研究公司OpenAI公布大型语言模型的最新版本GPT-4。
和ChatGPT最初使用的GPT-3.5模型相比,GPT-4在多个方面实现了飞跃式提升。
比如,回答准确性显著提高;强大的识图能力;扩写能力增强,能处理超过25000个单词的文本;更具创造力,并且能够处理更细微的指令等等。
OpenAI表示,新模型产生的错误答案更少,将更少地偏离谈话轨道,更少地谈论禁忌话题,甚至在许多标准化测试中比人类表现得更好。
目前,ChatGPT的Plus订阅用户已经可以使用GPT-4,其他用户需要排队申请内测。由于仅限于Plus订阅用户使用,发布当天,大批新订用户涌入,“挤爆”OpenAI的付款系统。
自2018年以来,OpenAI一直在发布GPT语言模型。GPT-3,是GPT语言模型第三个版本,于2020年发布。而ChatGPT这款聊天机器人于2022年发布,其免费版使用的模型为GPT-3.5。
四个月前,ChatGPT一经发布,迅速引发布局热潮,从谷歌到百度、京东、科大讯飞、腾讯等,都先后宣布与ChatGPT结合上线的业务线。当然,政策支持也没落下,比如北京市在《2022年北京人工智能产业发展白皮书》中提到,将支持头部企业打造对标ChatGPT的大模型,着力构建开源框架和通用大模型的应用生态。
根据OpenAI介绍,GPT-4比以前的版本“更大”,这意味着它已经借助比前辈更多的数据进行了训练,并且在模型文件中有更多的权重,从而使得它的运行成本更高。
在内部评估中,相较于GPT-3.5,GPT-4产生正确回应的可能性要高出40%。而且GPT-4是多模态的,同时支持文本和图像输入功能。
就任务而言,GPT-4可以遵循自然语言的复杂指令并生成技术或创意内容,而且它可以还更深入地做到这一点:它支持生成和处理多达32768个token(约25000个文本单词),从而实现比前辈更长的内容创建或文本分析。
此外,在许多专业测试中,GPT-4的表现超出了“人类水平”。例如,GPT-4在模拟律师考试的成绩在考生中排名前10%左右,在SAT阅读考试中排名前7%左右,在SAT数学考试中排名前11%左右。相比之下,GPT-3.5在律师考试中的得分一般都是倒数10%左右。
不过,OpenAI也表示,目前GPT-4并不完美,它在很多场景下的能力都不如人类。该模型仍然存在“幻觉”或编造事实的问题,并且在事实方面也不一定总是可靠的,“它倾向于坚持认为它是正确的,即使它错了”。OpenAI表示,GPT-4正在努力解决其局限性,例如社会偏见、幻觉和对抗性提示。
OpenAI在博客文章中表示:“GPT-4仍有许多已知的局限性,我们正在努力解决,如社交偏见、幻觉和敌意回复等。在一次随意的谈话中,GPT-3.5和GPT-4之间的区别很小。而当任务的复杂性达到足够的阈值时,差异就会显现出来:GPT-4比GPT-3.5更可靠、更有创造力,并且能够处理更多细微差别的指令。”
“ChatGPT的推出是深度学习提出后又一个里程碑式的技术革命,认知智能技术的大规模应用处在历史机遇期”,科大讯飞在接受机构调研时表示。
东方证券也认为,大模型的应用落地有望带来产业智能化变革。未来几年是大模型的快速发展窗口期,相关的大模型算法、算力基础设施、下游B端通用应用软件和垂直行业领域都有望迎来加速增长。
“任何创新科技再好,最后一定要落在商业化上。”有业内人士告诉上海证券报记者,从目前来看ChatGPT的运营成本已经足够低廉,“未来,成本将成为同类模式的生命线,这个行业很可能会出现赢者通吃的局面。”
具体来看公司布局,本周,百度将发布新款类ChatGPT产品。据上海证券报报道,多位业内人士透露,此次百度发布的“文心一言”,或许也能提供文本、语音、图像等多模态的搜索能力和AI生成能力。究竟如何,请静待“疯狂星期四”。
早在2月7日,百度就正式官宣,打造与ChatGPT 类似的人工智能聊天机器人服务,将项目命名为“文心一言”,计划于3月完成内测,并面向公众开放。
同样在2月,有报道称,腾讯针对类ChatGPT对话式产品已成立“混元助手”项目组。对此,腾讯方面表示,目前,腾讯在相关方向上已有布局,专项研究也在有序推进。
此外,一些互联网头部企业的前核心人员离职创业,比如快手前MMU负责人李岩,再比如原美团联合创始人王慧文,都投身到“大模型”赛道。
李岩此前是快手AI技术研发的核心人物,2022年下半年成立了AI公司“元石科技”,主要进行多模态大模型的研发。
王慧文2020年底从美团退休,今年2月对外宣布进入AI领域创业,引发行业关注和热议。3月8日,美团创始人、董事长兼首席执行官王兴表示,将以个人身份参与王慧文创业公司“光年之外”的A轮投资,并出任董事。
王兴在朋友圈表示:“AI大模型让我既兴奋于即将创造出来的巨大生产力,又忧虑它未来对整个世界的冲击。老王和我在创业路上同行近二十年,既然他决心拥抱这次大浪潮,那我必须支持。”
除了头部互联网公司,多家A股上市公司也纷纷宣布入局。
据上海证券报记者不完全统计,截至今年3月初,A股已有汤姆猫、天娱数科、北信源等约20家上市公司宣布相关业务已经接入类似ChatGPT技术,或正在研究相关技术与数字人结合的应用场景。
度小满CEO朱光表示,比ChatGPT,更值得关注的是它背后的技术和技术趋势。这就是说,比ChatGPT更重要的是GPT( Generative Pre-trained Transformer 即” 生成型预训练变换模型),是大语言模型这种前沿技术。
“类似GPT这样的大模型技术,是下一代AI技术较量的核心课题,有人干脆把它称为AI 2.0”,朱光进一步表示,大模型技术将重塑多个行业的工作方式和格局,其中最明显的,也许就是金融业。
朱光说,大模型可以分为理解式大模型和生成式大模型。理解式大模型优势在于数据洞察理解能力,可以用在智能推荐、风险管理、智能经营上,帮助金融机构大幅提升经营效率和风险管理决策能力。生成式人工智能可以自主地生成新的数据、图像、语音、文本等信息,成为理财师、保险经纪人等金融从业人员的得力助手,大幅提升服务效率和服务体验。
目前,以ChatGPT为代表的AIGC技术,在银行、保险、理财等领域的诸多岗位上,已经开始工作了。
比如,聊天机器人,特别适合在使用数字渠道进行通信时帮助改善客户体验。自2020年疫情爆发以来,人工智能在国外各种规模的金融机构中都出现了数字应用的激增。美国银行、摩根大通、富国银行、汇丰银行等都有使用聊天机器人来进行客户服务。在国内,2022年2月,宁波银行上海分行入职001号数字人员工“小宁”,以客服形象为客户提供业务咨询和服务办理。
在保险领域,包括ChatGPT在内的AIGC工具带来了新的想象空间,为承保、营销、客户服务、风险管理、反欺诈等环节提供更多、更便捷、更智能的方式。比如谷歌DeepMind医疗AI大模型,已通过美国医师执照试题验证,可以帮助预测保险诈骗;再比如,保险科技数字经纪公司 Paladin Group和保险技术提供商Dais Technology推出了生成式人工智能承保工具UnderwriteGPT,可基于大型语言模型和生成AI,简化承保流程并改进风险评估,最终为保单持有人带来更好的定价和覆盖范围。
在国内,水滴公司近日也表示正在内部测试类ChatGPT应用,让智能对话机器人能够以文本或语音的形式,独立完成一些保险营销领域的简单工作,比如向客户介绍一些保险条款相对简单的短险产品,在这个过程中解答客户提出的问题等。