“超级AI”既视感，GPT-4已进入支付公司测试

来源 | 零壹财经

编辑 | 楚济慈

3月15日，人工智能研究公司OpenAI公布大型语言模型的最新版本GPT-4。

(相关资料图)

和ChatGPT最初使用的GPT-3.5模型相比，GPT-4在多个方面实现了飞跃式提升。

比如，回答准确性显著提高；强大的识图能力；扩写能力增强，能处理超过25000个单词的文本；更具创造力，并且能够处理更细微的指令等等。

OpenAI表示，新模型产生的错误答案更少，将更少地偏离谈话轨道，更少地谈论禁忌话题，甚至在许多标准化测试中比人类表现得更好。

目前，ChatGPT的Plus订阅用户已经可以使用GPT-4，其他用户需要排队申请内测。由于仅限于Plus订阅用户使用，发布当天，大批新订用户涌入，“挤爆”OpenAI的付款系统。

自2018年以来，OpenAI一直在发布GPT语言模型。GPT-3，是GPT语言模型第三个版本，于2020年发布。而ChatGPT这款聊天机器人于2022年发布，其免费版使用的模型为GPT-3.5。

四个月前，ChatGPT一经发布，迅速引发布局热潮，从谷歌到百度、京东、科大讯飞、腾讯等，都先后宣布与ChatGPT结合上线的业务线。当然，政策支持也没落下，比如北京市在《2022年北京人工智能产业发展白皮书》中提到，将支持头部企业打造对标ChatGPT的大模型，着力构建开源框架和通用大模型的应用生态。

炸裂大升级，GPT-4 很厉害，但不完美

根据OpenAI介绍，GPT-4比以前的版本“更大”，这意味着它已经借助比前辈更多的数据进行了训练，并且在模型文件中有更多的权重，从而使得它的运行成本更高。

在内部评估中，相较于GPT-3.5，GPT-4产生正确回应的可能性要高出40%。而且GPT-4是多模态的，同时支持文本和图像输入功能。

就任务而言，GPT-4可以遵循自然语言的复杂指令并生成技术或创意内容，而且它可以还更深入地做到这一点：它支持生成和处理多达32768个token（约25000个文本单词），从而实现比前辈更长的内容创建或文本分析。

此外，在许多专业测试中，GPT-4的表现超出了“人类水平”。例如，GPT-4在模拟律师考试的成绩在考生中排名前10%左右，在SAT阅读考试中排名前7%左右，在SAT数学考试中排名前11%左右。相比之下，GPT-3.5在律师考试中的得分一般都是倒数10%左右。

不过，OpenAI也表示，目前GPT-4并不完美，它在很多场景下的能力都不如人类。该模型仍然存在“幻觉”或编造事实的问题，并且在事实方面也不一定总是可靠的，“它倾向于坚持认为它是正确的，即使它错了”。OpenAI表示，GPT-4正在努力解决其局限性，例如社会偏见、幻觉和对抗性提示。

OpenAI在博客文章中表示：“GPT-4仍有许多已知的局限性，我们正在努力解决，如社交偏见、幻觉和敌意回复等。在一次随意的谈话中，GPT-3.5和GPT-4之间的区别很小。而当任务的复杂性达到足够的阈值时，差异就会显现出来：GPT-4比GPT-3.5更可靠、更有创造力，并且能够处理更多细微差别的指令。”

里程碑式技术革命，商业路径显现，多家公司纷纷上车

“ChatGPT的推出是深度学习提出后又一个里程碑式的技术革命，认知智能技术的大规模应用处在历史机遇期”，科大讯飞在接受机构调研时表示。

东方证券也认为，大模型的应用落地有望带来产业智能化变革。未来几年是大模型的快速发展窗口期，相关的大模型算法、算力基础设施、下游B端通用应用软件和垂直行业领域都有望迎来加速增长。

“任何创新科技再好，最后一定要落在商业化上。”有业内人士告诉上海证券报记者，从目前来看ChatGPT的运营成本已经足够低廉，“未来，成本将成为同类模式的生命线，这个行业很可能会出现赢者通吃的局面。”

具体来看公司布局，本周，百度将发布新款类ChatGPT产品。据上海证券报报道，多位业内人士透露，此次百度发布的“文心一言”，或许也能提供文本、语音、图像等多模态的搜索能力和AI生成能力。究竟如何，请静待“疯狂星期四”。

早在2月7日，百度就正式官宣，打造与ChatGPT 类似的人工智能聊天机器人服务，将项目命名为“文心一言”，计划于3月完成内测，并面向公众开放。

同样在2月，有报道称，腾讯针对类ChatGPT对话式产品已成立“混元助手”项目组。对此，腾讯方面表示，目前，腾讯在相关方向上已有布局，专项研究也在有序推进。

此外，一些互联网头部企业的前核心人员离职创业，比如快手前MMU负责人李岩，再比如原美团联合创始人王慧文，都投身到“大模型”赛道。

李岩此前是快手AI技术研发的核心人物，2022年下半年成立了AI公司“元石科技”，主要进行多模态大模型的研发。

王慧文2020年底从美团退休，今年2月对外宣布进入AI领域创业，引发行业关注和热议。3月8日，美团创始人、董事长兼首席执行官王兴表示，将以个人身份参与王慧文创业公司“光年之外”的A轮投资，并出任董事。

王兴在朋友圈表示：“AI大模型让我既兴奋于即将创造出来的巨大生产力，又忧虑它未来对整个世界的冲击。老王和我在创业路上同行近二十年，既然他决心拥抱这次大浪潮，那我必须支持。”

除了头部互联网公司，多家A股上市公司也纷纷宣布入局。

据上海证券报记者不完全统计，截至今年3月初，A股已有汤姆猫、天娱数科、北信源等约20家上市公司宣布相关业务已经接入类似ChatGPT技术，或正在研究相关技术与数字人结合的应用场景。

GPT-4，给金融业带来了什么

度小满CEO朱光表示，比ChatGPT，更值得关注的是它背后的技术和技术趋势。这就是说，比ChatGPT更重要的是GPT（ Generative Pre-trained Transformer 即” 生成型预训练变换模型），是大语言模型这种前沿技术。

“类似GPT这样的大模型技术，是下一代AI技术较量的核心课题，有人干脆把它称为AI 2.0”，朱光进一步表示，大模型技术将重塑多个行业的工作方式和格局，其中最明显的，也许就是金融业。

朱光说，大模型可以分为理解式大模型和生成式大模型。理解式大模型优势在于数据洞察理解能力，可以用在智能推荐、风险管理、智能经营上，帮助金融机构大幅提升经营效率和风险管理决策能力。生成式人工智能可以自主地生成新的数据、图像、语音、文本等信息，成为理财师、保险经纪人等金融从业人员的得力助手，大幅提升服务效率和服务体验。

目前，以ChatGPT为代表的AIGC技术，在银行、保险、理财等领域的诸多岗位上，已经开始工作了。

比如，聊天机器人，特别适合在使用数字渠道进行通信时帮助改善客户体验。自2020年疫情爆发以来，人工智能在国外各种规模的金融机构中都出现了数字应用的激增。美国银行、摩根大通、富国银行、汇丰银行等都有使用聊天机器人来进行客户服务。在国内，2022年2月，宁波银行上海分行入职001号数字人员工“小宁”，以客服形象为客户提供业务咨询和服务办理。

在保险领域，包括ChatGPT在内的AIGC工具带来了新的想象空间，为承保、营销、客户服务、风险管理、反欺诈等环节提供更多、更便捷、更智能的方式。比如谷歌DeepMind医疗AI大模型，已通过美国医师执照试题验证，可以帮助预测保险诈骗；再比如，保险科技数字经纪公司 Paladin Group和保险技术提供商Dais Technology推出了生成式人工智能承保工具UnderwriteGPT，可基于大型语言模型和生成AI，简化承保流程并改进风险评估，最终为保单持有人带来更好的定价和覆盖范围。

在国内，水滴公司近日也表示正在内部测试类ChatGPT应用，让智能对话机器人能够以文本或语音的形式，独立完成一些保险营销领域的简单工作，比如向客户介绍一些保险条款相对简单的短险产品，在这个过程中解答客户提出的问题等。

至于最新发布的GPT-4，也已经进入金融业务的应用测试阶段。据财联社报道，OpenAI透露，摩根士丹利正在使用GPT-4来组织数据，而电子支付公司Stripe正在测试GPT-4是否有助于打击欺诈。

（综合自财联社、上海证券报、网易科技报道、凤凰网科技、IT之家、新浪科技等）

原文标题 : “超级AI”既视感，GPT-4已进入支付公司测试

关键词：