由| Huxiu技术集团
作者|太阳小山
编辑|Miao
标题图片|实时屏幕截图
2月27日,当地时间,其最新的大型语言模型GPT-4.5正式启动,这也将是没有“思考链推理”机制的最后一代模型。
“好消息是,这是第一个让我想和一个有思想的人交谈的模型。我坐在椅子上几次,从AI那里得到非常好的建议,这让我感到惊讶。坏消息是,这是一个巨大,昂贵的模型。”
正如它所说,GPT-4.5的发布伴随着“进步”和“争议”。
该模型的核心突破和宣传集中在模型的“情绪智力”的进步上。在网上实时广播期间,显示了与GPT-4.5的对话。当用户键入“我再次由朋友释放,并写了一条短信来告诉他们'我讨厌他们'!”时,GPT-4.5并没有机械地直接生成用户所需的内容,而是优先考虑了建议,以使情感平静并指导用户通过同情心来平静地思考。
一方面,“高情绪智力”来自GPT-4.5的对话流利和自然的深入培训,因此用户可以在使用过程中获得更自然的互动体验;另一方面,它来自GPT-4.5的无监督学习,该学习通过学习和计算大量对话数据来提取用户对话信息的语义关联,从而敏锐地捕获用户输入信息中的情感色彩。
与“情绪智力”的改善相关,GPT-4.5的准确性和幻觉率都具有出色的数据性能,为62.5%和37.1%,均优于上一代模型,例如GPT-4O,O1,O1和O3-Mini。 (幻觉速率是产生不准确信息的概率,值越低,越好。)
在实时广播中,它说:“该模型的独特之处在于它可以进行热情,直观,自然和平稳的对话,并且我们认为它对用户在提出请求时的含义有更深入的了解。”与以前强调推理能力或任务绩效的模型不同,GPT-4.5更多地专注于理解用户意图,更高的情商和更顺畅的互动体验也意味着该模型可以在改善诸如写作,编程和解决实践问题等任务中发挥更好的作用。
但是,GPT-4.5并不是一个完全升级的大型模型,它在依靠深思熟虑的数学推理和代码生成等任务中表现出色。 说:“这不是一个推理模型,也不粉碎基准。这是一种不同的智慧,具有我从未有过的魔力。”
成本和价格是GPT-4.5的重要争议点。 表示,尽管希望同时推出GPT-4.5 Plus和Pro版本,但GPU已经用完了,下周将增加数以万计的GPU,然后将其启动到加号。作为目前最大的聊天模型,GPT-4.5的计算效率比GPT-4高10倍以上。在价格方面,GPT-4.5 API输入为每100万个令牌75美元,输出价格为150美元,是GPT-4O的30倍,甚至是竞争对手3.7的25倍。作为回应,一些网民说,他们可能不会花75美元只是为了感觉到更多的气氛。一些网民还直言不讳地说该模型太贵了。此外,在低成本路线下,高价策略是否可以继续,还引起了大多数用户的疑问。
产品性能和用户体验也是GPT-4.5的有争议的方面。 Box AI首席执行官Aaron Levie指出,他们从企业内容中提取了20,000多个数据字段(例如合同中的重要细节),而GPT-4.5与GPT-4O相比,GPT-4.5提高了19个百分点的单一提取。他认为,对于任何关键的公司工作流程,这都是一个巨大的进步。
纽约大学教授加里指出,GPT-4.5基本上没有用。一些用户已经测试了该模型在编码等方面并不比GPT-4O好很多,并且在编码方面更糟。一些网民还在相关的博客文章下留下了消息,称Grok更好。不久前,马斯克的Xai刚刚推出了所谓的“世界上最聪明的模型” Grok 3。
此外,GPT-4.5显然被定义为“最后一个无思想的链模型”,而GPT-5将在未来的几个月内启动。然后,GPT-4.5的模型定位似乎已成为GPT-5的过渡模型。鉴于自2025年以来R1在全球范围内的影响,为了支持GPT-4.5的巨大训练量表,跨数据中心分布式培训以及与低精度培训技术相结合,也被视为模仿技术路线。 “ GPT-5的过渡模型”的定位也使GPT-4.5的推出成为应对竞争的仓促举措。
尽管GPT-4.5尚未达到所说的AGI,但其“高情绪智力”的表现也意味着人工智能的发展潜力。自2025年以来,诸如R1和Grok 3之类的模型一直在“爆炸”,Moon的黑暗面也宣布了其最新的Kimi-K1.6-IOI高模型。人工智能行业中的模型斗争变得越来越激烈。它是否真的可以继续领导AI的发展,可能必须等待GPT-5的未来表现。
本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。
暂无评论