鱼和绵羊来自奥菲寺
量子位|官方帐户
同样,在直播之前, 2.5系列在这里。
Pro的第一版在推出后立即获得了大型车型竞技场的第一名,并且比GPT-4.5高40分!
2.5也是推理模型。用杰夫·迪恩(Jeff Dean)的话来说,这是:
这是我们最聪明的模型,具有令人印象深刻的高级推理和编码功能。
就像,给出一个及时的词:
帮我做一个有吸引力的无尽跑酷游戏。屏幕上必须有关键的操作说明。使用P5J,请勿使用HTML。我喜欢像素风格的恐龙和有趣的背景。
在大约1分钟内,您可以得到:
的“最先进的复杂任务模型”
根据的说法,与的第一个推理模型2.0 Flash相比,2.5在基本模型和培训后技术中都改进了。
它不仅赢得了大型模型竞技场的高分,而且在各种推理,数学,科学和编程基准中表现出色,即编程可以与3.7竞争,而数学可以与Grok 3相提并论。
有关更详细的测试结果,请参见此处:
2.5 Pro的上下文窗口为1M,并且支持本机多模式:它可以理解巨大的数据集并处理来自不同信息源的复杂问题,包括文本,音频,图像,视频,甚至整个代码库。
除了推理功能外,还强调了2.5 Pro的编程性能:
2.5 Pro擅长创建视觉上引人入胜的Web应用程序和代理代码。
研究人员还发布了更多案例,例如使“小球在六角形内旋转”更加酷:
杰夫·迪恩(Jeff Dean)兴奋地发布了一个编程 +数学用例,并说:
我记得我小时候第一次了解曼德布罗特()的一集时感到兴奋。
(集:复杂平面上形成的分形集合)
PS自推出了新的2.0家族以来只有一个多月的时间,所以我恐怕不是因为Dogge。
目前,付费用户可以使用2.5 Pro,开发人员也可以在AI中尝试。 表示,它还将在接下来的几周内启动AI模型。
但是,当我们使用最新的大型拼图“竹杆问题”测试2.5 Pro时,它无法平稳地通过水平。
试用地址:
参考链接:
本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。
暂无评论