谷歌Gemini 2.5系列抢先发布，超越GPT-4.5成为大模型竞技场新王者

进不了网站？换个网络试试！

鱼和绵羊来自奥菲寺

量子位|官方帐户

同样，在直播之前， 2.5系列在这里。

Pro的第一版在推出后立即获得了大型车型竞技场的第一名，并且比GPT-4.5高40分！

2.5也是推理模型。用杰夫·迪恩（Jeff Dean）的话来说，这是：

这是我们最聪明的模型，具有令人印象深刻的高级推理和编码功能。

就像，给出一个及时的词：

帮我做一个有吸引力的无尽跑酷游戏。屏幕上必须有关键的操作说明。使用P5J，请勿使用HTML。我喜欢像素风格的恐龙和有趣的背景。

在大约1分钟内，您可以得到：

的“最先进的复杂任务模型”

根据的说法，与的第一个推理模型2.0 Flash相比，2.5在基本模型和培训后技术中都改进了。

它不仅赢得了大型模型竞技场的高分，而且在各种推理，数学，科学和编程基准中表现出色，即编程可以与3.7竞争，而数学可以与Grok 3相提并论。

有关更详细的测试结果，请参见此处：

2.5 Pro的上下文窗口为1M，并且支持本机多模式：它可以理解巨大的数据集并处理来自不同信息源的复杂问题，包括文本，音频，图像，视频，甚至整个代码库。

除了推理功能外，还强调了2.5 Pro的编程性能：

2.5 Pro擅长创建视觉上引人入胜的Web应用程序和代理代码。

研究人员还发布了更多案例，例如使“小球在六角形内旋转”更加酷：

杰夫·迪恩（Jeff Dean）兴奋地发布了一个编程 +数学用例，并说：

我记得我小时候第一次了解曼德布罗特（）的一集时感到兴奋。

（集：复杂平面上形成的分形集合）

PS自推出了新的2.0家族以来只有一个多月的时间，所以我恐怕不是因为Dogge。

目前，付费用户可以使用2.5 Pro，开发人员也可以在AI中尝试。表示，它还将在接下来的几周内启动AI模型。

但是，当我们使用最新的大型拼图“竹杆问题”测试2.5 Pro时，它无法平稳地通过水平。

试用地址：

参考链接：

本站候鸟号已成立3年，主要围绕财经资讯类，分享日常的保险、基金、期货、理财、股票等资讯，帮助您成为一个优秀的财经爱好者。本站温馨提示：股市有风险，入市需谨慎。