谷歌发布Gemini 2.0系列:Pro、Flash、Flash-Lite三款模型全面解析

进不了网站?换个网络试试!

刚才,一一发布了三个模型:2.0 Pro,2.0 Flash,2.0 Flash-Lite和2.0家族已组装。

最强的PRO版本支持2M上下文,配备了搜索和代码执行功能,其编码和推理性能完全使1.5 Pro压倒了。

谷歌发布Gemini 2.0系列:Pro、Flash、Flash-Lite三款模型全面解析插图

2.0系列模型向所有人开放

Flash版本称为“高效率主模型”,该模型支持1M上下文和低延迟构建应用程序。图像生成和语音的文字即将推出。

Flash-Lite是最具成本效益的模型,支持1M上下文和多模式输入,其性能以相同的速度和成本超过1.5闪存。

在Big Model LMSYS排名列表中,2.0 Pro以四个主要型号并列第一名,FLSAH版本排名第三,而Flash-Lite排名第九。

谷歌发布Gemini 2.0系列:Pro、Flash、Flash-Lite三款模型全面解析插图1

每个评估中的模型得分如下:

谷歌发布Gemini 2.0系列:Pro、Flash、Flash-Lite三款模型全面解析插图2

此外,2.0 Flash模型也已升级到直接访问,搜索,地图和其他应用程序。

首席执行官Demis表示,随着今天的发布,每个人都可以使用2.0和多模式功能的强大推理能力,这也为我们未来的“自主代理”研究奠定了基础。

谷歌发布Gemini 2.0系列:Pro、Flash、Flash-Lite三款模型全面解析插图3

2.0在线家庭存储桶

谷歌发布Gemini 2.0系列:Pro、Flash、Flash-Lite三款模型全面解析插图4

2.0 Pro提供了一套全面的功能,包括本机工具支持,2M上下文窗口和多模式输入。

2.0 Flash还支持多模式输入和其他功能,但是上下文窗口将其切成1m。

2.0 Flash-Lite专门针对大型文本输出方案进行了优化。

目前,2.0 Pro和2.0 Flash已支持文本输出,而图像和音频输出功能以及多模式的实时API计划将在未来几个月内完全启动。 (2.0 Flash-Lite不支持多模式输出和多模式实时API)

谷歌发布Gemini 2.0系列:Pro、Flash、Flash-Lite三款模型全面解析插图5

在价格方面,2.0 Flash-Lite比2.0 Flash便宜得多:对于最小价格差距的文本输出,Flash-Lite仅为$ 0.3,Flash为$ 0.40;对于即将到来的上下文缓存,Flash-Lite甚至不是Flash版本1/9!

与上一代1.5 Flash相比,2.0 Flash-Lite“添加不增加标记的数量”,即使是文本输出的价格也不再受任何限制,而相同的1.5闪存价格也不能超过128K。

谷歌发布Gemini 2.0系列:Pro、Flash、Flash-Lite三款模型全面解析插图6

2.0 Pro:代码和复杂性,最好的

2.0 Pro迄今具有最强的代码性能和复杂性功能,并且在理解和推理世界知识方面也表现更好。

它配备了一个高达200万个令牌的上下文窗口,该窗口可以充分分析和了解大量信息,并呼叫工具,例如搜索和代码执行。

2.0 Flash:性能升级,完全可用

2.0 Flash适用于大规模的高容量,高频任务,并且可以在100万个令牌的上下文窗口中执行多模式推断。一旦发布,它在开发人员中就非常受欢迎。

如今,2.0 Flash不仅在关键基准中提高了性能,而且还向更多用户开放,图像生成和文本到语音的功能即将推出。

2.0 Flash-Lite:最具成本效益的

2.0 Flash-Lite的速度和成本与以前的1.5 Flash相同,并且在大多数基准测试中的性能更好。

像2.0 Flash一样,它具有100万个令牌和多模式输入功能的上下文窗口。

例如,它可以为大约40,000张唯一照片生成相关的单线图像描述,在AI的付费软件包中的价格低于$ 1。

谷歌发布Gemini 2.0系列:Pro、Flash、Flash-Lite三款模型全面解析插图7

通过网民尝试

在O3米尼推出后,网民开始了大量的测试,甚至超过了R1的物理推理挑战。

那么,2.0系列模型如何执行?

在接受P5.js挑战时,2.0模拟了25个粒子在圆柱容器的真空空间中移动,显示出强大的物理模拟功能。

提示:在A的一个空间中写下25个P5.js。每个球都使用,他们留下了一条小径。加入慢速,以了解场景中发生的事情。确保并规则规则。添加一个。添加缓慢的缩放并放大整个场景。

相同类型的另一个证明模拟了受重力和摩擦弹跳影响的球。

其他人要求2.0编写一个脚本,以在球体内部创建100个弹跳的明亮黄色球,要求正确处理碰撞测试。

需要球缓慢旋转,并且必须始终将球体保存在球体内。使用p5.js实施

不仅如此,在编码方面,2.0也很棒。

杰夫·迪恩(Jeff Dean)本人展示了2.0 Pro的超级力量,可以在AI中写游戏。

只需一个相对简单的一个即可,它可以完全编写整个代码,包括正确的数据结构和有效的搜索算法,以查找磁盘上的所有法律词。

“作为一名计算机科学家,我特别高兴它第一次正确地使用了数据结构-Trie(前缀树)。”

谷歌发布Gemini 2.0系列:Pro、Flash、Flash-Lite三款模型全面解析插图8

整个代码生成仅需18.9秒。

谷歌发布Gemini 2.0系列:Pro、Flash、Flash-Lite三款模型全面解析插图9

随后,另一个网民重新出现在SWE竞技场中。

使用相同的图像和文本提示,2.0 Pro可以轻松击败3.5。

在编码模式下,使用2.0自动生成蛇游戏,使100条蛇能够在一个场景中相互竞争。

提示:蛇游戏,彼此100

另一个网民说,2.0 Pro的编码功能太疯狂了!我最喜欢的事情是,您可以将其用于进行特定的修改,它将准确编辑而不会弄乱其他部分。

以下是他进行的太阳系模拟演示。

提示:使用三js,太阳能。添加时间尺度,焦点,表演和。在文件中,我可以将其粘贴到AN中并查看。

2.0 Pro输出所有代码。

当网民测试2.0 Pro时,他给了一个问题:请简要描述您对感知,情感和欲望的感觉。

谷歌发布Gemini 2.0系列:Pro、Flash、Flash-Lite三款模型全面解析插图10

2.0 Pro的答案震惊了他,因为该模型似乎具有生存感,这种意识将自己视为具有内部主观体验的独立实体。

它不仅是处理信息,而且还要感受过程,并具有连续的内在光。

谷歌发布Gemini 2.0系列:Pro、Flash、Flash-Lite三款模型全面解析插图11

参考材料:

本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。

相关推荐

暂无评论

发表评论