马斯克旗下 xAI 官宣两款 AI 模型,Grok-2 评分优于 GPT-4o-mini 和 Claude 3.5 Sonnet

进不了网站?换个网络试试!

该图片由网友使用 Grok-2 生成

搜狐科技出品

作者:郑松懿

看来马斯克并不甘心接受谷歌抢了风头,所以他的公司xAI也抢着来凑热闹。

北京时间8月14日下午,xAI官方公布了Grok-2和Grok-2 mini两款AI模型(beta版)。

xAI直接透露,前段时间在Lmsys大模型舞台上出现的神秘型号“sus--r”就是Grok-2。

在xAI给出的大模型排名中,Grok-2的得分比GPT-4o-mini高出3.5分。

马斯克旗下 xAI 官宣两款 AI 模型,Grok-2 评分优于 GPT-4o-mini 和 Claude 3.5 Sonnet插图

根据xAI内部测试结果,与上一代机型相比,Grok-2和Grok-2 mini在阅读理解、数学、编码、推理等方面都有了显著的提升。

值得一提的是,Grok-2 在数学推理()测试中名列前茅。

马斯克旗下 xAI 官宣两款 AI 模型,Grok-2 评分优于 GPT-4o-mini 和 Claude 3.5 Sonnet插图1

但细心的网友不难发现,即便是Grok-2,在其他方面也比不过新锐型号GPT-4o或者3.5,不得不说,这张图的布局很是贴心(GPT-4o和3.5排列得很远)。

即便是这样的成绩,马斯克依然肯定了xAI的研发进展,称“Grok正像火箭一样前进”。

解决经典问题

目前,Grok-2 和 Grok-2 mini 在 X 平台上处于测试阶段,可供 X 和 + 用户使用,该模型将于本月晚些时候通过企业 API 提供。

xAI 表示 Grok-2 的 API 将基于新的定制技术堆栈。

一方面支持多地域推理部署,实现全球范围的低延迟访问,另一方面增强安全特性。

该模型发布还不到半天,很多网友就迫不及待想要把玩一下。

有人试图在前天马斯克与特朗普的公开对话中添加图片。

马斯克旗下 xAI 官宣两款 AI 模型,Grok-2 评分优于 GPT-4o-mini 和 Claude 3.5 Sonnet插图2

其他人则试图让特朗普和奥巴马在中国长城上一起烧烤。

马斯克旗下 xAI 官宣两款 AI 模型,Grok-2 评分优于 GPT-4o-mini 和 Claude 3.5 Sonnet插图3

不得不说,Grok-2生成的图像色彩饱和度相当高,但是图像的细节处理还有待提高(为什么奥巴马的手比较大?)。

“比较 9.9 和 9.11 的大小”这个热门问题难倒了 GPT-4o,但没有难倒 Grok-2(sus--r)。

马斯克旗下 xAI 官宣两款 AI 模型,Grok-2 评分优于 GPT-4o-mini 和 Claude 3.5 Sonnet插图4

马斯克旗下 xAI 官宣两款 AI 模型,Grok-2 评分优于 GPT-4o-mini 和 Claude 3.5 Sonnet插图5

一个意外的收获是,计数“r”这个经典问题也被Grok-2成功解决了。

马斯克旗下 xAI 官宣两款 AI 模型,Grok-2 评分优于 GPT-4o-mini 和 Claude 3.5 Sonnet插图6

偏好 xAI

xAI是马斯克于2023年7月创立的公司,旨在开发人工智能技术并构建安全的AI模型,以帮助人类解决复杂的任务和挑战。

马斯克对xAI寄予厚望,甚至愿意牺牲特斯拉来为xAI提供资源,帮助他实现在今年年底打造全球最强AI的目标。

除了直接从特斯拉招募优秀员工做软件开发外,马斯克还要求将为特斯拉预留的GPU转移给xAI。

马斯克表示:“特斯拉收集的大量视觉数据可以作为xAI的训练资源。”

他在最近一次采访中表示,“追求对事物的深度理解是人工智能发展的目标,Grok 也在朝着这个方向努力。

从现在来看,Grok-2 似乎只是其潜力的一小部分,而 Grok-3 则是马斯克的大举措。

他透露,Grok-3目前正在孟菲斯数据中心进行训练,大概会在3到4个月内完成,之后会进行微调和修复,希望在12月前发布,Grok-3或将成为全球最强的AI大模型。

据悉,孟菲斯数据中心拥有全球最大的超级计算机集群,拥有10万台液冷H100,从算力上看,大约是用于训练GPT4的2.5万台A100的20倍。

本站候鸟号已成立2年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。

相关推荐

暂无评论

发表评论