英伟达CEO黄仁勋CES 2025演讲:GPU与AI的革命性融合,开启智能体新时代

进不了网站?换个网络试试!

机器之心编辑部

“它打开了人工智能的大门,现在人工智能又回到了中国的怀抱,带来了新的革命。”

老黄穿上了新皮衣,带来了新GPU。

今天早上全世界的目光都集中在拉斯维加斯。

北京时间1月7日上午10点30分, CEO黄仁勋在拉斯维加斯CES 2025展会上发表主题演讲,涵盖GPU、AI、游戏、机器人等话题。

演讲开始,黄仁勋回顾了 GPU的发展历史。从2D到3D,从CUDA到RTX的诞生。人工智能时代,GPU推动了AI从感知到生成的演进。接下来将是智能代理,未来很快就会有人工智能进入物理世界。

机器学习改变了每个应用程序的构建方式以及计算的完成方式。现在,完全面向人工智能计算的硬件会是什么样子? 给我们做了演示。

RTX 50系列全线发布,最高可达3352 TOPS

的架构AI计算卡问世已久,人们一直对消费级GPU的新架构充满期待。今天,直接做了一次性发布。

CES现场,黄仁勋手持显卡,满怀自豪地走上讲台。

性能参数方面,GPU的RTX 5090拥有920亿个晶体管、3352个AI TOPS(每秒万亿次运算)、380个RT(每秒万亿次浮点运算)、125个(着色单元)。

英伟达CEO黄仁勋CES 2025演讲:GPU与AI的革命性融合,开启智能体新时代插图

(和5090D)拥有32 GB GDDR7显存,显存宽度为512位,CUDA核心数量为21760个,功耗为575W。更详细的指标如下所示:

英伟达CEO黄仁勋CES 2025演讲:GPU与AI的革命性融合,开启智能体新时代插图1

RTX 5090 是迄今为止最快的 RTX GPU。在架构创新和DLSS 4的支持下,RTX 5090的性能比RTX 4090高出2倍。

新技术更多:新一代超分辨率DLSS 4性能提升8倍。 首次引入了多帧生成功能,通过使用 AI 为每个渲染帧生成最多三帧来提高帧速率。 DLSS 4 与 DLSS 技术套件配合使用,可将性能提高至传统渲染的 8 倍,同时通过技术保持响应能力。

DLSS 4还引入了图形行业第一个实时应用模型架构。基于DLSS的光重建和超分辨率模型使用多2倍的参数和4倍的计算能力,在游戏场景中提供更高的稳定性、更好的重影、更高的细节和增强的抵抗力。锯齿状效果。发布当天,DLSS 4 将在超过 75 种游戏和应用程序中支持 RTX 50 系列 GPU。

同时,2引入了Frame Warp创新技术,该技术在将渲染帧发送到显示器之前根据最新输入更新渲染帧,以减少游戏延迟。 2 将延迟降低了 75%,让玩家在多人游戏中具有竞争优势,并使单人游戏的响应速度更快。

此外,着色器中还引入了AI。 25 年前, 3.0 引入了可编程着色器,为二十年的图形创新奠定了基础,包括像素着色、计算着色和实时光线追踪。此次还推出了RTX神经着色器,将小型AI网络引入可编程着色器中,解锁实时游戏中的电影级材质、光照等。

渲染游戏角色是实时图形中最具挑战性的任务之一,RTX Faces 将简单的光栅化脸部和 3D 姿势数据作为输入,并使用生成式 AI 实时渲染时间稳定的高质量数字脸部。

RTX Faces 补充了用于光线追踪头发和皮肤的新 RTX 技术,并与新的 RTX Mega 一起,可以在场景中实现多达 100 倍的光线追踪三角形,有望为游戏角色和环境带来巨大的真实感飞跃。

中文官网也展示了RTX 50系列的参数。

英伟达CEO黄仁勋CES 2025演讲:GPU与AI的革命性融合,开启智能体新时代插图2

公布价格时,黄玩了个小把戏:你还记得价格吗?如果现在购买,只需549美元即可获得4090的性能(国行价4599元)。

英伟达CEO黄仁勋CES 2025演讲:GPU与AI的革命性融合,开启智能体新时代插图3

不过,这一代的价格似乎还是有所上涨(为1599美元),达到了1999美元。国行RTX 5090D售价也已出炉,16499元起,RTX 元起。

英伟达CEO黄仁勋CES 2025演讲:GPU与AI的革命性融合,开启智能体新时代插图4

英伟达CEO黄仁勋CES 2025演讲:GPU与AI的革命性融合,开启智能体新时代插图5

在移动端,RTX50系列的性能提升也非常可观。黄仁勋特地带来了一款RTX 5070笔记本。移动显卡今年也将很快推出。

英伟达CEO黄仁勋CES 2025演讲:GPU与AI的革命性融合,开启智能体新时代插图6

更多移动型号(整机)的价格可以参见下图:

英伟达CEO黄仁勋CES 2025演讲:GPU与AI的革命性融合,开启智能体新时代插图7

不过,黄仁勋并没有详细介绍各型号的基本性能,具体还要等待届时的真机测试。预计搭载RTX50系列显卡的设备最早将于3月份上市。

在继续演讲之前,黄仁勋首先提出:“全世界的互联网流量都可以通过这些芯片来处理。”

英伟达CEO黄仁勋CES 2025演讲:GPU与AI的革命性融合,开启智能体新时代插图8

他手里拿着的大晶圆,上面有72个GPU,AI浮点性能达到1.4。这是格蕾丝。

英伟达CEO黄仁勋CES 2025演讲:GPU与AI的革命性融合,开启智能体新时代插图9

与上一代相比,每瓦性能提高了4倍。

新法律,第一个基本世界模型

我们知道,大型模型遵循扩张法则(Laws),而最近AI领域热议的是规模是否已经走到了尽头。

从的角度来看,定律仍在继续,所有新的RTX显卡都遵循三个新的扩展维度:训练前、训练后和测试时间(推理),提供更好的实时视觉效果。

英伟达CEO黄仁勋CES 2025演讲:GPU与AI的革命性融合,开启智能体新时代插图10

宣布了一系列基于 Llama 的模型,包括 Llama Nano、Super 和 Ultra。它们涵盖从 PC 和边缘设备到大型数据中心的一切。

还发布了运行在RTX AI PC上的基本模型,以支持数字人、内容创建、生产力和开发等任务。

这些模型作为 NIM 微服务提供。基于 NIM 微服务构建的 AI 提供易于使用、预配置的参考工作流程。

英伟达CEO黄仁勋CES 2025演讲:GPU与AI的革命性融合,开启智能体新时代插图11

人工智能的下一个前沿是物理人工智能,实体智能和空间智能等新概念已经出现。在CES上,发布了世界模型平台,其中包括SOTA的生成式基础世界模型、高级、护栏和高速视频处理流程。目标是推进自动驾驶汽车 (AV) 和机器人等物理人工智能系统的开发。

英伟达CEO黄仁勋CES 2025演讲:GPU与AI的革命性融合,开启智能体新时代插图12

英伟达表示,物理人工智能模型的开发成本高昂,并且需要大量现实世界的数据和测试。世界基础模型 (WFM) 为开发人员提供了一种简单的方法来生成大量逼真的、基于物理的合成数据,以训练和评估其现有模型。开发人员还可以微调 WFM 以构建自定义模型。

该模型已公开发布,相关地址如下:

表示,许多领先的机器人和汽车公司已成为首批用户,包括1X、Agile、Uber等。

黄仁勋表示:“机器人时代即将到来。与大型语言模型一样,基于世界的模型对于推动机器人和自动驾驶汽车的开发至关重要,但并非所有开发人员都拥有训练自己的世界模型的专业知识和资源。我们的创建是为了实现物理人工智能的民主化,并使通用机器人技术可供每个开发人员使用。”

演讲中,黄仁勋还展示了一些使用模型的方法,包括视频搜索和理解、基于物理的真实感合成数据生成、物理人工智能模型开发和评估,以及使用和生成可能的未来。

先进的世界模型开发工具

构建物理人工智能模型需要 PB 级的视频数据和数万小时的计算时间来处理、组织和标记这些数据。为了帮助节省数据整理、训练和模型定制方面的巨额成本,提供了以下功能:

目前,整个物理AI行业的先行者都在使用它,比如推出了1X世界模型挑战数据集的AI和人形机器人公司1X,以及另一位从自主出发向世界提供生成式AI的先驱者Waabi车辆,在自动驾驶中。软件开发和模拟在数据管理环境中进行评估。

人工智能超级计算机

还对之前的AI超级计算机DGX-1进行了升级。总体来说:体积更小,性能更强。 将其描述为:“为世界各地的 AI 研究人员、数据科学家和学生提供的个人 AI 超级计算机,使他们能够获得 Grace 平台的强大功能。”

采用全新 GB10 Grace超级芯片,可提供世界一流的AI计算性能,可用于原型设计、微调和运行大型AI模型。使用它,用户可以使用桌面系统开发和运行模型推理,然后在加速云或数据中心基础设施上无缝部署模型。

英伟达CEO黄仁勋CES 2025演讲:GPU与AI的革命性融合,开启智能体新时代插图13

GB10超级芯片提供领先的节能AI性能

GB10超级芯片(GB10)是一款基于Grace架构的SoC,可在FP4精度下提供高达1的AI性能。

GB10配备了GPU,采用最新一代CUDA核心和第五代核心,通过-C2C片间互连与高性能Grace CPU连接,其中包括20个基于Arm架构构建的节能核心。 表示,联发科也参与了GB10的设计。

GB10超级芯片仅使用标准电源插座即可实现强大的性能。每个都有 128GB 内存和高达 4TB 的 NVMe 存储。借助这台超级计算机,开发人员可以运行多达 2000 亿个参数的大型语言模型,从而加速人工智能创新。此外,借助网络,两台AI超级计算机可以连接起来运行多达4050亿个参数的模型。

让人工智能超级计算触手可及

借助 Grace ,企业和研究人员可以在运行 Linux 版 DGX OS 的本地系统上对模型进行原型设计、微调和测试,然后将其无缝部署到 DGX Cloud、加速云实例或数据中心基础设施。

这使得开发人员可以在云上构建 AI 原型,然后使用相同的 Grace 架构和 AI 软件平台在云或数据中心基础设施上进行扩展。

此外,用户还可以访问广泛的人工智能软件库进行实验和原型设计,包括 NGC 目录和开发人员门户中提供的软件开发套件、编排工具、框架和模型。开发人员可以使用 NeMo 框架来微调模型,使用库来加速数据科学,并运行 .

表示,其及其顶级合作伙伴将于 5 月份推出该产品,起价为 3,000 美元。

本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。

相关推荐

暂无评论

发表评论