在刚刚的CES大会上,黄仁勋宣布RTX 5090正式发布。
50系列GPU,价格如下——
RTX 5090系列和RTX 5080将于1月30日上市,RTX 5070 Ti和RTX 5070将于2月上市,RTX 50系列笔记本电脑将于3月上市
紧接着,黄以独特的“美国队长”造型赢得了观众的阵阵掌声,并揭晓了全新数据中心超级芯片——Grace。
它配备了72个GPU、1.4的计算能力和130万亿个晶体管,目标是超越世界上最快的超级计算机。
随后,世界上第一台真正的桌面超级计算机震撼亮相。
世界上最小的人工智能超级计算机仅需 3000 美元。
有了它,200B大机型就可以在办公桌上运行了。
换句话说,它只占用桌面上一个咖啡杯的空间,但却可以提供数据中心级别的计算能力!
搭载全新GB10 Grace超级芯片,在FP4计算精度下可提供高达1的性能。
黄预测:未来,每个数据科学家、研究人员和学生的办公桌上都会有这样一台个人人工智能超级计算机。
AI时代将属于所有人。
RTX 5090登场,DLSS 4也来了
经过几个月的泄密和八卦,新一代 RTX GPU 终于正式亮相。
首先我们来看看性能参数:
值得注意的是,RTX 5090 D的AI算力仅为2375 TOPS。
不过,虽然比5090的全血版少了一半,但至少比4090D高了一倍。
如此豪华的配置,再加上DLSS 4和架构的支持,RTX 5090的性能直接是RTX 4090的两倍以上。
不过,这也意味着它的功耗会非常高(RTX 5090的显卡总功耗为575瓦,建议供电功率为1000瓦)。
演示显示,在 RTX 5090 上运行《赛博朋克 2077》时,启用 DLSS 4 后达到每秒 238 帧,而在 RTX 4090 上启用 DLSS 3.5 时,仅达到每秒 106 帧。
RTX 5080 的速度是 RTX 4080 的两倍,配备 16GB GDDR7 显存,显存带宽为 960GB/秒,CUDA 核心数量为 10,752 个。
RTX 5070 Ti配备16GB GDDR7显存,显存带宽为896GB/秒,CUDA核心数为8960个。
RTX 5070配备12GB GDDR7显存,显存带宽为672GB/秒,CUDA核心数为6144个。
老黄甚至声称RTX 5070将以549美元的价格提供RTX 4090级别的性能,这无疑归功于DLSS 4的改进。
向左或向右滑动即可查看
此外,老黄还展示了RTX GPU,并进行了实时渲染演示。
他表示,“新一代DLSS不仅可以生成帧,还可以预测未来。我们推动了AI,现在AI正在创新。”
新的 RTX 可用于压缩游戏中的纹理,而 RTX Face 利用生成式 AI 来提高面部质量。
下一代DLSS包含多帧生成技术,可以在每个传统帧的基础上生成最多三个附加帧,与传统渲染相比,帧率提高高达8倍。
此外,DLSS 4还包括在实时应用中的使用,可以提高图像质量,减少重影效应,并为动态图像添加更高的细节。
值得一提的是,在RTX 50系列上采用了全新的设计。
配备两个双流风扇、3D均热板和GDDR7显存。 RTX 50系列中的所有显卡均支持PCIe Gen 5,并配备2.1b接口,能够驱动高达8K分辨率和165Hz的显示器。
令人惊讶的是,RTX 5090 是一款双插槽显卡,可以装入小型机箱,这与 RTX 4090 的尺寸相比是一个巨大的变化。
资深科学家Jim Fan在老黄的演讲中发现了图形技术的“亮点”。
大家都在期待RTX 5090的发布,关注它的规格,但你真的了解黄仁勋所说的图形技术吗?新显卡使用神经网络生成游戏中超过 90% 的像素!传统的光线追踪算法仅渲染大约 10% 的内容,相当于一个“粗略的草图”,然后生成模型在前向传递中实时填充剩余的细节。女士们、先生们,人工智能是新一代图形技术。
50系列显卡亮相后,黄提到“定律仍在继续”:
法律不断发展,推动人工智能对计算的巨大需求。
令人惊奇的是,包括微软、Meta、xAI在内的大约15个超级计算中心都已经配备了GPU。
接下来,他提到了Agent AI,这是一个完美的测试应用示例。
同时,他还宣布推出一系列开放许可的基础模型——Llama,可以在各种智能代理任务中提供极高的准确率。
黄说,“人工智能代理可能是下一个机器人产业,可能是价值数万亿美元的机会。”
向左或向右滑动即可查看
此外, NIM也即将在PC上推出。借助这些蓝图,开发人员可以基于 PDF 文档创建播客、生成由 3D 场景引导的令人惊叹的图像等。
向左或向右滑动即可查看
桌面级AI超级计算机,可运行4050亿LLM
在CES大会结束前,黄仁勋还推出了一款革命性的压轴产品——真正的“桌面超级计算机”!
它是为人工智能开发人员、数据科学家、学生等从事人工智能工作的专业人士而设计的。
这台小型计算机是“世界上最小”的AI超级计算机,可以运行200B参数模型,售价3000美元(约合人民币21986元)。
正如老黄所演示的,这套紧凑的桌面系统提供了强大的计算能力,同时只占用极小的桌面空间——
宽度约为普通咖啡杯的长度,高度仅为其一半左右。
想象一下您办公桌上有一个提供数据中心级计算能力的微型设备。
这是革命性的突破!
搭载全新GB10 Grace超级芯片,可在FP4计算精度下提供高达1(/秒)的AI性能。
这款功能强大的芯片还配备了具有 20 个 ARM 内核的 Grace CPU。 CPU和GPU通过C2C技术实现高速互联。
每个都配备 128GB 低功耗统一高一致性内存,以及高达 4TB 的 NVME 存储。
有了它,开发者可以直接在桌面上运行高达2000亿的大型模型。
令人惊讶的是,两台超级计算机可以通过网络芯片互连,可以运行多达 4050 亿个参数的模型。
此外,还预装了DGX基础操作系统(基于Linux)和AI软件栈,为开发者提供了开箱即用的AI开发环境。
开发者可以即插即用,快速开始AI项目的开发。
对于数百万开发者来说,这将是一项改变游戏规则的创新。
特别是,它特别适合处理需要云计算/数据中心资源运行的大型AI模型。
这款桌面AI超级计算机拥有广泛的应用场景,包括AI模型实验和原型开发、AI模型微调和推理(用于模型测试或评估)以及本地AI推理服务(例如聊天机器人或代码智能助手) 。
此外,数据科学家可以利用系统操作直接从桌面高效处理大规模数据科学工作流程。
在 AI完整技术栈(框架、工具、API)的加持下,它已成为边缘计算应用的理想开发平台,特别适合机器人和VLM等领域。
AI的诞生标志着个人AI计算进入了新时代。
它使世界各地的开发者能够在办公桌上运行超大规模的AI模型,补充现有的云计算资源,大大提高AI开发效率。
物理AI新时代,世界基础模型全部开源
说完智能体AI,黄把话题带到了“物理AI”。在他看来,“人工智能的下一个前沿是物理人工智能。”
大模型的工作原理是根据提示,一次生成一个token,产生输出。
如果这个上下文变成了真实的周围环境,如果提示问题变成了请求,那么大模型就需要从生成“内容令牌”转变为生成“动作令牌”。
现在,我们需要做的是创建一个有效的“世界模型”,而不是GPT语言模型。
这个“世界模型”必须理解世界的语言,必须理解物理动力学,例如重力和摩擦力,必须理解几何和空间关系,理解因果关系,理解物理永恒……
在CES现场,老黄正式宣布了一个革命性的世界基础模型开发平台——旨在理解物理世界。
它基于2000万小时的数据集进行训练,可以将文本、图像和视频作为输入,并可以生成虚拟世界状态和视频。
该平台包含扩散模型、自回归模型、视频分割器等多个功能模块,开发者可以根据具体需求选择使用。
值得一提的是,老黄将现场所有文件直接开源,Nano、Super、Ultra均可供公开下载。
此外,它可以与两者结合使用,以提供物理上真实的多元生成器。
这意味着物理模拟世界中的一切都可以一次性生成。
老黄还提到了三台计算机——一台DGX用来训练AI,另一台AGX用来部署AI,最后一台是+。
如果我们想连接前两者,我们需要一个数字孪生。
老黄认为,“未来每个工厂都会有一个数字孪生,你可以把它结合起来,产生很多未来的场景。”
向左或向右滑动即可查看
自动驾驶汽车+机器人
建造自动驾驶汽车,就像机器人一样,需要同样的三台计算机。
截至目前,每年生产汽车1亿辆,全球汽车保有量达数十亿辆,未来都将逐步成为高度自动化、全自动驾驶系统。
黄预测,这将成为第一个价值数万亿美元的机器人产业。
同时,他发布了下一代汽车处理器——Thor,其处理性能比上一代Orin高20倍,同时也是一款通用机器人处理器。
那么,在自动驾驶的背景下+能做什么呢?
它可以生成无限的驾驶场景,在短尾、无法收集数据等场景下加速自动驾驶的发展。
接下来,老黄把所有的机器人都召集到了台上,说道:“通用机器人的时代到了。”
他说,“目前机器人分为三种类型:智能AI、自动驾驶汽车、机器。如果我们有技术解决这三个问题,机器人时代指日可待。”
发布会最后,老黄总结说,我们现在有三套新系统正在生产中。
除了Grace超级计算机之外,还有一个物理AI基础模型,另一个是在智能代理AI上开发的三型机器人。
刚刚,英伟达股价再次创下历史新高。
一夜之间,英伟达股价上涨逾 3%,收盘价超过 150 美元/股,超过 11 月份创下的历史最高收盘纪录 148.88 美元/股。
如今,英伟达最新估值已达3.66万亿美元。
参考:
本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。
暂无评论