据熟悉此事的人们说,3月26日,最近讨论了购买数十亿美元数据存储硬件和软件的计划。有两个熟悉此事的人说,为了容纳硬件,该公司正在考虑首次建立自己的数据中心。
该计划将很快成为世界上最大的存储客户之一,并证明它希望在开发人工智能的过程中对关键数据有更多的控制。
讨论与减少对其长期云计算服务提供商的依赖的努力相吻合。这表明您不想完全依靠外部企业来满足存储需求。截至目前,还没有独立操作数据中心。
建立自己的数据中心也可能有助于节省成本。由于该公司使用来自和(除外)的更多服务器,因此不同提供商之间迁移数据的成本可能高于将数据存储在其自身设施中的成本。
目前,尚未完成计划,并且可以将存储计划用作与云服务提供商进行谈判的谈判筹码。
存储硬件采购计划将与投资者软银宣布的“星际之门”数据中心计划有关,该计划计划在新设施中投资5000亿美元。已经讨论了德克萨斯州阿比林市星之数据中心附近的存储服务器,并计划从云服务提供商租用大量的GPU。
熟悉此事的人发现,数据中心通常包括为AI提供计算能力的计算机架和存储架,但希望建立一个专门用于存储的独立数据中心。该设施将能够与的GPU数据中心以及该地区可能使用的其他设施进行交互。
容量扩大了三倍,计算能力增加了八倍
存储计划恰好与星际之门计划同步。该计划的目的是通过具有强大的计算能力并成为世界上最大的数据中心客户之一来赢得AI竞争。
投资者被告知,他们计划今年扩大数据中心的能力超过三倍,以达到近2 gW(瓦特)的能源消耗,这一数字包括的租约用于开发AI和运行服务器。
领导力告诉员工,到今年年底,与2024年底相比,用于培训新AI的研究人员的计算能力将增加八倍,但该数据不包括用于支持它的服务器。
尽管AI计算主要集中在用于开发新型号的 GPU服务器的大型簇上,但研究人员还需要快速访问存储。从您自己的设施中访问数据可能比从微软的存储服务器快要快。
保存检查点()
在开发新的AI模型数周或几个月时,存储特别重要。
寻找多达5个存储空间。相比之下,截至2021年,Apple使用的所有云提供商总共有大约8个存储空间,主要用于处理其服务中的媒体和文档数据。
研究人员保存了用于开发新模型(称为检查点)和权重的算法的快照(即确定模型性能的参数设置)。保存这些检查点可以使AI开发人员在修改权重后遇到问题时恢复特定节点的培训,而无需从头开始。
潜在的存储采购计划已成为存储行业中的热门话题。其存储软件合同的潜在竞标者包括纯,大量数据,DDN,Minio和WEKA。服务器制造商(例如Dell和HP)也可能竞标交易的服务器硬件部分。
目前尚不清楚计划如何为这些存储设备付款。软银分别承诺将向星际之门合资企业投资190亿美元,以开发数据中心或租赁其他公司的计算能力。计划到3月底将筹集约100亿美元。 (Jinlu专门编写的腾讯技术)
本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。
暂无评论