DeepSeek崛起:从LLM通用模型V2到V3,R1模型引领AI推理新潮流

进不了网站?换个网络试试!

[文本/观察者网络专栏作家Pan ]

“小按钮和大声音”不仅从LLM通用模型的V2迭代到V3,而且还进一步启动了R1模型,重点是推理功能。从培训成本,建筑调整和开源模型中,技术震惊了世界,并引发了海啸的赞誉。春季音乐节期间,大海的资本市场的急剧波动以及一年开始后的国内“概念股票”的急剧上升使这一现象继续成为公众中热门讨论的重点。

这种成功适应了推入前AI模型的不可避免的演变。为什么世界的崛起是跟随时代的举​​动?让我们先看看两个段落。

去年2月下旬,首席执行官 Huang在接受《美国技术媒体》的采访时说:“ 今天的业务可能是40%的推理和60%的培训,这是一件好事,因为它使您意识到AI终于成功了。如果的业务是90%的培训和10%的推理,您可以说AI仍然是早期的研究阶段。

去年12月,首席财务官莎拉·弗里尔(CFO Sarah Friar)在接受技术媒体“信息”采访时说:“ Pro向C-End用户开放的软件包每月为200美元,这确实很便宜。其合理的价格应为每月2,000美元。”她进一步与背景采访的含义相结合,主要说“善良”,并坚持AI的道德意识来服务于公众的平等权利,因此她没有使价格如此高。如今,他们的虚伪皮肤在R1开源模型面前被完全撕裂了。

这两个段落是相当代表性的,一个点是AI技术应用的演变,另一个与AI培训模型实施的商业化有关。这两个级别的问题是交织和人际关系的。

就像他在开发“星门”的领导下,将计算能力的规模定律扩展到私人资本市场和国家投资领域,并试图将人工智能行业束缚到美国国家命运上时,他就叙事了。

在人群的喧嚣中,海洋另一侧的怀疑,甚至具有恶意性质的诽谤也值得关注。

分析美国AI大型模型行业的某些顶级人物的评论可以进一步加深我们对痛点真正打击另一方的理解。著名的半导体咨询机构总裁迪伦·帕特尔(Dylan Patel)和两家公司的首席执行官达里奥(Dario)代表了整个海洋的详细分析数据和询问声音。在中国互联网世界中翻译后,这两家公司的文章已被大量翻译和重印。

DeepSeek崛起:从LLM通用模型V2到V3,R1模型引领AI推理新潮流插图

首席执行官达里奥(Dario)

他们主要试图告诉公众,从四个角度来看,突破并不是那么“坚硬”:GPU库存,成本计算,非技术营销和模型数据蒸馏中不合规。

1。“灵敏度”高端GPU库存

根据计算,“它大约有10,000 H800 GPU芯片,10,000 H100 GPU芯片和大量H20 GPU芯片。”

达里奥(Dario)在长篇文章中转发了计算,称大约有50,000张 GPU卡(cast割和非堆积版本),手中使用了体系结构。这个数量大约是该数字和美国主要的AI模型培训机构之间差距的两倍或三倍。结合基于综合数据(数据)和强化学习提高推理能力的训练后(后)方法,他认为自己已经站在巨人的肩膀上,并使用大量的GPU来实现当今的成绩。

为什么达里奥(Dario)使用数据将自己升至最高?

因为达里奥(Dario)在他的心中对AI培训费用有一个所谓的“摩尔定律”,因此每年可以将其减少约三到四次。如果使用加强学习方法调整了推理体系结构,则成本可以降低到六到八次,但这是降低成本的限制。基于此成本估算假设,有50,000张卡。

DeepSeek崛起:从LLM通用模型V2到V3,R1模型引领AI推理新潮流插图1

因此,如果我们进一步询问,如果我们认为我们手上有这么多高端GPU卡,他们如何计算?他们采用了类似于荒谬方法的推理:仅培训的成本仅为3.5,高达数千万美元。如果这样的神奇的手可以有效地降低成本,为什么要找不到亚马逊筹集数亿美元呢?

关于投资者如何花钱的问题,也许马斯克的道路(政府效率部)对回答更感兴趣。与和相比,代表云服务提供商的亚马逊首席执行官不得不跳出撰写长篇文章的主要原因之一是,他深入意识到,基于GPU 1亿至百万到数百万美元的生态系统是培训。他们系列的总价格最高,总成本效益最低。

DeepSeek崛起:从LLM通用模型V2到V3,R1模型引领AI推理新潮流插图2

与H100相比,合法拥有的H800主要是cast割的通信带宽;尽管H20也被cast割,但单卡的计算能力仅为H100的20%,H20可以通过多卡堆叠模式,其HBM容量(96GB)甚至高于A100/H100(80GB)。换句话说,H20的内存带宽可以使每个阶段生成小于A100和H100的令牌所需的时间。

cast割的版本使用了禁运版本没有的效果,这使Dario实际上做出了恶意的言论,可以进一步加强对中国大陆的GPU控制。这可能是他批评的目的。

从话语系统的角度来看,使用缺乏公平训练成本倒置的AI模型可以绕过监管并非法持有高端GPU,然后,使用基于沙子堆建立的推论来讨论成本问题没有任何非凡的问题。这实际上是一个阴谋和循环论证。

本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。

相关推荐

暂无评论

发表评论