OpenAI与谷歌大模型对决:日活十亿应用与顶尖模型的终极较量

进不了网站?换个网络试试!

当要求选择每天10亿个应用而不是一流的大型模型时,大型型号的历史是否已经结束?

大型模型最尖端的摊牌将发生在和另一个之间。随着大型模型的性能稍微提高,在基础架构和应用程序生态系统方面具有明显的优势,并且双方都在加速控制对方位置的控制。在巨人队中,Agi探索人类智能边界的重要性已经消失,其自身的问题尚未解决,但它声称准备解决许多人类问题。

近战的节奏已经取决于天堂。在将近一周的时间里,启动了下一代TPU和代理协议A2A,迭代了大量的多模式模型,并推出了更计算机的节省动力2.5型号2.5 Flash;让我们记住用户告诉它的所有内容,并发布了声称正在消除GPT-4.5的GPT-4.1系列,以及可以用图像思考的O3和O4-Mini的全血版本。我已经面对几次被释放,火药的气味很大。

如今,在Scale AI创建的“最后考试”中,只有和尖端模型,包括本周的O4-Mini和-2.5-Flash。其他可以进入前十名的人是-3.7和R1(仅文本类排名)。

图片

资料来源:人类最后考试(仅文本)模型评估

这种快节奏的发布以及逐步的收敛函数表明,在扩张法的边际效应减弱之后,行业的技术路线开始汇聚。目前,比赛是关于执行的。尽管员工的主观意图很重要,但客观的基础设施和应用生态系统可以在很大程度上“扩展”主观意图的效果。

下一代大型模型的预培训越来越多地取决于团队对基础架构和优化功能的熟悉。最近,公开讨论了GPT-4.5的培训经验以及基于此培训下一代模型的前景。大型模型参数的规模越大,预训练数据集越大,并且硬件故障造成的损失越大;基础设施量表的增长也在扩大硬件故障的复杂性,计算,存储,通信和能量需要系统的考虑。当计算能力需求超过单个集群的供应能力时,它必须转向多组培训体系结构,这是一个新的挑战。元对这些也有深刻的了解。

因此,即使使用无限的GPU,网络和力量,也无法“在GPT-4的技术堆栈上训练GPT-4.5”。如果从基础架构的起点无法解决此问题,则GPT-5.5可能是上限。

该行业正在进入推理时代。在大型模型的趋势很明显的时候,成本效益是扩大用户规模的关键之一。对于AI应用程序,以较低的成本提供类似的服务也是提高利润率的来源之一。这意味着,任何人都能尽可能多地挤压基础架构的计算能力。

目前,优势也位于方面。尽管在解决编码问题时,O3比2.5 Pro是一个轻微的优势,但成本是它的成本接近成本的20倍。相比之下,专注于小而有效的O4米尼不仅昂贵,而且水平略低。 O4-Mini的所谓高成本效益相对于其自己的产品系统,而不是整个市场,这无疑会削弱其竞争力。

图片

目前不可能将其完全归因于的硬件优势。在算法和产品水平上,整个行业仍然有很大的降低成本空间。今天发布的的-2.5 -Flash就是这种情况。开发人员可以通过设定高预算限制来控制思维阶段中模型推理的深度;该模型还将根据提示的复杂性自动判断所需的推理量和思考时间。

但最终,竞争仍然将落在筹码和基础设施上。半导体分析机构认为,的定制TPU的总拥有成本低于的通用GPU。 “分析数据中心就像窥视AGI的核心……在AI的军备竞赛中,不同公司(数据中心)的建筑差异很大。”今年2月,该机构的迪伦·帕特尔(Dylan Patel)在X上写道。当时,尚未发布用于推理的AI芯片,该芯片的效率是上一代TPU的两倍,技术可以帮助其实现有效的分布式计算。

仍然是追逐者,从微软,甲骨文等购买的GPU并租用基础设施,无法从芯片和基础架构优化中受益。去年,它与 TPU的前工程高级主管偷猎,但即使一切顺利,它与合作的定制芯片也将直到2026年才开始大规模生产。而且,第一代自开发的芯片无法达到成熟水平,不能大规模快速部署,并且至少会经历三个迭代。亚马逊已经迭代了第二代,并声称能够达到40万温室的集群,但其实际总拥有成本仍然远低于。 计划投资5000亿美元,目前购买的建筑芯片。

时间在的身边。在赶上基础设施的两三年中,对策是培养更大的应用生态系统。这不仅涉及大规模的货币化,使您可以看到那天活着,而且还因为它是提高用户粘性的有效手段。只有这样,用户才能将“成本绩效比率”的比较锁定到自己的产品系统中。无论是富含软件和硬件生态系统中的Apple用户,还是在社交媒体网络效应下的元用户,由于价格,他们都不会轻易离开该生态系统。

加入了众神之战。搜索是生成AI的最有前途的流行应用程序之一,也是产品矩阵概念的关键难题。去年年初,搜索消息在市场上流传,媒体还发现,积极挖掘的员工正在积极挖掘他们。 7月,内部测试正式启动; 在年底进行了搜索,这是他自发行两年以来最喜欢的功能,这使他的使用频率翻了一番。今年,搜索和代理商进一步合并并包装到博士研究助理中,最高每月薪水为20,000美元。

代理是实施大型模型的确定性途径。尽管接受了MCP协议,但我们仍在建立自己的智力生态系统。 O3和O4-Mini具有代理级工具使用功能。与以前的大型模型相比,它们通常被动执行指令,并且可以考虑何时以及如何使用工具。在直播期间,格雷格总统还提到,当O3解决一项复杂的任务时,观察到该工具被连续地称为600次。 API也是1个月前发布的,以使模型和内置工具之间的互动更加容易。

最近,在一次独家采访中声称:“拥有10亿日常活跃用户的产品比顶级AI模型更有价值。”接近这个目标。去年年底,每周活跃用户的数量达到3亿,今年2月超过4亿; 在刚刚刊登的TED 2025会议上说,全球10%的人口经常使用,并且在短短几周内翻了一番。

但是,这一切都没有逃脱的影响力领域。在今年2月的收益会议上,表示,它已与其七个产品和平台相连,其中有超过20亿用户。在其他产品逐渐采用搜索作为AI对话框的功能之一之后,继续使用AI来增强搜索,AI概述涵盖了每月10亿个活跃用户,超过2亿个手机可以使用“绘图圆圈的AI功能搜索”;另一方面,这是去年年底首次发起深度功能的人,这几乎是该行业的标准功能。 的A2A协议还声称比MCP更了解如何与代理商互动。

在技​​术仍处于不同创新的阶段,短暂失去了方向并匆忙跳舞,几次灾难性的新闻发布会已成为笑话。但是,在技术的逐步融合阶段,每天都与竞争是一个挑战,的市场价值为1.8万亿。

本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。

相关推荐

暂无评论

发表评论