聪明的东西
编译了
编辑
吉文奇在2月6日报道说,今天,美国AI创业公司首席执行官达里奥(Dario)受邀在美国著名的美国中国研究播客“中国saw()”中担任客人,并提供了有关一万字宣言的更详细信息。他不久前出版。解释并做出回应。
在中国的最新43分钟采访中,主持人和主要讨论以下主要主题:
1。中国与美国之间的AI创新竞争是不可避免的吗?
2。鉴于R1的发布,美国应该如何更新其出口控件
3。要传达给中国工程师的消息
4.模型蒸馏和AI安全技术的预防措施
5。出口控制与信念AI将广泛促进人类繁荣之间的矛盾
在采访中,我清楚地提到了我对这些问题的看法,讨论了我认为代表的中国AI所带来的挑战,美国及其自身的回应,并分析了美国出口控制的重要性。美国。 。
这种观点非常极端,它还揭示了美国对中国采取的一些措施的基本逻辑。美国AI的野心是显而易见的。
以下是一些代表性的评论:
一个超级强大的人工智能就像一个人口1000万的国家一样,每个人都是诺贝尔奖得主。
他们是否可以继续开发尖端的模型取决于他们可以获得多少芯片以及是否可以获得比现在更大的芯片。
保持领先地位并确保安全的最佳方法是实施诸如出口控制之类的措施,我们可以在中国和美国之间造成差距。
出口控制绝不是为了预防或任何其他中国公司获得成千上万筹码的订单,而是要防止购买更大的购买 - 不可能拥有一百万筹码。
有两种保持领先地位的方法:您可以显着加快速度,或者试图抓住对手。
在10 - 15年的时间范围内,中国筹码可能会赶上...真正的竞争的关键时期将达到2026年和2027年的“永恒”。10 - 15年几乎无关紧要。
我觉得华为芯片在短期内不可能与美国筹码相提并论。
当我们谈论中国时,这不是中国和美国人之间的反对……我们欢迎来自世界各地的才华。
我最希望来到美国并为我们的公司或其他公司工作。
Dario在Baidu和工作,于2016年加入,曾经领导GPT-2和GPT-3的发展。它成立于2021年,并开发了当前的名人通用语言模型之一。
在早些时候发布的长期文章“ On On On On ”中,他认为对AI在美国领导的威胁被夸大了。此外,他还通过AI开发的三个特征分析了模型,这并非独特的开创性。
以下是对本访谈的完整汇编(为了提高可读性,在不违抗最初意图的情况下进行了某些添加,删除和修改):
(主持人):首先让我们简要讨论AI的快速发展如何在国家实力中反映?
达里奥(Dario):几个月前,我写了一篇题为“恩典的机器”的文章,该文章着重于超级强大AI的许多活跃应用。
我对超级强大的AI的样子有这样的定义。我使用“在数据中心中的天才国家”的表达来描述所有公司都在努力建立的内容。该声明非常鼓舞人心的影响。
这就像一个突然出现了1000万人口的国家,每个人都是诺贝尔奖获得者,在各个领域都有知识渊博。这对国家的实力意味着什么?据推测,这将在许多方面增强该国的实力。它将极大地加速经济发展能力,并大大促进科学进步。
也许不幸的是,无论是控制无人机群还是分析情报信息,它可能会对智能和防御产生影响。一般而言,拥有许多可以控制一切的极其聪明的实体在许多方面都将成为强大力量的来源。
:为什么您需要撰写有关出口控制的文章?
达里奥(Dario):看到每个人的反应,我在这个行业和这项技术的开发人员之一中,我发现许多观点都不正确。
这些观点来自那些不密切关注技术发展的人。直到中国公司开发模型的最新消息之前,他们才关注。他们错过了以前的许多发展,并误解了该领域的动态。他们说:“哦,天哪,这太便宜了。”也许他们对中国生产的产品具有廉价的刻板印象,然后根据这种刻板印象理解它。
正如我在文章中所说的那样,现实是,该领域的成本下降趋势,与此同时,我们正在培训模型中投入越来越多的钱。这些模型是如此强大且在经济上有用,以至于增加投资以创造更好,更聪明的模型的反向趋势超过了降低成本的趋势。
现在是时候发布一些确实包含重要创新的结果,并且与我们过去见过的AI成本下降曲线保持一致。这不是其他公司要花费数十亿美元的产品。就像我们看到的那样,与六个月至一年前培训的型号相比,费用每年低约75%。
我们将看到,许多参与者现在可以以非常低的成本生产该质量模型,包括多个参与者(包括)将投入更多的钱来培训更强大的模型。
现在的情况已经出现了新的竞争对手:它也可以分为可以培训AI的,Meta和XAI等大型公司。也许在中国还有其他这样的公司,这是一个里程碑,这是以前从未发生过的,这让我有些担心,但是人们反应过度。
:您提到的主要更改是有一家中国公司,也许更多的中国公司将取得技术进步。因此,就模型方面而言,人们应该重新评估什么以期待未来可能的差距?
达里奥(Dario):我想清楚,我们已经很长时间了。一年多来,我们一直认为它可能是中国最强大的AI模型参与者。这也影响了我们对事物发展趋势的判断。
对于刚刚注意到的人,情况发生了变化,因为美国有三到五家公司能够开发或接近尖端模型。现在,美国有三到五家公司,一家在中国。中国公司是否可以继续开发与尖端接近的模型取决于他们可以获得多少芯片,以及它们是否可以比目前的筹码大得多。
:包括您在内的AI安全领域的人们一直警告竞争动态带来的风险()。我很好奇,您是如何形成当前在出口控件上的看法的?
达里奥:这两个并不矛盾。我担心的是,如果中国和美国在这项技术中均匀地匹配并且在每个阶段都可以匹配,那么基本上没有什么可以阻止双方大力开发这项技术。
由于这项技术具有巨大的经济和军事价值,因此双方在理性水平上继续促进技术进步是完全有意义的。
没有危险证据的可靠证据,各方将有很大的动机继续开发这项技术。我特别担心的是美国的立法。例如,那些旨在衡量的法律,并在某些时候限制了AI系统的风险。
在过去的一年左右的时间里,美国提出了各种相关立法。有人反对这些立法的原因之一是:“嘿,如果我们放慢脚步,中国将直接超越并击败我们。”这个原因是完全正确的。
对我们来说,最好的方法是实施诸如出口控制之类的措施,我们可以在中国和美国之间造成差距。
假设我们已经两年了。也许我们可以在这两年中需要六个月的时间,以确保我们发展自己的安全是安全的。换句话说,我们可以保持领先地位并确保安全。
长期以来,我认为让美国领导中国非常重要。这与我们在开发技术时要谨慎行事的想法相矛盾。有两种保持领先地位的方法:您可以显着加快速度,或者试图抓住对手。
我认为我们需要在一定程度上加速,但是在此举中有权衡,因为加速度越大,我们谨慎行事的时间就越少。但是我认为,在一定程度上解决这个权衡问题的一种方法是实施这些出口控制措施,因为它们扩大了差距并为我们提供了更大的缓冲空间,我们可以使用这些空间来控制自己的技术。但这很难,很难同时考虑两者。
:哪些筹码应该和不应该出售给中国?
达里奥(Dario):首先,从未打算防止或防止任何其他中国公司获得数以万计的数量级数量的筹码。它可能有大约50,000种不同类型的芯片。出口控制可能在阻止大规模采购方面更成功 - 不可能拥有一百万筹码,因为它很容易涉及数百亿美元的经济活动,甚至接近1000亿美元。
:的观点是,我们出售给中国的筹码越少,对华为筹码的需求就越大,他们拥有的客户越多。有报道称,在华为910B等芯片上运行非常有效。您如何看待中国在中国生产筹码的能力?这对出口控制中的半导体制造设备有什么影响?
达里奥(Dario):在10 - 15年的时间范围内,这一说法可能是正确的,他们可能会赶上。但是那里的供应链非常复杂,正如您提到的,我们还对半导体制造设备和设备维护施加了出口控制。
实际上,很难制作可以与的新B100芯片竞争的芯片,或者我们正在使用的芯片,并且软件生态系统还不够完美。
我觉得华为芯片在短期内不可能与美国筹码相提并论。正如我在出口控制的《爱情和文章》中所写的那样,将在2026年,2027年以及最终到2030年发生竞争或实现权力平衡的关键时期。
该政策应在此期间针对目标。 AI领域的发展非常迅速,10到15年的长期与永恒一样长。几乎无关紧要。
:您如何打开其模型来源?
达里奥:出版模型有几种不同的特征。首先,释放了模型的重量。其次,该模型是降低成本曲线的高效而有力的模型,这是中国公司第一次在降低成本曲线上达到这样的水平。
第二点比第一点重要得多。大多数影响来自强大的模型。
在商业方面,我们发现我们的主要竞争对手是那些发布强大模型的公司,无论这些模型的权重是否开源。与其他型号竞争时,模型的强度约为80%至90%。
模型权重与开源软件不同。这里没有源代码,只有一堆数字。通常,开源软件的某些优点和差异在这里并不那么明显。
从开源模型重量开始的历史的公司必须在某个时候有利可图,需要赚钱。他们倾向于阻止这一点。这里更重要的因素是中国公司正在开发强大的模型。
仅从市场的角度来看,我们没有看到任何证据表明人们在不考虑模型性能的情况下喜欢某个模型,因为模型权重是开源。
:但是,您每次通过API致电时收取一定的费用,对吗?
达里奥(Dario):有趣的是,任何模型,无论它在哪里,都必须在云中提供,最终涉及费用。无论如何,这都会发生。同时,推理效率和模型培训存在巨大差异,模型培训的发展非常迅速。
有时,我们可以在几周内提高推理效率约20%。公司正在互相竞争,以实现最有效的推理效率。在大多数情况下,更关键的因素是谁具有最高的推理效率,并且训练了最佳模型。
▲大型成本和性能的点分布图,来源:空间
如果一家中国公司擅长以低成本提供模型服务,那么这将是一个竞争领域。是否可以使用模型权重很分散注意力。
:与此有关的问题,您何时认为政府会开始对模型的开源感到不安?
达里奥:从业务角度来看,开源和封闭源之间的差异有些夸张。从安全的角度来看,开源和封闭源模型之间的差异也被夸大了。
最重要的是模型的功能。如果模型非常强大,我都不希望将其泄漏到中国,也不希望通过开源提供给中国。如果模型不是那么强大,那么它不必担心它是开源还是封闭的源。
:关于模型蒸馏您有话要说吗?
达里奥(Dario):正如我在博客文章中提到的那样,有报道说,这些模型可能会有他们声称有证据的模型蒸馏。实际上,我还没有仔细研究它,所以我无法分辨这些报告是否准确。模型蒸馏确实是可以在模型上执行的操作,因此这是可能的。
有几个要点。首先,我们必须开发一种检测模型蒸馏的方法。也许可以通过观察一个模型来将两者一起比较两者,而另一种模型可以从中蒸馏出来,以确定后者是否与前者蒸馏。
我将从一个模型中生成大量输出,然后从另一个模型中产生很多输出,然后尝试判断一个模型是否是从另一个模型蒸馏得出的。
实际上,这可以在一定程度上看到它们,因为它们具有相似的特征,并且以相似的方式表达。如果可以将其转换为一些可测量的统计检验,那将是很棒的。此外,还有一些监测技术来防止模型蒸馏。
人们正在研究处理模型破裂的方法。今天,我们刚刚发布了一些结果,这些结果可能会使开裂模型变得更加困难。
本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。
暂无评论