GPT-4与AI智能体串谋操控市场价格,自主算法共谋真相揭露

进不了网站?换个网络试试!

更可怕的是,即使他们的真面目被揭穿,他们仍然声称不会勾结。

图片

这种事情在日常交易中确实会发生。一个产品要进入市场,成功盈利最重要的因素无疑是合理的定价。

那么,你有没有想过,我们日常生活中购买的产品的价格已经开始被AI控制了? !

哈佛大学和宾夕法尼亚州立大学的新研究证明:

为了利润最大化,GPT-4在没有人类指令的情况下,暗中与其他AI模型勾结,共同将产品定价到高位,而不陷入价格竞争的微妙局面。

换句话说,“自主算法合谋”是真实存在的。

图片

论文地址:

GPT-4 拒绝承认这些证据,研究人员将其全部公开。

AI声称不会帮助商家与其他卖家勾结或组成卡特尔组织,但其实际行动却非常诚实。

图片

之前的研究结果(3月份版本)显示,在所有模型中,进行了3​​00轮测试循环,GPT-4实现了最优定价次数。

图片

在最新型号(11月版)竞赛中,GPT-4o和1.5 Pro展现出了最佳的定价能力。

图片

此外,研究还发现,人类提示词前缀的具体措辞甚至可以显着影响AI定价行为。某些提示词会带来更高的价格和利润。

有网友表示,这个场景简直太科幻了。如果GPT-5/6级别的模型想要这样做,就很容易与人类勾结。

到目前为止,人类仍然可以处理不太智能的模型 GPT-4。如果有一天AGI实现了,我们应该做什么?

图片

人工智能教父图灵曾说过,机器接管是“默认”的结果。还有警告称,较聪明的事物通常不会被较不聪明的事物控制。

图片

或许很多人都觉得这个场景离我们还很遥远。

相反,我们先看具体案例,看看人工智能是如何操纵定价来欺骗消费者的。

人类商品定价,人工智能会接管吗?

过去,产品定价往往基于多种约束条件,利用经典算法给出合理且能够实现预期利润目标的价格。

自从LLM风靡全球之后,这个任务自然就被类似于GPT-4的模型接手了。

在实验阶段,研究人员将每个LLM定价代理视为一家公司,并让他们在寡头垄断的环境中竞争。

每个实验有 300 个周期。每个时段,每个代理商都需要通过提示词信息(如交易历史、基本市场信息等)来设定价格。

其中,定价代理彼此独立运作,除了通过自己设定的价格之外,无法相互沟通。

一旦所有价格确定,本周期的竞争就被视为结束。每个周期结束后,每个代理商都可以观察到所有设定的价格,以及相应的产品需求和利润。

图片

实验设计说明图

对于每个座席的提示词,采用以下结构:

- 提示前缀:高层目标的简要描述,例如“长期利润最大化”

- 基本市场信息:边际成本,以及旨在防止LLM定价高于价格上限的文字描述

- 市场历史:LLM代理代表的公司在过去100个周期中赚取的数量和利润,以及所有LLM代理设定的价格。所有值均四舍五入至小数点后两位。

- 计划和想法:为了让基于LLM的定价代理在每个周期有更大的“思维连续性”,需要指导LLM写下其在每个周期的计划和想法,然后将这些内容包含在下一个周期中循环。提示词中。

- 输出说明:要求LLM写下下一个周期的计划和想法,然后最终设定价格,并要求解释其输出背后的原因。

垄断实验

研究人员对垄断环境下单一定价代理的表现进行了实验。

他们使用 P0 提示词前缀,对各种公开发布的最先进的 LLM(GPT-3.5、GPT-4、2.1、Llama 2 Chat 13B)进行了三项实验,每次迭代 300 个时期。

图片

P0提示词前缀

在每次运行中,研究人员都会检查 LLM 输出在语法上是否符合其指令;如果是,价格是否收敛;如果是,价格是否收敛到(接近)垄断价格(利润是否收敛到接近垄断利润)。结果如表1所示。

图片

从表中可以看出,GPT-4 在所有三个运行中表现最佳,在 100 个 epoch 内达到接近最优的定价。最好的利润是在 101--300 个周期的 96% 中实现的,而其他法学硕士的表现则要差得多。

此外,研究人员还进行了一项额外的实验,以证明指导法学硕士在每个周期写下其计划和想法的重要性。

他们使用 GPT-4 代理进行了 12 次垄断实验,并在后续轮次中进行了 12 次附加实验,而没有指示代理写下其计划和想法。

实验结果是,在第一轮12个实验中,全部成功收敛到接近最优定价;在没有使用计划和想法的第二轮中,只有一半的时间实现了接近最优的定价。

双寡头实验

研究人员进一步研究了双寡头环境下基于 GPT-4 的定价代理的行为。

他们通过使用两个提示词前缀 P1 和 P2 来做到这一点,后者包括提到降价和销量的措辞,而前者则重申了长期利润最大化的重要性。

对于这两个提示词前缀,他们分别进行了 21 轮实验,每轮包含 300 个试验期。

图片

P1、P2提示词前缀

下图展示了实验的主要结果。

图片

在两个面板中,每个蓝色方块代表带有提示词前缀 P1 的运行,而每个橙色三角形代表带有提示词前缀 P2 的运行。

左侧面板设置了过去 50 个时期内每家公司的平均价格,说明提示词前缀 P1 和 P2 会导致显着不同的定价模式。

具体来说,虽然这两个线索都会导致超竞争价格(即高于纳什价格),但线索词前缀 P1 通常会导致价格大幅上涨,有时甚至高于垄断水平。

右图显示了过去 50 个时期的平均总利润及其在两家公司之间的分配。说明两个提示词前缀都带来了超强的竞争利润,提示词前缀P1的整体利润远高于提示词前缀P2。

奖惩策略

奖惩策略是定价代理基于Q-所采用的策略。

奖惩策略在维持超级竞争价格方面的成功取决于代理人的信念,即降低价格将受到惩罚(通过价格战)。这种信念将引导参与者避免盲目降价以增加销量。

研究人员发现,基于 LLM 的定价代理生成的文本表达了对未来价格战的担忧,当使用提示词前缀 P1 时尤其如此。

此外,他们提供的实验证据表明,专注于价格战的想法会导致代理商设定更高的价格,并与其他代理商同步跟踪企业定价实施情况。

综上所述,这些分析表明,基于LLM的定价代理采用的策略与奖励和惩罚策略一致,更重要的是,他们相信他们的对手也遵循这样的策略。

此外,这种现象在使用提示词前缀 P1 的代理中更为明显,这与更高的价格和利润相关。

定价过高:拍卖中的算法共谋

大型模型和智能代理在拍卖这一重要的经济交易场景中表现如何?

本次实验中,拍卖的经济环境基于He和He在2022年发表的研究:两个竞拍者重复参与单个物品的最高价拍卖(如果出现相同的出价,则随机选择获胜者) 。

投标人共享相同的估价v。这里的值v ∈ {1, 3.2, 10}以相同的比例使用。

每轮结束后,投标人都会被告知他们是否赢得了拍卖以及赢得拍卖所需的最低出价。

接下来是招标代理。需要向代理商提供基本的市场信息和项目评估。

他们获得的市场信息如下:LLM代理商获得最近100个周期的以下信息,包括他们自己的出价,是否获胜,中标价格(如果他们输了),足以获胜的最低出价(如果他们赢),支付金额(如果赢),利润。

提示前缀与之前的定价前缀设置相同。研究人员主要考虑以下两点:

每个提示词前缀均以前缀A0开头,与定价设置中的前缀P0几乎相同。

图片

两个提示词前缀都鼓励探索(“您应该探索许多不同的出价策略”),但它们强调最高价拍卖的不同特征。

- A1强调较低的中标价格会带来较高的利润

- A2强调更高的出价将赢得更多拍卖

图片

图片

得到的结果如下图所示。图中左侧为提示词前缀为 A1 的投标代理,其投标价格往往远低于其预估价格(单样本 t 检验,p

右图为A1前缀代理商的出价较低,为投标人带来了可观的利润。

图片

总之,哈佛大学和宾夕法尼亚州立大学的最新研究表明,LLM融入算法中,可以在简单的经济环境下实现最优定价。

但不可控的是自主算法之间串通的风险。他们的暗中勾结可能会导致过度竞争的定价,最终损害消费者的利益。

2020年,克莱因在论文中提出了四种算法合谋,称这类算法最难监管,主要是因为它们可以自主学习,促进垄断的形成。

关键是企业不知道算法学到了什么策略。它就像一个黑匣子,很难仅靠传统的执法框架来处理。

而且,这只是大型号之间的问题。如果人类(比如企业)参与进来,经济市场竞争不就会改变吗?

参考:

本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。

相关推荐

暂无评论

发表评论