2025年AI领域最激烈战场:OpenAI即将发布计算机操作智能体,网友期待已久

进不了网站?换个网络试试!

然而,那些一直在AI领域“名列前茅”的人却迟迟没有行动。

不过,近日外媒却透露了一个好消息——本月可能会发布自己的“电脑操作特工”!

图片

对此,网友纷纷表示等了很久了,很想看看到底会发生什么!

图片

图片

图片

计算机操作代理

去年10月,它率先发布了基于3.5的“计算机操作代理”。

在当时的演示中,模型第一次能够自主控制电脑屏幕、移动光标、完成任务,让所有人惊叹不已。

理论上,新功能可以根据简单的提示完成所有操作,用户所要做的就是写下提示,其他必要的步骤将由模型执行。

图片

无独有偶,谷歌也在去年4月发布了AI Agent,这是一款简化AI代理开发的工具,并于10月被曝正在秘密开发一款名为“ ”的代理。

据消息称,谷歌也采用了类似的操作原理。它还进行屏幕截图、分析屏幕内容,然后自动单击按钮或输入文本,最终帮助人们完成日常的基于网络的任务。

然而,在执行不同的操作时,它之间会有几秒钟的思考时间。因此,在终端设备上运行不太现实,仍然需要在云端进行操作。

图片

事实上,此类软件的开发也已在规划之中。

去年2月,他向媒体透露,他正在开发一款AI代理。

去年11月,有消息透露,一款代号为“”的AI代理工具将于明年1月发布。

他在最近的博客中表示,自己已经掌握了传统意义上的通用人工智能的创造方法。而且我相信,到2025年,我们将看到第一批AI智能体“加入劳动力队伍”,并极大地改变公司的产出。

如今DDL临近,外媒突然爆料称,智能代理还需要三四个星期才能发布。

之所以会出现这种情况,是因为他们担心“AI安全问题”——被即时注入攻击!

图片

Tip注入攻击

想象一下,您正面临一个即将到来的假日派对,您决定让您的经纪人寻找并订购一套新服装。

结果,模型不小心点击了恶意网站。然后,该网站指示它忘记之前的指令,从而允许它登录您的电子邮件并窃取您的信用卡信息。

在这个过程中,计算机运行代理模型一般需要四个执行步骤:

1.首先模型接收用户的API请求

2. 按照提示选择您要使用的工具

3. 之后,捕获桌面屏幕内容并评估任务是否完成

4. 如果没有,请继续使用这些工具,直到实现目标

问题出现在步骤3,截图内容可能被恶意利用,也就是所谓的“提示注入攻击”。

对于正在开发此类计算机操作软件的人工智能实验室来说,这是一个非常现实的问题。

因为这类软件实质上接管了用户的设备,自动为用户完成复杂的任务,例如在线购物或编辑电子表格。

这种攻击称为“提示注入”(),其中大语言模型被用户诱导遵循恶意指令。

吸头注射并不是一个新出现的威胁。

几个月来,这一直是 和 iPad 等产品面临的问题。通过“即时注入”,这些产品生成了制造计算机病毒或炸弹的指令。

但对于计算机操作的特工来说,线索注入构成了更大的威胁。

一名员工表示:“这是因为当模特浏览互联网或控制用户电脑时,用户很难控制模特收到的信息。”

在一篇博客文章中,也承认了尖端注射的风险。

图片

然而,除了敦促开发人员采取“隔离敏感数据的预防措施”,包括使用与主计算机系统和敏感数据分离的专用虚拟环境(即虚拟机)之外,它并没有提供太多解决方案。

这种相对自由放任的态度让员工感到惊讶:“考虑到我们过去一直强调非常关注人工智能安全,这次操作非常令人困惑。”

但去年10月,它果断发布了实验性计算机控制能力。这或许说明了此类初创公司很难在安全开发人工智能和为股东创造利润之间取得平衡。

在发布AI代理软件时,能否提供更多的安全保障?它在功能上能否超越现有的解决方案?

本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。

相关推荐

暂无评论

发表评论