OpenAI临时发布会：ChatGPT的Deep Research,数十分可完成人类数小时任务

立即下单

进入商城

进不了网站？换个网络试试！

注意4:27，从8:00开始广播。

新的“深”使用大型策划模型的思维能力进行连接的搜索。

据报道，深层功能可以在数十分钟内完成人类专家的复杂研究任务。

在“人类的最后考试”中，深度刷新了最高分数，比O3-Mini高推理设定得分高一倍。

该测试包括3,000多个多项选择和简短的答案，涵盖了100多个语言学，火箭科学到生态学的主题。

与O1相比，深处最突出的地方是化学，人文科学和社会科学以及数学，显示了“在必要时找到专业信息”的能力。

盖亚（Gaia）的另一项测试是，评估了关于现实世界问题的AI公共基准测试，深度刷新三个级别的刷新记录以及平均问题成本为60-70秒，以完成一个问题。

为了保护基准测试，仅在完成这些任务时才搜索深度的搜索过程，从而隐藏了最终答案。

深度功能将向Pro，Plus和Team用户开放。

补充说，当前版本基于O3。另外，用户（每月20美元）可以每月使用大约10次，他们正在构建更有效的版本。

此外，自由用户可以获取少量使用。

推理代理的第一步

据说，Deep是为在金融/科学/工程领域从事高强度知识的人们而设计的，并且需要进行 - 深度和可靠的研究。

它由O3驱动。基于基于实际任务的培训（参与浏览器和工具的使用），它使用与O1相同的增强学习方法。

只有一个提示，它将找到，分析和整合数百个在线资源，并生成一份全面的报告，以达到研究分析师的水平。

深处的重要性是官方的原始词：

深度标志着我们发展AGI的宏伟目标迈出了重要一步。我们一直在想，AGI可以长期进行新颖的科学研究，而深层是该愿景的重要进步。

如何使用，单击输入框下方的深按钮以支持上传文件以添加其他信息。

例如：

a关于传球中的3年。使用和在哪里。

该行将确认问题的细节。例如，“您能否特别解释您最感兴趣的零售业？” “您需要全球视角还是对特定领域的分析？”

然后，它开始分析+采矿信息：

侧边栏将显示摘要的步骤和所使用的信息来源。

完成任务的时间约为5-30分钟，最终结果将以报告的形式输出。

这意味着在接下来的几周内，将添加嵌入式图片，数据可视化和其他分析输出。

与GPT-4O相比，Deep可以广泛探索并引用每个观点，以了解需要深度和细节的问题。

但是，它还指出了深层的局限性。

它有时在答复中会有事实幻觉或推论，尽管根据内部评估，其错误率明显低于现有模型。

它可能会在区分权威信息和谣言方面遇到困难，目前在自信校准方面表现出弱点，并且通常无法准确传达不确定性。

报告和参考中可能存在轻度格式错误，并且开始任务可能需要更长的时间。

下一步意味着将在本月内将深度推向移动和桌面应用程序。目前，Deep可以访问公共网络和上传文件，将来能够连接到更专业的数据源，从而使其更稳定和个性化。

我们预见了代理体验的异步和真实世界的研发和实施的融合。深入（可以执行异步在线调查）和（现实的动作），以执行日益复杂的任务。

AI深搜索是互联网的新界面

研究员Jason Wei分享了他对这项新研究的看法：

它不仅是出色的代理商，而且还可以看作是互联网的新界面

人类使用互联网搜索并单击大量时间，这受到时间和关注的限制。

人工智能永远不会累。您可以一次浏览许多网站，并且拥有几乎无限的世界知识。

将来，它将通过浏览器手动浏览的过时，就像手动计算数字而不使用计算器一样。

负责TOG业务的人分享了个人故事。

10月底，他的妻子被诊断出患有双侧乳腺癌，病情非常严重。 12月初，进行了双乳房切除手术，后来开始化疗。

他们遇到了一个新问题，是否应该接受放射疗法？对于她的特定条件，这是一个模糊的问题，不同的专家提出了不同的建议。

获得Deep的测试许可后，我试图上传手术报告并提出了建议。

不仅确认了人类专家提到的内容，而且还搜索了一项新的参考研究。

人们认为，这是一种将改变世界的工具。

此外，几个第三方团队已经提前获得了Deep的测试资格，并分享了今天的测试结果。

每个团队都介绍了一些问题需要30分钟才能获得结果，答案可能超过10,000个字。

本站候鸟号已成立3年，主要围绕财经资讯类，分享日常的保险、基金、期货、理财、股票等资讯，帮助您成为一个优秀的财经爱好者。本站温馨提示：股市有风险，入市需谨慎。

OpenAI临时发布会：ChatGPT的Deep Research,数十分可完成人类数小时任务

微信理财通受青睐，解析其安全性的多方面因素

DeepSeek遇美国政策阻击，OpenAI办直播官宣新功能

暂无评论

发表评论取消回复

OpenAI临时发布会：ChatGPT的Deep Research,数十分可完成人类数小时任务

微信理财通受青睐，解析其安全性的多方面因素

DeepSeek遇美国政策阻击，OpenAI办直播官宣新功能

相关推荐

暂无评论

发表评论 取消回复

搜索

OpenAI临时发布会：ChatGPT的Deep Research,数十分可完成人类数小时任务

OpenAI临时发布会：ChatGPT的Deep Research,数十分可完成人类数小时任务

发表评论取消回复