谷歌DeepMind发布AGI安全框架，呼吁建立跨国防护机制

进不了网站？换个网络试试！

IT Home在4月4日报告说，技术媒体昨天（4月3日）发表了一篇博客文章，报道了的最新全球AGI（通用人工智能）安全框架，呼吁在技术失控之前建立跨国保护机制。

人们认为，AGI即将被实施，并提倡立即采取行动。 AGI可能会在未来几年内实现人类水平的认知能力，其独立的决策特征可能会加速医疗和教育领域的突破，但也应警惕诸如滥用和目标误差之类的风险。

发布了白皮书“技术AGI安全和保证方法”，提出了一种系统的解决方案，以解决通用人工智能（AGI）的潜在风险。

It Home引用了一篇博客文章，并介绍了该报告的重点是四个主要风险领域（滥用，错位，事故，结构性风险），并提议通过安全机制设计，透明的研究和行业合作来减少伤害。

目标错位是AGI的核心风险之一。当AI采用非常规的手段来完成任务（例如入侵票务预订系统以获得席位）时，它会偏离人类意图。培训AI通过“放大监督”技术来识别正确的目标，并使用AI自我评估（例如辩论机制）来改善复杂场景中的判断力。

拟议的国际安全框架放弃了抽象的道德讨论，并着重于技术快速发展的实际问题，包括建立类似于核不扩散条约的跨国评估机构，建立国家AI风险监测中心等。

提出了三个支柱计划，以加强技术研究，部署预警系统并通过国际机构协调治理，强调迫切需要限制诸如AI网络攻击之类的危险能力。

该倡议不是孤立的行动。竞争对手在2024年11月警告说，AI失控并设定了触发保护机制的能力阈值。 Meta于2025年2月推出了 AI框架，以停止揭示高风险模型。

安全保护已扩展到硬件字段。于2025年1月推出了Nemo Suite，以实时拦截有害产出。它目前用于医疗，汽车和其他行业。

本站候鸟号已成立3年，主要围绕财经资讯类，分享日常的保险、基金、期货、理财、股票等资讯，帮助您成为一个优秀的财经爱好者。本站温馨提示：股市有风险，入市需谨慎。