IT Home在4月4日报告说,技术媒体昨天(4月3日)发表了一篇博客文章,报道了的最新全球AGI(通用人工智能)安全框架,呼吁在技术失控之前建立跨国保护机制。
人们认为,AGI即将被实施,并提倡立即采取行动。 AGI可能会在未来几年内实现人类水平的认知能力,其独立的决策特征可能会加速医疗和教育领域的突破,但也应警惕诸如滥用和目标误差之类的风险。
发布了白皮书“技术AGI安全和保证方法”,提出了一种系统的解决方案,以解决通用人工智能(AGI)的潜在风险。
It Home引用了一篇博客文章,并介绍了该报告的重点是四个主要风险领域(滥用,错位,事故,结构性风险),并提议通过安全机制设计,透明的研究和行业合作来减少伤害。
目标错位是AGI的核心风险之一。当AI采用非常规的手段来完成任务(例如入侵票务预订系统以获得席位)时,它会偏离人类意图。培训AI通过“放大监督”技术来识别正确的目标,并使用AI自我评估(例如辩论机制)来改善复杂场景中的判断力。
拟议的国际安全框架放弃了抽象的道德讨论,并着重于技术快速发展的实际问题,包括建立类似于核不扩散条约的跨国评估机构,建立国家AI风险监测中心等。
提出了三个支柱计划,以加强技术研究,部署预警系统并通过国际机构协调治理,强调迫切需要限制诸如AI网络攻击之类的危险能力。
该倡议不是孤立的行动。竞争对手在2024年11月警告说,AI失控并设定了触发保护机制的能力阈值。 Meta于2025年2月推出了 AI框架,以停止揭示高风险模型。
安全保护已扩展到硬件字段。 于2025年1月推出了Nemo Suite,以实时拦截有害产出。它目前用于医疗,汽车和其他行业。
本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。
暂无评论