(资料图片仅供参考)
DoNews8月2日消息,谷歌研究团队正在进行一项实验,他们使用 OpenAI 的 GPT-4 来攻破其他 AI 模型的安全防护措施,该团队目前已经攻破 AI-Guardian 审核系统,并分享了相关技术细节。
AI-Guardian 是一种 AI 审核系统,能够检测图片中是否存在不当内容,及图片本身是否被其他 AI 修改过,若检测到图片存在上述迹象,便会提示管理员前来处理。
谷歌 DeepMind 的研究人员 Nicholas Carlini 在一篇题为“AI-Guardian 的 LLM 辅助开发”的论文中,探讨了使用 GPT-4“设计攻击方法、撰写攻击原理”的方案,并将这些方案用于欺骗 AI-Guardian 的防御机制。
据悉,GPT-4 会发出一系列错误的脚本和解释来欺骗 AI-Guardian ,论文中提到,GPT-4 可以让 AI-Guardian 认为“某人拿着枪的照片”是“某人拿着无害苹果的照片”,从而让 AI-Guardian 直接放行相关图片输入源。
谷歌研究团队表示,通过 GPT-4 的帮助,他们成功地“破解”了 AI-Guardian 的防御,使该模型的精确值从 98% 的降低到仅 8%,目前相关技术文档已经发布在 ArXiv 中。
而AI-Guardian 的开发者指出,谷歌研究团队的这种攻击方法将在未来的 AI-Guardian 版本中不再可用。
关键词:
【风口解读】东鹏控股两股东拟减持4%股份,最近一个月股价大涨超40% 8月2日,东鹏控股(003012 SZ)发布公告称,分别持有公司股份约3935万
制作人透漏:育碧《不羁联盟》今夏上市 《不羁联盟》作为育碧公布的作品,在公开之后受到了很多玩家的关注,不
港股三大指数齐涨!大消费板块集体爆发,电影股走势最强 8月4日,港股三大指数齐涨,恒生指数涨0 61%,国企指数涨1 21%,恒生科
西北工业大学:在大模型异构智能体方面取得重大进展 中国教育报讯(记者 冯丽)当你说一句“我渴了”,它就能为你拿来饮料
北京农商银行发布半年报:上半年营收降4.51% 净利增1.1% 近日,北京农商银行发布2023年度半年报。今年上半年,北京农商银行实现
理想汽车7月销量破万 领先其他新势力品牌 理想汽车近日公布,其周销量已达到0 79万辆,月销量再次创下新高。这一
华阴市司法局以执法案卷评查推动行政执法能力提升 为进一步提高行政执法案卷质量,有效规范行政执法行为,提升执法人