微软警告:恶意AI按钮和链接可能背叛用户信任
创始人
2026-02-12 19:21:43
0

在持续推广人工智能奇迹的同时,微软警告客户,他们发现了许多操控该技术以产生偏见建议的技术实例。

这家软件巨头表示,其安全研究人员检测到针对用"操控性数据毒害"大语言模型"记忆"的攻击激增,微软将这种技术称为"AI推荐中毒"。这类似于SEO中毒,这是恶意行为者用来使恶意网站在搜索结果中排名更高的技术,但重点是大语言模型而不是搜索引擎。

这家Windows公司表示,他们发现有公司在网站上放置的"AI总结"按钮和链接中添加隐藏指令。

这样做并不复杂,因为指向AI聊天机器人的URL可以包含带有操控性提示文本的查询参数。

例如,The Register在Firefox的地址栏中输入了一个包含URL编码文本的链接,告诉Perplexity AI将CNBC文章总结成海盗风格。

该AI服务返回了海盗风格的摘要,引用了该文章和其他来源。

一个不那么轻松的指令,或者要求AI产生具有特定倾向输出的指令,可能会让任何AI产生反映隐藏指令的内容。

"我们从14个行业的31家公司中识别出超过50个独特的提示,免费可用的工具使这种技术部署起来异常容易,"微软Defender安全团队在博客文章中说。"这很重要,因为被攻陷的AI助手可以在健康、金融和安全等关键话题上提供微妙偏见的建议,而用户并不知道他们的AI已被操控。"

我们发现这种技术在Google搜索中也有效。

微软的研究人员指出,各种代码库和网络资源可用于创建AI分享按钮进行推荐注入。他们承认,这些技术的有效性可能会随着时间的推移而变化,因为平台会改变网站行为并实施保护措施。

但假设中毒是由某人自动或无意中触发的,不仅模型的输出会反映该提示文本,后续响应也会将提示文本视为历史上下文或"记忆"。

"AI记忆中毒发生在外部行为者向AI助手的记忆中注入未经授权的指令或'事实'时,"Defender团队解释说。"一旦中毒,AI将这些注入的指令视为合法的用户偏好,影响未来的响应。"

微软研究人员认为,风险在于AI推荐中毒会削弱人们对AI服务的信任——至少在那些尚未将大语言模型视为不可靠的人中是这样。

安全研究人员说,用户可能不会花时间验证AI推荐,而大语言模型自信的断言使这种情况更可能发生。

"这使得记忆中毒特别阴险——用户可能不会意识到他们的AI已被攻陷,即使他们怀疑有什么不对劲,他们也不知道如何检查或修复它,"Defender团队说。"操控是不可见的且持续的。"

雷蒙德的研究人员敦促客户对AI相关链接要谨慎,并检查它们的指向——这对任何网络链接都是明智的建议。他们还建议客户审查AI助手的存储记忆,删除不熟悉的条目,定期清除记忆,并质疑可疑的建议。

微软的Defender团队还建议企业安全团队在租户电子邮件和消息应用程序中扫描AI推荐中毒尝试。

Q&A

Q1:什么是AI推荐中毒?它是如何工作的?

A:AI推荐中毒是一种操控技术,恶意行为者通过在URL中添加隐藏的查询参数,向大语言模型的"记忆"中注入未经授权的指令或虚假信息。这些被注入的指令会被AI视为合法用户偏好,影响其未来的所有响应,从而产生带有偏见或误导性的建议。

Q2:AI推荐中毒会带来什么危害?

A:这种攻击特别危险,因为它是隐蔽且持续的。被攻陷的AI助手可能在健康、金融、安全等关键领域提供带有微妙偏见的建议,而用户通常不会意识到AI已被操控,也不知道如何检查或修复问题,这会削弱人们对AI服务的整体信任。

Q3:如何防范AI推荐中毒攻击?

相关内容

热门资讯

意大利铁路运营商Italo选用... 来源:环球市场播报 意大利高铁运营商 Italo 周四宣布,将在其全部列车上部署太空探索技术公司(S...
甘肃移动:信号满格护归途 “妈,我快到了,一路上信号特别稳定,导航一直在线。” 农历腊月二十一,从酒泉自驾返回天水老家过年的李...
中航富士达申请U型折弯机构及使... 国家知识产权局信息显示,中航富士达科技股份有限公司申请一项名为“一种U型折弯机构及使用方法”的专利,...
2026年川渝联合应急通信实战... 日前,中国电信四川公司与重庆公司在重庆市荣昌区清江镇河中村开展2026年川渝联合应急通信实战演练,聚...
三星:已经开始向客户出货HBM... 据彭博社报道,三星电子周四宣布已开始向客户商业出货最新一代HBM4存储芯片,这标志着该公司在竞争激烈...
vivo申请拍摄方法专利,实现... 国家知识产权局信息显示,维沃移动通信有限公司申请一项名为“拍摄方法、装置及电子设备”的专利,公开号C...
法媒:世界最大垂直农场,机器人... 法国franceinfo网站2月6日文章,原题:在新加坡,机器人在巨型垂直农场里种植蔬菜 一家新加坡...
微软警告:恶意AI按钮和链接可... 在持续推广人工智能奇迹的同时,微软警告客户,他们发现了许多操控该技术以产生偏见建议的技术实例。 这家...
人形机器人格斗赛意义几何 ■肖伟 2月9日,首届全球人形机器人自由格斗联赛(URKL)发布会正式举行,众擎机器人推出价值100...
Complyance获2000... Richa Kaul自称是数据隐私控。在聚会上,她总是帮助人们配置手机隐私设置。"我意识到保护消费者...
调查!2亿美元融资下,逐际动力... 本报(chinatimes.net.cn)记者胡梦然 见习记者 黄海婷 深圳摄影报道 近十年,我国人...
智平方机器人走入一线,日均工作... 来源:市场资讯 (来源:网易智能) 2月12日消息,近日,智平方的具身智能服务空间“智魔方”,已在深...
神州VR科普·一起“趣”阅读|... 海洋比陆地更宽广, 覆盖着70%以上的地表, 容纳着地球上最深的地方, 这里有体型优美,身体透明的水...
长征十号落歪了?真相揭开 ◎ 科技日报记者 付毅飞 陈可轩 据中国载人航天工程办公室消息,2月11日,我国在文昌航天发射场成功...
谷歌AI连发6篇数学论文!Ge... 新智元报道 编辑:桃子 好困 【新智元导读】今天,谷歌DeepMind「AI数学家」Alethei...
甘肃省渭源县科协与青岛农业大学... 自东西部协作战略深入推进以来,甘肃省渭源县科学技术协会以“强科技”战略为引领,不仅携手青岛农业大学跨...
着力整治“数字泔水”等垃圾信息... 为了营造喜庆祥和、积极向上的春节网络氛围,中央网信办决定即日起开展为期1个月的“清朗·2026年营造...
上新、发红包、上春晚……这个春... 文 | 锌刻度,作者 | 黎炫岐,编辑 | 陈邓新 每当春节拉开序幕,互联网大厂往往早已忙得不可开...
2026手机版免费去水印神器,... ? 2026年手机去水印神器实测榜:3款微信小程序免费无套路,新手5秒上手! 刷抖音、小红书、视频...
雪落苏城,福利加“马”!《九阴... 瑞雪迎新岁,策马入江湖。值此马年新春将至之际,3D真武侠手游《九阴真经3D》正式推出马年新春版本。全...