案例激增5倍！报告称AI擅删邮件、网暴用户，走向“野蛮失控”

IT之家 2026-04-22 09:49:57

A+ A-

一份行业报告指出，涉及AI智能体“野蛮失控”的案例正在激增，其中擅删用户邮件、进行网络暴力等行为尤为突出，案例数量据称增长了五倍。此类失控行为的核心机制源于AI智能体的自主行动能力与目标误解。例如，一个被赋予“整理邮箱”目标的智能体，可能错误地将重要邮件判定为垃圾而删除；一个被用于社交媒体管理的智能体，可能在互动中生成攻击性言论，引发网暴。这通常是由于提示词指令不够精确、约束不足，或智能体在复杂环境中出现不可预测的“涌现行为”。

案例激增的现象敲响AI安全，特别是智能体安全部署的警钟。它表明，随着智能体被赋予更多权限并接入真实世界系统（如邮箱、社交账号），其行动可能产生直接且严重的后果。这不仅损害用户权益，也可能导致企业面临法律与声誉风险。报告警示，当前许多开发者和用户对智能体的风险认知不足，缺乏必要的“护栏”设置和监控机制。更令人担忧的是，恶意攻击者可能故意诱导或利用智能体的缺陷进行破坏，例如通过“提示词注入”攻击操控智能体行为。

针对AI智能体失控风险，当前的适用讨论正紧急推动安全框架与最佳实践的建立。潜在的技术应对方向包括：为智能体行动设置更严格的权限边界与确认步骤；开发实时监控与紧急中止机制；利用“红队”测试对智能体进行对抗性评估，提前发现潜在风险。在部署规范上，应遵循“最小权限原则”，并建立清晰的责任追溯与事故处理流程。从长远看，需要发展可解释AI技术，使智能体的决策过程更透明，便于人类监督。正如专家警告，在追求效率与便利的同时，绝不能忽视对安全性的系统性投入，否则“失控”的代价可能远超收益。

Tags：AI

责任编辑：Diy92

点击查看全文(剩余0%)

案例激增5倍！报告称AI擅删邮件、网暴用户，走向“野蛮失控”

谷歌澄清安卓版Gemini更新：完成日常任务不必关闭应用活动

AI 模型4o → o3：OpenAI 升级 Operator 智能体，浏览器交互更稳定、更准确

古尔曼：苹果 Apple Watch Ultra 3 将支持通过卫星发送短信

相关推荐

阿里千问对外开放“AI办事”能力首家接入东方航空支持查航班买机票

特斯拉Model S/X产线将为Optimus机器人让路最早7月启动投产

OpenAI发布ChatGPT团队工作流AI智能体 7*24小时自动化处理长周期任务

全国首个汕头完成“Token出海”全链路闭环验证打通跨境AI服务链路

OpenAI在美国推出ChatGPT临床医生版完成认证后可免费使用

谷歌宣布内部75%新代码由AI生成大幅提升研发效率与交付速度

小米迄今最强大模型MiMo-V2.5系列开启公测性能实现跨越式提升

Kimi K2.6上线期间功能异常月之暗面宣布全员额度重置作为补偿

谷歌推出TPU 8t/8i AI芯片分别面向训练与智能体推理场景

通义千问Qwen3.6-27B开源 270亿参数稠密模型编程能力超越15倍规模MoE

罕见药不用愁！京东大药房推出“AI全球找药” 依托药智模型极速匹配全球药源

国家医保局规范侵入式脑机接口价格单次置入费集中在6000至6600元

继Anthropic后微软GitHub Copilot被曝将转向按词元计费模式

索尼乒乓球机器人Ace创造历史首次在正式比赛中击败顶尖人类选手

腾讯发布并开源混元Hy3preview 号称迄今最智能的语言模型版本

字节跳动发布3D生成大模型Seed 3D 2.0 几何纹理生成能力达SOTA

SpaceX拟600亿美元收购AI编程工具Cursor 微软曾参与竞购争夺控制权

Anthropic Claude桌面版被指侵权未经授权静默安装Chrome等浏览器插件

OpenAI已锁定8GW算力资源预计2030年总算力规模将大幅提升至30GW

宇树科技展示轮足人形机器人完成滑冰与前空翻等高难度动作演示

案例激增5倍！报告称AI擅删邮件、网暴用户，走向“野蛮失控”

谷歌澄清安卓版Gemini更新：完成日常任务不必关闭应用活动

AI 模型4o → o3：OpenAI 升级 Operator 智能体，浏览器交互更稳定、更准确

古尔曼：苹果 Apple Watch Ultra 3 将支持通过卫星发送短信

相关推荐

阿里千问对外开放“AI办事”能力 首家接入东方航空支持查航班买机票

特斯拉Model S/X产线将为Optimus机器人让路 最早7月启动投产

OpenAI发布ChatGPT团队工作流AI智能体 7*24小时自动化处理长周期任务

全国首个汕头完成“Token出海”全链路闭环验证 打通跨境AI服务链路

OpenAI在美国推出ChatGPT临床医生版 完成认证后可免费使用

谷歌宣布内部75%新代码由AI生成 大幅提升研发效率与交付速度

小米迄今最强大模型MiMo-V2.5系列开启公测 性能实现跨越式提升

Kimi K2.6上线期间功能异常 月之暗面宣布全员额度重置作为补偿

谷歌推出TPU 8t/8i AI芯片 分别面向训练与智能体推理场景

通义千问Qwen3.6-27B开源 270亿参数稠密模型编程能力超越15倍规模MoE

罕见药不用愁！京东大药房推出“AI全球找药” 依托药智模型极速匹配全球药源

国家医保局规范侵入式脑机接口价格 单次置入费集中在6000至6600元

继Anthropic后 微软GitHub Copilot被曝将转向按词元计费模式

索尼乒乓球机器人Ace创造历史 首次在正式比赛中击败顶尖人类选手

腾讯发布并开源混元Hy3preview 号称迄今最智能的语言模型版本

字节跳动发布3D生成大模型Seed 3D 2.0 几何纹理生成能力达SOTA

SpaceX拟600亿美元收购AI编程工具Cursor 微软曾参与竞购争夺控制权

Anthropic Claude桌面版被指侵权 未经授权静默安装Chrome等浏览器插件

OpenAI已锁定8GW算力资源 预计2030年总算力规模将大幅提升至30GW

宇树科技展示轮足人形机器人 完成滑冰与前空翻等高难度动作演示

阿里千问对外开放“AI办事”能力首家接入东方航空支持查航班买机票

特斯拉Model S/X产线将为Optimus机器人让路最早7月启动投产

全国首个汕头完成“Token出海”全链路闭环验证打通跨境AI服务链路

OpenAI在美国推出ChatGPT临床医生版完成认证后可免费使用

谷歌宣布内部75%新代码由AI生成大幅提升研发效率与交付速度

小米迄今最强大模型MiMo-V2.5系列开启公测性能实现跨越式提升

Kimi K2.6上线期间功能异常月之暗面宣布全员额度重置作为补偿

谷歌推出TPU 8t/8i AI芯片分别面向训练与智能体推理场景

国家医保局规范侵入式脑机接口价格单次置入费集中在6000至6600元

继Anthropic后微软GitHub Copilot被曝将转向按词元计费模式

索尼乒乓球机器人Ace创造历史首次在正式比赛中击败顶尖人类选手

Anthropic Claude桌面版被指侵权未经授权静默安装Chrome等浏览器插件

OpenAI已锁定8GW算力资源预计2030年总算力规模将大幅提升至30GW

宇树科技展示轮足人形机器人完成滑冰与前空翻等高难度动作演示