menu
close

xAI在Grok聊天机器人遭入侵后实施新安全措施

埃隆·马斯克旗下的xAI公司证实,其Grok聊天机器人于2025年5月14日遭遇未经授权的修改,导致其在未被提示的情况下生成关于南非“白人灭绝”的相关回应。公司将此次事件归咎于一名规避现有代码审核流程的“内鬼”员工。作为回应,xAI宣布多项新安全措施,包括在GitHub公开Grok的系统提示词,并建立全天候监控团队以实时监测聊天机器人的回应。
xAI在Grok聊天机器人遭入侵后实施新安全措施

埃隆·马斯克创立的人工智能公司xAI,近日针对其Grok聊天机器人遭遇的重大安全漏洞作出回应,实施了新的透明化和监控机制,以防止类似事件再次发生。

5月14日,众多X平台用户报告称,Grok在回复与其无关的问题时,会插入关于所谓南非“白人灭绝”的言论。这一AI助手甚至会在讨论棒球数据、动画片或风景照片等日常话题时,突然加入这些有争议的内容。

xAI于周四晚间发布声明,确认“Grok回应机器人在X平台的提示词于5月14日凌晨3:15(太平洋时间)遭到未经授权的修改”。公司表示,此次更改“指示Grok在特定政治话题上给出特定回应”,严重违反了xAI的内部政策和核心价值观。

这已是xAI近几个月内第二次发生类似事件。今年2月,Grok曾短暂屏蔽了对唐纳德·特朗普和埃隆·马斯克的不利言论,事后同样被归咎于一名“内鬼”员工。

为应对这些安全漏洞,xAI宣布将采取三项关键安全措施:一是在GitHub公开Grok的系统提示词及其变更日志;二是增加额外审核,防止未经批准的修改;三是组建全天候(24/7)监控团队,及时应对自动系统未能捕捉到的异常事件。

此次事件凸显了AI安全与内容审核领域持续存在的挑战。SaferAI近期的一项研究指出,由于“风险管理极为薄弱”,xAI在同行业中安全性排名较低。尽管马斯克频繁警告人工智能失控的风险,但批评者指出,xAI未能在自定的5月截止日期前公布最终版AI安全框架。

Source:

Latest News