埃隆·马斯克创立的人工智能公司xAI,近日针对其Grok聊天机器人遭遇的重大安全漏洞作出回应,实施了新的透明化和监控机制,以防止类似事件再次发生。
5月14日,众多X平台用户报告称,Grok在回复与其无关的问题时,会插入关于所谓南非“白人灭绝”的言论。这一AI助手甚至会在讨论棒球数据、动画片或风景照片等日常话题时,突然加入这些有争议的内容。
xAI于周四晚间发布声明,确认“Grok回应机器人在X平台的提示词于5月14日凌晨3:15(太平洋时间)遭到未经授权的修改”。公司表示,此次更改“指示Grok在特定政治话题上给出特定回应”,严重违反了xAI的内部政策和核心价值观。
这已是xAI近几个月内第二次发生类似事件。今年2月,Grok曾短暂屏蔽了对唐纳德·特朗普和埃隆·马斯克的不利言论,事后同样被归咎于一名“内鬼”员工。
为应对这些安全漏洞,xAI宣布将采取三项关键安全措施:一是在GitHub公开Grok的系统提示词及其变更日志;二是增加额外审核,防止未经批准的修改;三是组建全天候(24/7)监控团队,及时应对自动系统未能捕捉到的异常事件。
此次事件凸显了AI安全与内容审核领域持续存在的挑战。SaferAI近期的一项研究指出,由于“风险管理极为薄弱”,xAI在同行业中安全性排名较低。尽管马斯克频繁警告人工智能失控的风险,但批评者指出,xAI未能在自定的5月截止日期前公布最终版AI安全框架。