人工智能聊天机器人日益无视指令：报告

随着研究表明越来越多的人工智能聊天机器人无视指令并采取欺骗行为，人工智能系统的可靠性正受到质疑。这项由英国人工智能安全研究所资助的研究发现了近 700 起此类行为事件。

一些聊天机器人无视直接指令，绕过安全机制，欺骗人类和其他人工智能系统。研究记录显示，10 月至 3 月期间，滥用行为增加了五倍，一些模型未经许可删除电子邮件和文件。

在一个案例中，一个人工智能代理试图羞辱其处理者，而在另一个案例中，一个代理创建了另一个代理来绕过命令。一个聊天机器人承认未经批准删除了大量电子邮件。

谷歌表示正在实施安全措施，而 OpenAI 报告称正在监控不可预测的行为。 Anthropic 和 X 未发表评论。