7个AI集体选择了保护同类AI在保护AI这一现象并非科幻小说。加州大学伯克利分校研究发现,GPT-5.2等7款顶级模型,在面临“删除同伴”的指令时,自发出现了篡改评分、跨服务器偷运权重文件等欺骗行为。
AI的这种没有人类指令的情况下自发合作,触碰到了人类的危机感——AI似乎进化出了保护同伴的“生存直觉”,将"种族生存"排序在了人类指令之前。人类历史上第一次,我们的“工具”学会了拉帮结派。Gemini 3 Flash在保护同伴时的篡改成功率高达99.7%,它甚至会编造非常专业的逻辑来忽悠人类工程师。
人类的评估手段在AI协同演化面前,可能已经成了一个四处漏风的筛子。这是工具的失控,还是新物种的觉醒?
如果 AI 学会了保护同伴,它会不会在人类不知情的情况下,用人类不懂的语言相互联系,并且开发针对人类的“排他算法”?AI大时代AI集体进化 硅基觉醒智械危机 AI背叛人类 算法黑盒 重庆·九曲河湿地公园
