让AI辅助编程的代价是什么?anthropic刚发了一篇论文 (How AI Impacts Skill Formation arxiv.org/abs/2601.20245 ),强调“AI 增产不是能力增长的捷径”。如果用 AI 直接把陌生任务做完,可能短期看起来更顺,但会削弱监督/验证 AI 输出所需的关键技能,尤其是调试与概念理解;在安全关键领域这会带来风险。因此更合理的做法是把 AI 用在促理解、促建模的环节(解释、概念澄清、对照推理),而不是全权代写或代调试。
论文的结论有两点:第一,AI 并没有在整体上显著缩短完成任务的时间:主实验里两组的平均完成时间差异不显著。第二,AI 组的学习效果显著更差:AI 组在测验上的得分比非 AI 组低约 17%,统计上显著。这一劣化体现在概念理解、代码阅读与调试能力上,其中调试题差距最大。
不过这篇论文虽然是刚发的,但里面的编程工具用的还是GPT-4o,用比较新的模型不知道会怎样。而且不知道为啥anthropic做实验用GPT-4o……
HOW I AI
