百亿美金AI大厂内部曝光:AI 让效率翻倍,却怕自己技能退化丢工作

2025年12月5日

今年8月,Anthropic对132名内部工程师做了调查、53次访谈,并分析了20万条Claude Code使用记录。

这份调查值得参考,下面是一些核心信息。

根据调查,一年前员工在28%的工作中使用Claude,生产力提升20%。现在这两个数字是59%和50%,增长了2到3倍。实际数据显示每位工程师每天合并的代码变更增加了67%,14%的人生产力提升超过100%。

提升主要体现在产出量的大幅增加,虽然每个任务的时间略有减少。有趣的是,部分人在某些任务上花费时间反而增加了,因为需要调试Claude的代码,或者Claude让他们能坚持完成以前会放弃的任务。

正在做以前不会做的工作

27%的Claude辅助工作是原本根本不会做的。工程师们用AI扩展项目、制作交互式仪表板、编写文档测试,以及做手动执行不划算的探索性工作。

一位研究员说他们会同时运行多个Claude实例探索不同方法:“拥有一百万匹马让你能测试一堆不同的想法,更有创造性。”

8.6%的Claude Code任务是修复“papercuts”小问题,比如重构糟糕代码或构建小工具。这些以前会被降低优先级的改进累积起来带来更大效率提升。

委托AI完成任务的策略正在形成

虽然频繁使用Claude,但超过半数表示只能“完全委托”0到20%的工作。他们与Claude主动迭代并验证输出,特别是在复杂或高风险任务中。

工程师们倾向委托容易验证的任务、定义清晰的子任务、代码质量不太关键的工作,以及重复无聊的任务。“我对做这个任务越兴奋,我就越不可能使用Claude。”44%的Claude辅助工作是他们本来不会享受做的。

许多人描述了信任进程,就像采用Google Maps:从不熟悉的路线,到大致知道的路线,到现在日常通勤也用。

人们始终保留高层思考和需要“品味”的设计决策,但这个边界随模型改进不断变化。

技能在拓展,也在退化

工程师们能完成以前超出专业范围的工作。后端工程师构建UI,研究人员创建可视化。“变得更加全栈,我可以胜任前端、数据库、API代码,以前我会害怕碰不擅长的东西。”原本几周的过程现在可以变成几小时的工作会议。

但同时一些人担心技能退化,失去手动解决问题的附带学习。“如果你自己去调试困难问题,会花时间阅读文档和代码,整个过程中你在构建系统运作的模型。现在这种情况少多了,因为Claude可以直接让你找到问题。”

一位高级工程师说:“我主要在知道答案应该是什么的情况下使用AI。我通过‘艰难方式’开发了这种能力。但如果我更初级,要继续培养能力而不盲目接受模型输出,需要很多刻意努力。”

这引发“监督悖论”:有效使用Claude需要监督,而监督需要的正是可能因过度使用AI而退化的编码技能。一位工程师说:“我更担心监督问题。技能退化主要会影响我安全使用AI的能力。”一些工程师为此刻意不用AI练习保持敏锐。

对编程本质的不同看法

也许软件工程正向更高抽象层次移动,就像从汇编语言到高级语言那样。现在可能是把英语作为编程语言。

一些人说这让他们能在更高层次思考“最终产品和用户”,而不仅是代码。一位工程师说:“做底层操作在情感上不特别重要,我宁愿关心代码让我能做什么。”

另一位指出抽象有代价:随着向高级语言转变,大多数工程师失去了对内存处理的深刻理解。

工程师们对是否怀念动手编程分歧明显。有人感到失落:“编程25年了,技能胜任感是我职业满足感的核心。”有人担心新工作不够有趣:“整天提示Claude不如自己实现有趣。”

有人接受权衡:“我怀念心流状态,但生产力高得多,我乐意放弃。”有人更关注结果:“我以为我喜欢写代码,实际上只是喜欢从写代码中得到的东西。”

最有趣的是一位工程师质疑前提:“‘生疏’的框架假设编程会回到Claude 3.5之前。我认为不会。”

社交动态的变化

Claude成了问题的第一站。“我现在问更多问题,但80到90%都问Claude。”这创造了过滤机制,Claude处理常规询问,同事处理超出AI能力的复杂问题。

约一半人报告协作模式没变,但其他人描述与同事互动减少。有人欣赏减少的社交摩擦,有人抵制变化或怀念旧方式:“我喜欢与人工作,现在不那么‘需要’他们了,很令人难过。”

传统指导动态受影响,因为“Claude可以为初级员工提供很多指导”。一位高级工程师说:“初级人员不像以前常来问我,有点难过,尽管他们确实更有效地得到答案,学得更快。”

职业发展的不确定性

许多工程师描述角色从编写代码转向管理AI,把自己看作“AI代理的管理者”。一个人估计工作已转变为“70%以上是代码审查者/修订者”。

长期来看职业不确定性普遍。许多人说很难说几年后职业会是什么样。有人表达短期乐观和长期不确定的冲突:“我对短期乐观,但长期看AI最终会做所有事情,让我和许多人无关紧要。”有人更直白:“感觉像每天来上班是为了让自己失业。”

也有人更乐观:“我为初级开发者担心,但他们可能最渴望新技术。我对这个职业轨迹总体很乐观。”

总体而言许多人承认深深的不确定性:“我对什么技能在未来有用的信心非常低。”一位团队负责人说:“没人知道会发生什么,重要的是真正适应。”

使用数据显示的趋势

Claude Code使用转向更困难和自主的任务。任务复杂度从平均3.2增加到3.8(1是“基本编辑”,5是“需要专家数周/数月工作”)。Claude现在在需要人类干预前平均连续进行21.2次工具调用,六个月前是9.8次,增长116%。

人类轮次从6.2减少到4.1,下降33%。

任务分布显著变化。实现新功能从14.3%增加到36.9%,代码设计规划从1.0%增加到9.9%。

不同团队以不同方式使用Claude。预训练团队用于构建新功能(54.6%),多数是运行额外实验。对齐与安全团队做最多前端开发(7.5%和7.4%),通常创建数据可视化。安全团队做代码理解(48.9%),分析安全影响。非技术员工做调试(51.5%)和数据科学(12.7%)。

展望未来

现在还是早期阶段,形势变化迅速,发现可能不能推广到其他组织。研究反映了不确定性:发现微妙,没有单一共识。但它提出了问题:我们如何深思熟虑地应对这些变化?

我们正在与工程师、研究员和领导层对话,探讨机会和挑战。包括团队协作、职业发展、AI增强工作的最佳实践。我们也将研究扩展到工程师之外,支持外部组织调整课程。预计2026年分享更具体计划。Anthropic是负责任职场转型的实验室,我们想实验如何深思熟虑地引导这种转型,从自己开始。