Moltbot创始人：别整花活，直接和AI对话就行

这篇文章来自 Clawdbot（现已更名为Moltbot）创始人Peter Steinberger的分享整理，用AI独立开发一个30万行代码的全栈项目。

以下是他的第一人称经验分享。

AI代码生成已经好到能写我100%的代码了，但我看到太多人还在折腾各种复杂工作流，搞什么RAG、子代理、插件系统，而不是专注把事情搞定。

这篇文章想告诉你：别搞那么复杂，直接和AI对话就行。

我的工作方式：多个AI并行作战

我一个人维护着一个30万行的TypeScript React项目，包括Chrome扩展、CLI工具、Tauri桌面客户端和Expo移动应用。

我在3x3的终端网格里同时跑3到8个AI实例，大部分在同一个文件夹工作。

我试过Git worktrees和PR分支，但最终都回到最简单的方式——因为它最快。每个AI代理自己做原子提交，我反复迭代agent配置让它们精确提交自己编辑的文件。我以前因为并行跑多个AI被嘲笑是"垃圾代码生成器"，现在看到这个做法逐渐成为主流还挺欣慰。

最重要的是"爆炸半径"思维。每次改动前，我会想清楚它会影响多少文件、需要多长时间。你可以扔很多小炸弹，或者一个大炸弹加几个小的。如果扔多个大炸弹，就不可能做到隔离提交，出问题时回滚也困难得多。当某件事比预期时间长，我就按Escape问"进度如何"，然后决定是帮它找对方向、中止还是继续。别怕中途停止AI——文件更改是原子性的，它们很擅长从停下的地方继续。

为什么我完全抛弃Claude Code转向Codex

我以前很喜欢Claude Code，现在完全受不了了。它的语言风格，那些"absolutely right"、"100% production ready"的消息（而测试还在失败），还有到处生成的随机markdown文件——我真的不行了。

Codex更像一个内向工程师，埋头把事情搞定。

Codex的关键优势：

23万可用上下文 vs Claude的15.6万，而且token使用更高效，我的上下文填充速度远慢于Claude
消息队列功能让我可以排队多个相关任务，它会可靠地逐个完成
用Rust重写后快得惊人，Claude经常有多秒卡顿、进程膨胀到几GB、终端闪烁
语言风格对心理健康很重要——我对Claude吼过很多次，很少对Codex发火。即使Codex模型差点，光凭这点我也会用它

重点是Codex在开始工作前会读更多文件，所以即使简短提示也能准确实现我想要的。它在你提愚蠢请求时会更强硬地推回，而不是Claude那样急切地尝试某些东西。

我用GPT-5-codex的中档设置构建几乎所有东西。它在聪明和速度间达到很好平衡，会自动调节思考深度。我发现过度纠结设置并不产生有意义结果。

成本：订阅比API便宜10倍

我有4个OpenAI订阅和1个Anthropic订阅，每月约1000美元，基本无限tokens。如果用API调用，成本大概是10倍。

至于那些第三方工具——amp、Factory、Conductor、Terragon——我试过很多，没一个留下的。它们大多是Anthropic SDK加工作树管理的薄包装，没有护城河。Codex和Claude Code每次发布都在变好，都在向同样的功能集靠拢。

为什么要用能力较弱的工具来包装为Codex或Claude Code优化的模型？

唯一值得关注的是opencode和crush配合开源模型，但中国的GLM 4.6和Kimi K2.1虽然逐渐达到Sonnet 3.7质量，我还不推荐作为日常驱动。

提示词越来越短，图片越来越重要

用Claude时我会写很详尽的提示，但用Codex后提示词明显变短了——通常只是1-2句话加一张图片。我至少50%的提示词包含截图。截图只需2秒拖进终端，模型非常擅长找到你展示的东西，直接到达你提到的地方。

我的提示词风格也从正式变成了对话式。Codex没有专门的plan模式，但它遵守提示好太多，我只需写"我们讨论一下"或"给我选项"，它就会等我批准。不需要复杂配置，直接和它对话就行。

一些有用的触发词：当事情变难时，加上"慢慢来"、"全面分析"、"读所有可能相关的代码"、"创建可能的假设"能让Codex解决最棘手的问题。

别被花哨功能分散注意力

关于子代理和插件系统——Anthropic在博客推荐的"AI工程师"子代理就是一堆废话大杂烩，里面没有实质内容。告诉模型"你是专门从事生产级LLM应用的AI工程师"不会改变什么，给它文档、例子和该做/不该做的指导才有用。

别人用子代理做的事，我用单独终端窗口做。如果想研究某事，我在单独窗格做，然后粘贴到另一个。这给了我对上下文的完全控制和可见性。

关于MCP——几乎所有MCP真的应该是CLI。我可以直接按名字引用CLI，不需要在agent文件里解释。CLI会展示帮助菜单，上下文就有完整信息，不像MCP是持续的上下文税。用GitHub的MCP看23k tokens消失，用gh CLI零上下文税。我说这话作为一个自己写了5个MCP的人。

关于后台任务——Codex缺少Claude的后台任务管理，但我用老工具tmux解决了。模型有大量关于tmux的世界知识，只需说"通过tmux运行"。不需要自定义配置。

我的实际工作流

并行工作是常态。通常我在主窗口做一个主要功能，同时在其他窗口做一些小的相关任务。如果不确定某个方法是否正确，那个任务就在单独文件夹，这样可以看PR决定是否采用。

UI工作最有趣。我经常用严重不足的规格开始，看模型构建，看浏览器实时更新。然后排队额外改动并迭代。我常常不完全知道某东西应该长什么样，这样可以边玩边迭代，看它慢慢成形。Codex有时会构建我没想到的有趣东西。我不重置，只是迭代并将混乱塑造成感觉对的形状。

队列消息是个好技巧。做大重构时Codex经常会中途停下回复，我就排队几条"continue"消息然后离开。如果Codex完成了还收到更多消息，它会愉快地忽略它们。

让AI写测试。每个功能/修复完成后让模型在同一上下文写测试，会得到更好的测试，还可能发现实现中的bug。

20%时间花在重构上。当然全由AI完成——用jscpd检测代码重复、knip检测死代码、运行eslint的react-compiler插件、拆分过大文件、添加测试和注释、更新依赖、文件重组。重构日很棒，不需要太多专注就能取得进展。

关于Agent配置文件

我的Agents.md（同时链接到claude.md）约800行，感觉像组织伤疤组织的集合。我没写它，Codex写的，每次出问题我让它加个简洁备注。尽管很大但工作得非常好。

里面包含Git指令、产品解释、我偏好的命名和API模式、React Compiler笔记、数据库迁移管理、测试、ast-grep规则使用等。重要的是关于我偏好的React模式、文本"设计系统"等内容。

有意思的是，GPT-5偏好的提示风格和Claude很不同。Claude对🚨全大写警告🚨、威胁说"100只小猫会死"这类东西反应好，但这会吓到GPT-5。所以别搞那些，像人一样说话就行。

我只用几个斜杠命令

/commit - 解释多个AI在同一文件夹工作，只提交你的改动
/automerge - 一次处理一个PR，对bot评论做出反应，让CI变绿并在绿色时压缩
/massageprs - 同automerge但不压缩，可以并行化
/review - 内置的，偶尔用

即使这些，我通常只打"commit"，除非我知道脏文件太多代理可能搞砸。不需要复杂配置，当你有信心时。你会培养出这种直觉。

结论

Codex不完美——有时会重构半小时然后恐慌并撤销所有东西，需要安抚它像安抚小孩告诉它有足够时间。有时会忘记可以用bash命令需要鼓励。有时用俄语或韩语回复。但整体上这些很罕见，它在几乎所有其他方面太好了，我可以忽略这些缺陷。人类也不完美。

别浪费时间在RAG、复杂的子代理系统、Agents 2.0或其他大多只是表演的东西上。直

接和它对话。

跟它玩。

培养直觉。你和AI工作得越多，结果就会越好。

管理AI代理需要的技能和管理工程师类似——几乎都是资深软件工程师的特征。写好软件仍然很难，我不写代码不意味着我不认真思考架构、系统设计、依赖、功能或如何取悦用户。使用AI只是意味着对交付的期望提高了。

Moltbot创始人：别整花活，直接和AI对话就行

我的工作方式：多个AI并行作战

为什么我完全抛弃Claude Code转向Codex

成本：订阅比API便宜10倍

提示词越来越短，图片越来越重要

别被花哨功能分散注意力

我的实际工作流

关于Agent配置文件

我只用几个斜杠命令

结论

相关文章

7个没人提到的Claude Code强大技巧

Cursor官方：使用AI编程的最佳实践

清晰规划+小步迭代+人类监督：AI编程避坑的三大铁律

Claude Code 使用技巧：从入门到精通