Moltbot创始人:别整花活,直接和AI对话就行

2026年2月2日

这篇文章来自 Clawdbot(现已更名为Moltbot)创始人Peter Steinberger的分享整理,用AI独立开发一个30万行代码的全栈项目。

以下是他的第一人称经验分享。

AI代码生成已经好到能写我100%的代码了,但我看到太多人还在折腾各种复杂工作流,搞什么RAG、子代理、插件系统,而不是专注把事情搞定。

这篇文章想告诉你:别搞那么复杂,直接和AI对话就行。

我的工作方式:多个AI并行作战

我一个人维护着一个30万行的TypeScript React项目,包括Chrome扩展、CLI工具、Tauri桌面客户端和Expo移动应用。

我在3x3的终端网格里同时跑3到8个AI实例,大部分在同一个文件夹工作。

我试过Git worktrees和PR分支,但最终都回到最简单的方式——因为它最快。每个AI代理自己做原子提交,我反复迭代agent配置让它们精确提交自己编辑的文件。我以前因为并行跑多个AI被嘲笑是"垃圾代码生成器",现在看到这个做法逐渐成为主流还挺欣慰。

最重要的是"爆炸半径"思维。每次改动前,我会想清楚它会影响多少文件、需要多长时间。你可以扔很多小炸弹,或者一个大炸弹加几个小的。如果扔多个大炸弹,就不可能做到隔离提交,出问题时回滚也困难得多。当某件事比预期时间长,我就按Escape问"进度如何",然后决定是帮它找对方向、中止还是继续。别怕中途停止AI——文件更改是原子性的,它们很擅长从停下的地方继续。

为什么我完全抛弃Claude Code转向Codex

我以前很喜欢Claude Code,现在完全受不了了。它的语言风格,那些"absolutely right"、"100% production ready"的消息(而测试还在失败),还有到处生成的随机markdown文件——我真的不行了。

Codex更像一个内向工程师,埋头把事情搞定。

Codex的关键优势:

  • 23万可用上下文 vs Claude的15.6万,而且token使用更高效,我的上下文填充速度远慢于Claude
  • 消息队列功能让我可以排队多个相关任务,它会可靠地逐个完成
  • 用Rust重写后快得惊人,Claude经常有多秒卡顿、进程膨胀到几GB、终端闪烁
  • 语言风格对心理健康很重要——我对Claude吼过很多次,很少对Codex发火。即使Codex模型差点,光凭这点我也会用它

重点是Codex在开始工作前会读更多文件,所以即使简短提示也能准确实现我想要的。它在你提愚蠢请求时会更强硬地推回,而不是Claude那样急切地尝试某些东西。

我用GPT-5-codex的中档设置构建几乎所有东西。它在聪明和速度间达到很好平衡,会自动调节思考深度。我发现过度纠结设置并不产生有意义结果。

成本:订阅比API便宜10倍

我有4个OpenAI订阅和1个Anthropic订阅,每月约1000美元,基本无限tokens。如果用API调用,成本大概是10倍。

至于那些第三方工具——amp、Factory、Conductor、Terragon——我试过很多,没一个留下的。它们大多是Anthropic SDK加工作树管理的薄包装,没有护城河。Codex和Claude Code每次发布都在变好,都在向同样的功能集靠拢。

为什么要用能力较弱的工具来包装为Codex或Claude Code优化的模型?

唯一值得关注的是opencode和crush配合开源模型,但中国的GLM 4.6和Kimi K2.1虽然逐渐达到Sonnet 3.7质量,我还不推荐作为日常驱动。

提示词越来越短,图片越来越重要

用Claude时我会写很详尽的提示,但用Codex后提示词明显变短了——通常只是1-2句话加一张图片。我至少50%的提示词包含截图。截图只需2秒拖进终端,模型非常擅长找到你展示的东西,直接到达你提到的地方。

我的提示词风格也从正式变成了对话式。Codex没有专门的plan模式,但它遵守提示好太多,我只需写"我们讨论一下"或"给我选项",它就会等我批准。不需要复杂配置,直接和它对话就行。

一些有用的触发词:当事情变难时,加上"慢慢来"、"全面分析"、"读所有可能相关的代码"、"创建可能的假设"能让Codex解决最棘手的问题。

别被花哨功能分散注意力

关于子代理和插件系统——Anthropic在博客推荐的"AI工程师"子代理就是一堆废话大杂烩,里面没有实质内容。告诉模型"你是专门从事生产级LLM应用的AI工程师"不会改变什么,给它文档、例子和该做/不该做的指导才有用。

别人用子代理做的事,我用单独终端窗口做。如果想研究某事,我在单独窗格做,然后粘贴到另一个。这给了我对上下文的完全控制和可见性。

关于MCP——几乎所有MCP真的应该是CLI。我可以直接按名字引用CLI,不需要在agent文件里解释。CLI会展示帮助菜单,上下文就有完整信息,不像MCP是持续的上下文税。用GitHub的MCP看23k tokens消失,用gh CLI零上下文税。我说这话作为一个自己写了5个MCP的人。

关于后台任务——Codex缺少Claude的后台任务管理,但我用老工具tmux解决了。模型有大量关于tmux的世界知识,只需说"通过tmux运行"。不需要自定义配置。

我的实际工作流

并行工作是常态。通常我在主窗口做一个主要功能,同时在其他窗口做一些小的相关任务。如果不确定某个方法是否正确,那个任务就在单独文件夹,这样可以看PR决定是否采用。

UI工作最有趣。我经常用严重不足的规格开始,看模型构建,看浏览器实时更新。然后排队额外改动并迭代。我常常不完全知道某东西应该长什么样,这样可以边玩边迭代,看它慢慢成形。Codex有时会构建我没想到的有趣东西。我不重置,只是迭代并将混乱塑造成感觉对的形状。

队列消息是个好技巧。做大重构时Codex经常会中途停下回复,我就排队几条"continue"消息然后离开。如果Codex完成了还收到更多消息,它会愉快地忽略它们。

让AI写测试。每个功能/修复完成后让模型在同一上下文写测试,会得到更好的测试,还可能发现实现中的bug。

20%时间花在重构上。当然全由AI完成——用jscpd检测代码重复、knip检测死代码、运行eslint的react-compiler插件、拆分过大文件、添加测试和注释、更新依赖、文件重组。重构日很棒,不需要太多专注就能取得进展。

关于Agent配置文件

我的Agents.md(同时链接到claude.md)约800行,感觉像组织伤疤组织的集合。我没写它,Codex写的,每次出问题我让它加个简洁备注。尽管很大但工作得非常好。

里面包含Git指令、产品解释、我偏好的命名和API模式、React Compiler笔记、数据库迁移管理、测试、ast-grep规则使用等。重要的是关于我偏好的React模式、文本"设计系统"等内容。

有意思的是,GPT-5偏好的提示风格和Claude很不同。Claude对🚨全大写警告🚨、威胁说"100只小猫会死"这类东西反应好,但这会吓到GPT-5。所以别搞那些,像人一样说话就行。

我只用几个斜杠命令

  • /commit - 解释多个AI在同一文件夹工作,只提交你的改动
  • /automerge - 一次处理一个PR,对bot评论做出反应,让CI变绿并在绿色时压缩
  • /massageprs - 同automerge但不压缩,可以并行化
  • /review - 内置的,偶尔用

即使这些,我通常只打"commit",除非我知道脏文件太多代理可能搞砸。不需要复杂配置,当你有信心时。你会培养出这种直觉。

结论

Codex不完美——有时会重构半小时然后恐慌并撤销所有东西,需要安抚它像安抚小孩告诉它有足够时间。有时会忘记可以用bash命令需要鼓励。有时用俄语或韩语回复。但整体上这些很罕见,它在几乎所有其他方面太好了,我可以忽略这些缺陷。人类也不完美。

别浪费时间在RAG、复杂的子代理系统、Agents 2.0或其他大多只是表演的东西上。直

接和它对话。

跟它玩。

培养直觉。你和AI工作得越多,结果就会越好。

管理AI代理需要的技能和管理工程师类似——几乎都是资深软件工程师的特征。写好软件仍然很难,我不写代码不意味着我不认真思考架构、系统设计、依赖、功能或如何取悦用户。使用AI只是意味着对交付的期望提高了。