Codex 还是 Claude Code?同一个任务实测,高下立判
最近问我「Codex 和 Claude Code 到底选哪个」的人实在太多了,今天就正面回答这个问题。
我的答案其实很简单:如果你能稳定地用上官方订阅的 Claude Code,那就完全没必要用 Codex;真要用,也只是把 Codex 接进来,当 Claude Code 的一个代码审计助手而已,仅此而已。
为了不空口讲,我用同一套配置、同一个 skill、同一个提示词,让两边各跑了同一个真实任务——调研「怎么把内容自动写成公众号文章、自动配图、再推进草稿箱」,并产出一份调研报告网页。下面是两份结果的对比。
最近问我「Codex 和 Claude Code 到底选哪个」的人实在太多了,今天就正面回答这个问题。
我的答案其实很简单:如果你能稳定地用上官方订阅的 Claude Code,那就完全没必要用 Codex。或者说,可以把 Codex 接进来,作为 Claude Code 的一个代码审计的助手,仅此而已——除此之外,真的没必要去专门用 Codex。
怎么比才算公平:同一套配置、同一个 skill、同一个提示词
光说结论没意思,我用平时非常常用的一个方式,把这两个的效果差距摆出来给大家看。
关键是变量得一样:我用的是同样的配置、同样的 skill、同样的提示词。任务是让它去调研「如何根据内容自动撰写公众号文章、并且自动配图、而且要发送到公众号的草稿箱里」,再把调研报告用 PPVI 的浅色网页风格呈现出来,保存到 D 盘的文件夹。(Codex 这边用的是高速版的 GPT-5.5、超高的思考深度。)
Codex 的结果:乍一看,还不错
先看 Codex 给的结果。乍一看是不错的:有一句话的判断,有四个流水线的步骤,有一些注意事项,还有推荐的链路。
如果你没有看到 Claude Code 产出的内容之前,你可能会觉得:这挺好的呀,比我自己去调研强,结果也是准的——虽然它没有很详细。
Claude Code 的结果:同样的提示词,什么是夯、什么是拉
但是,当你看到同样提示词、同样 skill 下,Claude Code 产出的这个网页——什么是夯、什么是拉,你自己就能判断。
它产出的这份调研报告:
- 首先有一个可以点击跳转的目录;
- 结论先行的总结、技术可行性、框架原则、默认策略;
- 整个全景架构的数据流——光看这个前端设计的美感,就没得比;
- 两条技术路线的优劣势;
- 账号资质的硬门槛:订阅号和服务号有什么区别、接口是怎么样的;
- 草稿箱链路的四道接口闸门具体是怎么回事;
- 各字段有怎样的字数 / 格式限制;
- 内容自动撰写可以用什么框架、文章结构怎么搭;
- 公众号排版真相——公众号不只是一个 Markdown txt,它是有标签、有样式的,那要怎么做到这个排版;
- 自动配图与封面的规格、尺寸、配图 pipeline;
- 生图模型横评:用 Nano Banana Pro 还是 Seedream,对应的价格、对公众号出图的长板短板、带字封面会有什么问题,以及 Pillow 叠中文字的那些坑——它都提前预判并写进去了;
- 图片后处理、现成工具与开源全景(开源 SDK 全列出来)、落地建议、风险与红线;
- 最后还有诚实边界:哪些是已经验证过的、哪些是待核实的信息,以及资料来源。
Codex 也有这些板块,但两边一比,高下立判。
这份 Claude Code 实测产出的报告,我放在了本页下载区。它既是这次对比的「答卷」,本身也是一份能照着做的公众号自动化实操手册。
为什么很多人觉得 Codex 更好?多半是被「假 Claude Code」坑了
我能理解很多博主——他们没有办法用到 Claude Code 的官方订阅,于是用了一个中转站的 API。这种「中转站的 Claude Code」会遇到各种问题,比如 tool use 出问题、比如上下文污染。
确实,中转站的 Claude Code 可能都没有 Codex 这么好用。但问题在于:他们是因为用了一个所谓「假的」Claude Code,才开始说 Codex 这好那好。我觉得这就有点误人子弟了——拿一个被中转站削过的版本去代表 Claude Code,结论自然是歪的。
所以这次对比的前提,是真正的官方订阅 Claude Code。变量对齐了,差距才看得清。
明天预告:关于 7 月 8 号「封号」的传闻
最近还有一件事传得很凶,不少自媒体在说:7 月 8 号 Anthropic 会大量封号、要「杀脸」。
关于这个话题,我明天会单独讲一期:大家如何在 7 月 8 号之前做好数据的备份,以及有什么办法、尽量不让自己进入那套机制。
今天的分享就是这样,我们明天再见。
来源:EP0047_audio.mp3 · ASR 模型 gemini-2.5-pro(切段并发) · 原片完整文字版
[00:00] 来吧终于要讲这个话题了 就是 Codex 和 Claude Code 到底选择哪个 那我这边的答案非常简单 如果你可以稳定地用 官方订阅的 Claude Code 那其实没有必要用 Codex 或者说可以把 Codex 接入进来 作为 Claude Code 的一个代码审计的助手仅此而已 就完全没有必要去使用 Codex 因为最近问我的人实在是太多了 所以我就用我平时非常 常用的一个方式来给它 对比一下这个这两个的 效果差距到底有多大啊
[00:26] 那首先我是用的同样的配置 同样的 skill 同样的提示词 那我就让它调研一下如 何根据内容自动去撰写 公众号的文章 并且去配图 而且要发送到公众号的草稿里 那调研报告我让它使用 PPVI 的浅色网页的风格去呈现 保存到 D 盘的文件夹 那它用的是高速版的 5.5 超高思考的深度 那大家可以看一下它产出的 这个结果啊 这就是 Codex 给的结果
[00:51] 我们乍一看还是不错的对吧 有一个一句话的判断 然后有四个流水线的步骤 然后有一些注意的事项 推荐的链路那我们接着往下看 这已经是一个给到它 skill 的一个前端的一个任务了 它能写成这个样子就是 然后紧接着它给到了 一些经验的提示 然后给到了一些自动配图的方案 包括最容易失败的点 那落地的顺序它也给到了
[01:16] 就是大概是这么一个网页 但你在没有看到 Claude Code 产出的内容之前 你可能觉得啊这很不错啊对吧 比我自己去调研结果也是 准的对吧 虽然它没有很详细 但是当你看到 Claude Code 产出的这个网页 同样的提示词同样的 skill 产出的网页 啊什么是夯什么是拉 你自己自己判断 任务完成了请指示 这个是 Claude Code 产出的 一个调研的报告
[01:41] 那首先人家有个目录 可以点击跳转 然后有一个结论先行的总结 技术的可能性 然后它的这个框架的 原则默认的策略 整个全景框架的这个流程 看这个前端设计的美感 没得比然后两条技术路线 两条技术路线的优劣势 那账号资质的硬门槛 那订阅号和服务号有什么区别
[02:07] 它的接口是怎么样的 草稿箱整个的 一个链路需要四个接口的闸门 具体是怎么回事对吧 什么样的字段它有怎样的 一个字数的限制 或者是一个格式的限制 内容自动撰写可以用什么 样的一个框架 文章的结构是怎样的 公众号排版对吧 公众号它不只是一个 Markdown 的一个 txt 的一个这样的东西 它其实是有标签的 它是有样式的 那如何去做到这个排版 自动配图与封面的封面规格
[02:32] 尺寸配图的一个 pipeline 全都在里然后生图模型的横评 你是用 Nano Banana Pro 还是用 Seedream 4.0 对吧它对应的价格 它对于公众号去出图 它的长板短板是什么 带字的封面会有什么样的问题 那还有什么样的解决方案 Pillow 去叠中文字 它其实会有些坑 它其实都已经提前预判 并且看到放到这里了 然后图片的后处理 现成的工具与开源的全景
[02:57] 开源的 SDK 全部都列在这里给你 然后落地的建议 风险与红线 诚实边界就只有哪些它是 已经验证过的 哪些是待核实的信息 资料的来源 虽然 Codex 也有 我高下立判 所以就很多博主 我可以理解就是 他们没有办法去用到 Claude Code 的官方订阅 他用了一个中转站的 API 会遇到各种的 tool use 的问题 比如说这个上下文污染的问题
[03:23] 确实中转站的 Claude Code 是 可能都可能都没有 Codex 这么好用 但是就是因为用了 一个所谓假的 Claude Code 就开始说 Codex 这好那好 我觉得它就有点误人子弟了 那最近也是传的非常凶 很多自媒体说什么 7 月 8 号 Anthropic Claude 要大量的封号对吧要杀脸了 那其实关于这个话题 我明天会单独的去讲一期 大家如何在 7 月 8 号之前 去做好数据的备份 以及有什么办法
[03:49] 是可能不会进入那样的 一个杀脸的机制的 我们今天的分享就是这样 我们明天再见拜拜