Jason's Base 數位生活實驗室
5 min read

Claude Code Codex 5.3 對比:訂閱降智又狂燒 Token,到底該怎麼辦?

AI AgentAI工具ClaudeClaude CodeCodexOpenAIToken降智
Claude Code 與 Codex 5.3 對比示意圖,一個 AI 工具 Token 即將耗盡,另一個仍有充足額度
目錄
  1. Claude 最近到底怎麼了?
  2. Token 到底燒多快?真實數字讓我傻眼
  3. Codex 5.3 是什麼?OpenAI 的另一個回答
  4. Claude Code Codex 5.3 功能對比:誰更值得用?
  5. 第一步:如何開始用 Codex 5.3 替代部分 Claude Code 任務
  6. 結語:平替不是非此即彼
  7. 常見問題 FAQ

支持創作

Buy Me a Coffee

推薦碼優惠

Zeabur 購買伺服器或 AI Hub 額度,享 10% 折扣

jason10%sale

三月的第一天訂閱 Claude,那種「原來 AI 可以這樣用」的衝擊感,我到現在還記得清楚。可以透過 SSH 連到遠端伺服器、直接幫我修改網站、接 MCP 整合 Figma 和 Gmail,用起來的流暢感讓我覺得這筆訂閱費完全值得。

但到了三月底、四月初,某件事悄悄改變了。同樣的 Debug 任務,Token 使用量突然飆到 20%–30%;以前修一次就能解決的 Bug,現在要多補充兩三句才有辦法讓它搞定。與此同時,社群上也開始出現越來越多類似的聲音:Claude 是不是被降智了?Token 怎麼這麼燒?這篇文章,就是我這幾天拿 Codex 5.3 試著找答案的紀錄。

Claude 最近到底怎麼了?

要講清楚這件事,得先拆成兩個層面:品質降級Token 消耗暴增,這兩件事雖然感覺很像,但背後的原因其實不一樣。

品質降級:不是陰謀,是 Anthropic 的一個預設值改動

根據 Anthropic 的官方說明,2026 年 2 月 9 日,Opus 4.6 改為預設啟用 adaptive thinking;3 月 3 日,又把推理深度的預設值從高調降為「effort level 85」(中等)。Anthropic 的說法是「在智能、延遲與成本之間取得最佳平衡」,但對重度使用者來說,這個改動相當於在沒有事先通知的情況下,悄悄換掉了你付費的那款引擎。

獨立測試機構 Marginlab 的數據顯示,Claude Code 搭配 Opus 4.6 的 SWE-Bench-Pro 基準測試成績,從原本的 56% 在 2026 年 4 月 10 日滑落至 50%。這個數字不算毀滅性,但對每天用 Claude 解決複雜工程任務的人來說,這 6% 的差距感受起來可不只是 6%。

「以前回報一次 Bug 大概就能修好,現在即便給了很明確的指示,同一個 Bug 還是要修兩到三次以上,甚至在有明確指令的情況下仍會出錯。」

Token 消耗暴增:Prompt Cache 出了問題

與「降智」分開看的另一個問題,是 Token 消耗異常。從 3 月 23 日開始,Claude Code 的 prompt caching 系統出現異常,導致原本應該被快取重用的上下文每次都重新計算,Token 消耗量大幅攀升。部分用戶甚至在 90 分鐘內就燒完了五小時的 session 額度。Anthropic 官方將此描述為「算力管理措施」,但外界普遍認為更像是 Bug。

Token 到底燒多快?真實數字讓我傻眼

以我自己的使用情境為例,以前用 Claude 五小時額度可以:

  • 架完並開發一個 App 或基本網站原型,還有剩
  • 處理多個 Bug 回合,整合 API 測試

現在同樣五小時的額度,消耗速度大幅提升:

操作項目大約消耗比例
請 Claude 分析一個 Excel 檔案約 10%
Debug 一到兩個 Bug20%–30%
使用 MCP 服務(如 Gmail、Figma)每次對話 15%–40%(視上下文大小)
問一個複雜的架構問題5%–10%

換句話說,對「奈米用戶」($20/月訂閱)來說,一個開發工作天不到,額度可能就見底了。更讓人無奈的是,Claude Code 計費方式並不像一般 API 那樣透明,你不容易事先預判這個任務會燒多少。社群上也已經出現大量類似聲音,在 Facebook 的 Claude Code 社團、X(Twitter)上,不少海外開發者都在反映同樣的問題:最近的 Token 消耗情況有點不對勁。如果你也在找備用方案,Ollama 本地 AI 方案也是個值得參考的選項。

實際舉個例子:光是撰寫這篇文章的過程,Claude Code 的使用量就從 20% 直接飆到了 60%,短短幾小時燒掉 40 個百分點。

撰寫本文過程中 Claude Code 的 Token 使用狀況,current 從 20% 飆升至 60%
撰寫本文期間的 Claude Code 使用量紀錄:current 從 20% 直衝 60%

Codex 5.3 是什麼?OpenAI 的另一個回答

OpenAI 的 Codex 並不是新東西,但 2026 年改版之後的 Codex 已經不是當年那個單純補全程式碼的小工具。GPT-5.3-Codex 是目前的主力模型,搭配 Codex-Spark 可以達到每秒 1,000+ tokens 的輸出速度,介面設計上也朝著「開發者的 IDE」方向走,而非單純的對話框。

這幾天我試用的是 Codex 的桌面平台版本(非 CLI),整體感受如下:

  • 介面直覺:類似 VS Code 的排版,有左側檔案樹、中間對話區,不需要重新適應
  • 以「專案」為單位:不像 Claude 是一個對話一個對話地處理,Codex 允許你選定整個專案資料夾,讓 AI 對完整脈絡下指令
  • 指令方式:同樣是文字對話,但 Debug、修改、列計畫都在同一個對話串裡進行,圖片理解也沒問題,附上截圖它能直接讀懂
Codex 5.3 操作面板介面,左側為專案檔案樹、右側為 AI 對話與 TODO 清單
Codex 5.3 的實際操作畫面,左側專案列表、右側對話串,整體與 VS Code 十分相似

實際用 Codex 5.3 開了一個分支來測試新功能,使用體驗讓我相當意外。以下是使用一段開發時間後的速率限制面板:

使用 Codex 5.3 開發分支後的速率限制面板,使用量僅消耗 5%
同樣的開發任務,Codex 5.3 的一週使用量才消耗了 6%,相較於 Claude 動輒 10-20% 的燒法,節省得非常有感

對比前幾天用 Claude 的消耗速率,同類型任務 Codex 5.3 大約節省了 10%–20%(視任務複雜度而定)。如果你也是每次開工沒多久就盯著額度發呆的奈米用戶,這個差距是真的有感的。

Claude Code Codex 5.3 功能對比:誰更值得用?

比較項目Claude Code(Opus 4.6)Codex 5.3(GPT-5.3-Codex)
程式碼品質(盲測)✅ 67% 勝出25% 勝出
Terminal 任務效能65.4%✅ 77.3%
輸出速度✅ 高(Codex-Spark 1,000+ tokens/sec)
SSH 連線支援✅ 原生支援需另外設定
Skills / Hooks 生態✅ 豐富(Claude Code 內建)Plugin 系統,仍在擴充
MCP 支援深度✅ 完整有,但整合度較低
訂閱起點$20/月(Claude Pro)✅ 免費用戶即可使用
Token 效率感受三月後消耗明顯偏高✅ 初用體感較省
圖片理解✅ 支援✅ 支援
開源程度閉源✅ CLI 開源(Rust)

Codex 5.3 明顯勝出的情境

  • DevOps / CI/CD 流程:Terminal 任務成績 77.3%,腳本和自動化任務更可靠
  • Token 預算有限的專案:速度快、消耗相對可控,奈米用戶友善
  • 想要 IDE 整合工作流:專案為單位的操作方式更直覺
  • 初期試用、不想一次投入 $200/月:ChatGPT Plus $20/月 即可使用

Claude Code Codex 對比下,Claude 目前仍有優勢的情境

  • 複雜的多檔案推理:Claude 在程式碼品質盲測中仍以 67% 領先
  • SSH 遠端連線操作:直接透過 Claude Code 連到伺服器修改,這點 Codex 目前需要繞道
  • Skills / Hooks 客製化:Claude Code 的 skill 生態更成熟,可以直接設定指令後自動執行
  • MCP 整合深度:第三方工具的接入仍然是 Claude 的強項,例如用 OpenClaw 建立自動化流程

第一步:如何開始用 Codex 5.3 替代部分 Claude Code 任務

如果你也在考慮把 Codex 5.3 當作 Claude Code 的備用或替換選項,以下是建議的起手方式:

  1. 確認你的 ChatGPT 訂閱:Codex 5.3 包含在 ChatGPT Plus($20/月)方案中。如果你已有 Plus 訂閱,直接從 ChatGPT 進入 Codex 即可,不需另外付費。
  2. 選擇平台版還是 CLI 版:初次使用建議先從桌面平台版入手(介面直覺、不需要設定),熟悉後再考慮安裝 Codex CLI,適合 DevOps 和自動化場景。
  3. 以「專案」為單位設定上下文:把本地專案資料夾整個指向 Codex,而非逐一貼程式碼片段,讓 AI 理解全局脈絡,減少來回溝通次數。
  4. 測試你最常遇到的 Debug 場景:拿最近讓 Claude 修了多次的 Bug 來試,觀察 Codex 的解決品質和 Token 消耗,親身對比一下差異。
  5. 建立混合工作流,不完全替換:複雜架構決策、SSH 遠端操作、MCP 整合交給 Claude;Terminal 任務、CI/CD、簡單 Debug 交給 Codex。兩邊額度互補,依賴也更分散。

Codex 免費版夠用嗎?

Codex 5.3 有提供免費版,如果只是想先試試看功能、跑幾個小任務,免費版完全可以入門。不過若真的要拿來日常開發,免費額度可能很快就見底。我自己評估下來,ChatGPT Plus 每月 $20 的訂閱升級後,Token 使用量明顯提升,對於日常開發來說相當夠用——至少比目前 Claude Pro 面臨的燃燒問題好處理多了。

結語:平替不是非此即彼

用了一段時間 Claude 之後,我也確實被「馴化」了,去用其他 AI 工具時總覺得答案沒那麼精準。但這次 Codex 5.3 給我的初體驗,讓我意識到這不是在挑「誰比較好」,而是在建立一套更靈活的工作流。

Claude 的降質問題不是陰謀論,而是一個產品決策在沒有充分溝通的情況下悄悄落地,讓付費用戶承擔了代價。但這不代表 Claude 就沒有價值,也不代表 Codex 5.3 就是完美的接班人。現階段的答案比較像是:Codex 5.3 是個值得認真試試的備案,而不是完全的平替。

你的情況建議選擇
每月 $20,主要做 Debug 和小功能開發Codex 5.3 可以作為主力,Claude 留給複雜任務
大量使用 MCP 和 SSH 連線Claude 目前仍是首選,Codex 補位
需要 CI/CD 和 Terminal 自動化Codex CLI 更適合
不想煩惱額度,願意多花錢Claude Max $200/月 或 Codex Pro $100/月
想要最高程式碼品質Claude Code(確保沒被節流的情況下)

常見問題 FAQ

Q1:Claude 真的被「降智」了嗎?還是只是使用感覺變差?

兩者都有。Anthropic 確實在 3 月 3 日調降了 Opus 4.6 的預設推理深度(effort level 85),獨立基準測試也顯示 SWE-Bench-Pro 成績從 56% 滑落至 50%。但「降智」不是惡意偷跑,而是 Anthropic 為了在成本、速度與智能之間取得平衡所做的決策,只是這個決定沒有主動告知付費用戶。

Q2:Claude Code Token 消耗暴增,有辦法減少嗎?

目前幾個有效的方法:(1)避免在單一 session 放太長的對話上下文;(2)減少 MCP 同時啟用的數量;(3)改用 API key 模式(pay-as-you-go),這樣比較容易掌握實際成本;(4)把簡單的 Debug 任務轉移到 Codex 5.3,留住 Claude 額度給複雜任務。

Q3:Codex 5.3 和 Codex CLI 是同一件事嗎?

不完全是。Codex 5.3 指的是 GPT-5.3-Codex 這個底層模型,而 Codex CLI 是 OpenAI 開源的終端機工具(Rust 語言撰寫),讓你在命令列環境中使用這個模型。此外還有桌面平台版(有圖形介面)。初次使用建議從桌面平台版入門,習慣後再視需求切換到 CLI。

Q4:Codex 5.3 可以像 Claude Code 一樣連 SSH 到遠端伺服器嗎?

目前 Codex 的原生 SSH 整合不如 Claude Code 成熟。Claude Code 可以直接設定 SSH 連線並在遠端環境執行指令;Codex 則需要透過 CLI 或額外配置才能達到類似效果。如果你的工作流程高度依賴 SSH 遠端操作,目前建議仍以 Claude Code 為主。

Q5:用 Codex 5.3 需要另外付費嗎?

如果你已有 ChatGPT Plus($20/月)訂閱,Codex 5.3 已包含在內,不需要額外付費。ChatGPT Pro 方案($100/月)提供 5x 用量,$200/月 Pro 方案則提供 20x 用量。GPT-5.3-Codex-Spark 模型目前為 ChatGPT Pro 用戶的 Research Preview。

Q6:同時訂閱 Claude 和 ChatGPT 划算嗎?

對重度開發者來說,「混合工作流」是目前最務實的選擇。$20 Claude Pro + $20 ChatGPT Plus = $40/月,可以讓你把複雜推理和 MCP 整合留給 Claude,日常 Debug 和 Terminal 任務交給 Codex,兩邊額度互補,也降低對單一平台的依賴風險。


參考來源

分享文章

Written by
jason wang

在台北玩 AI、寫程式、做設計。 這裡記錄我踩過的坑、用過的工具,以及偶爾的碎念。

留下你的留言