目錄
推薦碼優惠
在 Zeabur 購買伺服器或 AI Hub 額度,享 10% 折扣
三月的第一天訂閱 Claude,那種「原來 AI 可以這樣用」的衝擊感,我到現在還記得清楚。可以透過 SSH 連到遠端伺服器、直接幫我修改網站、接 MCP 整合 Figma 和 Gmail,用起來的流暢感讓我覺得這筆訂閱費完全值得。
但到了三月底、四月初,某件事悄悄改變了。同樣的 Debug 任務,Token 使用量突然飆到 20%–30%;以前修一次就能解決的 Bug,現在要多補充兩三句才有辦法讓它搞定。與此同時,社群上也開始出現越來越多類似的聲音:Claude 是不是被降智了?Token 怎麼這麼燒?這篇文章,就是我這幾天拿 Codex 5.3 試著找答案的紀錄。
Claude 最近到底怎麼了?
要講清楚這件事,得先拆成兩個層面:品質降級和Token 消耗暴增,這兩件事雖然感覺很像,但背後的原因其實不一樣。
品質降級:不是陰謀,是 Anthropic 的一個預設值改動
根據 Anthropic 的官方說明,2026 年 2 月 9 日,Opus 4.6 改為預設啟用 adaptive thinking;3 月 3 日,又把推理深度的預設值從高調降為「effort level 85」(中等)。Anthropic 的說法是「在智能、延遲與成本之間取得最佳平衡」,但對重度使用者來說,這個改動相當於在沒有事先通知的情況下,悄悄換掉了你付費的那款引擎。
獨立測試機構 Marginlab 的數據顯示,Claude Code 搭配 Opus 4.6 的 SWE-Bench-Pro 基準測試成績,從原本的 56% 在 2026 年 4 月 10 日滑落至 50%。這個數字不算毀滅性,但對每天用 Claude 解決複雜工程任務的人來說,這 6% 的差距感受起來可不只是 6%。
「以前回報一次 Bug 大概就能修好,現在即便給了很明確的指示,同一個 Bug 還是要修兩到三次以上,甚至在有明確指令的情況下仍會出錯。」
Token 消耗暴增:Prompt Cache 出了問題
與「降智」分開看的另一個問題,是 Token 消耗異常。從 3 月 23 日開始,Claude Code 的 prompt caching 系統出現異常,導致原本應該被快取重用的上下文每次都重新計算,Token 消耗量大幅攀升。部分用戶甚至在 90 分鐘內就燒完了五小時的 session 額度。Anthropic 官方將此描述為「算力管理措施」,但外界普遍認為更像是 Bug。
Token 到底燒多快?真實數字讓我傻眼
以我自己的使用情境為例,以前用 Claude 五小時額度可以:
- 架完並開發一個 App 或基本網站原型,還有剩
- 處理多個 Bug 回合,整合 API 測試
現在同樣五小時的額度,消耗速度大幅提升:
| 操作項目 | 大約消耗比例 |
|---|---|
| 請 Claude 分析一個 Excel 檔案 | 約 10% |
| Debug 一到兩個 Bug | 20%–30% |
| 使用 MCP 服務(如 Gmail、Figma) | 每次對話 15%–40%(視上下文大小) |
| 問一個複雜的架構問題 | 5%–10% |
換句話說,對「奈米用戶」($20/月訂閱)來說,一個開發工作天不到,額度可能就見底了。更讓人無奈的是,Claude Code 計費方式並不像一般 API 那樣透明,你不容易事先預判這個任務會燒多少。社群上也已經出現大量類似聲音,在 Facebook 的 Claude Code 社團、X(Twitter)上,不少海外開發者都在反映同樣的問題:最近的 Token 消耗情況有點不對勁。如果你也在找備用方案,Ollama 本地 AI 方案也是個值得參考的選項。
實際舉個例子:光是撰寫這篇文章的過程,Claude Code 的使用量就從 20% 直接飆到了 60%,短短幾小時燒掉 40 個百分點。

Codex 5.3 是什麼?OpenAI 的另一個回答
OpenAI 的 Codex 並不是新東西,但 2026 年改版之後的 Codex 已經不是當年那個單純補全程式碼的小工具。GPT-5.3-Codex 是目前的主力模型,搭配 Codex-Spark 可以達到每秒 1,000+ tokens 的輸出速度,介面設計上也朝著「開發者的 IDE」方向走,而非單純的對話框。
這幾天我試用的是 Codex 的桌面平台版本(非 CLI),整體感受如下:
- 介面直覺:類似 VS Code 的排版,有左側檔案樹、中間對話區,不需要重新適應
- 以「專案」為單位:不像 Claude 是一個對話一個對話地處理,Codex 允許你選定整個專案資料夾,讓 AI 對完整脈絡下指令
- 指令方式:同樣是文字對話,但 Debug、修改、列計畫都在同一個對話串裡進行,圖片理解也沒問題,附上截圖它能直接讀懂

實際用 Codex 5.3 開了一個分支來測試新功能,使用體驗讓我相當意外。以下是使用一段開發時間後的速率限制面板:

對比前幾天用 Claude 的消耗速率,同類型任務 Codex 5.3 大約節省了 10%–20%(視任務複雜度而定)。如果你也是每次開工沒多久就盯著額度發呆的奈米用戶,這個差距是真的有感的。
Claude Code Codex 5.3 功能對比:誰更值得用?
| 比較項目 | Claude Code(Opus 4.6) | Codex 5.3(GPT-5.3-Codex) |
|---|---|---|
| 程式碼品質(盲測) | ✅ 67% 勝出 | 25% 勝出 |
| Terminal 任務效能 | 65.4% | ✅ 77.3% |
| 輸出速度 | 中 | ✅ 高(Codex-Spark 1,000+ tokens/sec) |
| SSH 連線支援 | ✅ 原生支援 | 需另外設定 |
| Skills / Hooks 生態 | ✅ 豐富(Claude Code 內建) | Plugin 系統,仍在擴充 |
| MCP 支援深度 | ✅ 完整 | 有,但整合度較低 |
| 訂閱起點 | $20/月(Claude Pro) | ✅ 免費用戶即可使用 |
| Token 效率感受 | 三月後消耗明顯偏高 | ✅ 初用體感較省 |
| 圖片理解 | ✅ 支援 | ✅ 支援 |
| 開源程度 | 閉源 | ✅ CLI 開源(Rust) |
Codex 5.3 明顯勝出的情境
- DevOps / CI/CD 流程:Terminal 任務成績 77.3%,腳本和自動化任務更可靠
- Token 預算有限的專案:速度快、消耗相對可控,奈米用戶友善
- 想要 IDE 整合工作流:專案為單位的操作方式更直覺
- 初期試用、不想一次投入 $200/月:ChatGPT Plus $20/月 即可使用
Claude Code Codex 對比下,Claude 目前仍有優勢的情境
- 複雜的多檔案推理:Claude 在程式碼品質盲測中仍以 67% 領先
- SSH 遠端連線操作:直接透過 Claude Code 連到伺服器修改,這點 Codex 目前需要繞道
- Skills / Hooks 客製化:Claude Code 的 skill 生態更成熟,可以直接設定指令後自動執行
- MCP 整合深度:第三方工具的接入仍然是 Claude 的強項,例如用 OpenClaw 建立自動化流程
第一步:如何開始用 Codex 5.3 替代部分 Claude Code 任務
如果你也在考慮把 Codex 5.3 當作 Claude Code 的備用或替換選項,以下是建議的起手方式:
- 確認你的 ChatGPT 訂閱:Codex 5.3 包含在 ChatGPT Plus($20/月)方案中。如果你已有 Plus 訂閱,直接從 ChatGPT 進入 Codex 即可,不需另外付費。
- 選擇平台版還是 CLI 版:初次使用建議先從桌面平台版入手(介面直覺、不需要設定),熟悉後再考慮安裝 Codex CLI,適合 DevOps 和自動化場景。
- 以「專案」為單位設定上下文:把本地專案資料夾整個指向 Codex,而非逐一貼程式碼片段,讓 AI 理解全局脈絡,減少來回溝通次數。
- 測試你最常遇到的 Debug 場景:拿最近讓 Claude 修了多次的 Bug 來試,觀察 Codex 的解決品質和 Token 消耗,親身對比一下差異。
- 建立混合工作流,不完全替換:複雜架構決策、SSH 遠端操作、MCP 整合交給 Claude;Terminal 任務、CI/CD、簡單 Debug 交給 Codex。兩邊額度互補,依賴也更分散。
Codex 免費版夠用嗎?
Codex 5.3 有提供免費版,如果只是想先試試看功能、跑幾個小任務,免費版完全可以入門。不過若真的要拿來日常開發,免費額度可能很快就見底。我自己評估下來,ChatGPT Plus 每月 $20 的訂閱升級後,Token 使用量明顯提升,對於日常開發來說相當夠用——至少比目前 Claude Pro 面臨的燃燒問題好處理多了。
結語:平替不是非此即彼
用了一段時間 Claude 之後,我也確實被「馴化」了,去用其他 AI 工具時總覺得答案沒那麼精準。但這次 Codex 5.3 給我的初體驗,讓我意識到這不是在挑「誰比較好」,而是在建立一套更靈活的工作流。
Claude 的降質問題不是陰謀論,而是一個產品決策在沒有充分溝通的情況下悄悄落地,讓付費用戶承擔了代價。但這不代表 Claude 就沒有價值,也不代表 Codex 5.3 就是完美的接班人。現階段的答案比較像是:Codex 5.3 是個值得認真試試的備案,而不是完全的平替。
| 你的情況 | 建議選擇 |
|---|---|
| 每月 $20,主要做 Debug 和小功能開發 | Codex 5.3 可以作為主力,Claude 留給複雜任務 |
| 大量使用 MCP 和 SSH 連線 | Claude 目前仍是首選,Codex 補位 |
| 需要 CI/CD 和 Terminal 自動化 | Codex CLI 更適合 |
| 不想煩惱額度,願意多花錢 | Claude Max $200/月 或 Codex Pro $100/月 |
| 想要最高程式碼品質 | Claude Code(確保沒被節流的情況下) |
常見問題 FAQ
Q1:Claude 真的被「降智」了嗎?還是只是使用感覺變差?
兩者都有。Anthropic 確實在 3 月 3 日調降了 Opus 4.6 的預設推理深度(effort level 85),獨立基準測試也顯示 SWE-Bench-Pro 成績從 56% 滑落至 50%。但「降智」不是惡意偷跑,而是 Anthropic 為了在成本、速度與智能之間取得平衡所做的決策,只是這個決定沒有主動告知付費用戶。
Q2:Claude Code Token 消耗暴增,有辦法減少嗎?
目前幾個有效的方法:(1)避免在單一 session 放太長的對話上下文;(2)減少 MCP 同時啟用的數量;(3)改用 API key 模式(pay-as-you-go),這樣比較容易掌握實際成本;(4)把簡單的 Debug 任務轉移到 Codex 5.3,留住 Claude 額度給複雜任務。
Q3:Codex 5.3 和 Codex CLI 是同一件事嗎?
不完全是。Codex 5.3 指的是 GPT-5.3-Codex 這個底層模型,而 Codex CLI 是 OpenAI 開源的終端機工具(Rust 語言撰寫),讓你在命令列環境中使用這個模型。此外還有桌面平台版(有圖形介面)。初次使用建議從桌面平台版入門,習慣後再視需求切換到 CLI。
Q4:Codex 5.3 可以像 Claude Code 一樣連 SSH 到遠端伺服器嗎?
目前 Codex 的原生 SSH 整合不如 Claude Code 成熟。Claude Code 可以直接設定 SSH 連線並在遠端環境執行指令;Codex 則需要透過 CLI 或額外配置才能達到類似效果。如果你的工作流程高度依賴 SSH 遠端操作,目前建議仍以 Claude Code 為主。
Q5:用 Codex 5.3 需要另外付費嗎?
如果你已有 ChatGPT Plus($20/月)訂閱,Codex 5.3 已包含在內,不需要額外付費。ChatGPT Pro 方案($100/月)提供 5x 用量,$200/月 Pro 方案則提供 20x 用量。GPT-5.3-Codex-Spark 模型目前為 ChatGPT Pro 用戶的 Research Preview。
Q6:同時訂閱 Claude 和 ChatGPT 划算嗎?
對重度開發者來說,「混合工作流」是目前最務實的選擇。$20 Claude Pro + $20 ChatGPT Plus = $40/月,可以讓你把複雜推理和 MCP 整合留給 Claude,日常 Debug 和 Terminal 任務交給 Codex,兩邊額度互補,也降低對單一平台的依賴風險。
參考來源
分享文章
留下你的留言