OpenAI CodexとClaude Codeを両方使っていると、単純な性能比較とは別に、かなり現実的な感覚が出てきます。
それは「支払っている金額と、作業の余裕は必ずしも比例しない」ということです。
現在、レイヤーワークスではOpenAI CodexをChatGPT Plusプランで使い、Claude CodeはMaxプランで使っています。金額だけ見れば、Claude Code側はかなり重い投資です。Max 5xであれば月額100ドル、ChatGPT Plusを20ドルと見れば、ざっくり5倍の差があります。
ところが実務での体感としては、「5倍払っているから5倍余裕がある」という感じではありません。
むしろ、作業の余裕は2〜3倍くらいに感じる場面があります。
要点: AI開発支援ツールのコスト感は、月額料金だけでは判断できません。どれだけ文脈を抱え込むか、タスクをどう切るか、周辺ツールをどこまで読み込むかによって、体感上の余裕は大きく変わります。
もちろん、これは厳密なベンチマークではありません。作業内容、モデル、設定、対象コードベース、使い方によって結果は変わります。
ただ、WordPressサイト制作、WP Maintenance Managerの継続開発、ブログ運用のような実務の中で使っていると、「なぜCodexは意外と消費が少なく感じるのか」「なぜClaude Codeは便利だが減りが早く感じるのか」という構造が少し見えてきます。
まず前提:料金と作業量は同じ単位ではない
ClaudeのMaxプランは、公式ヘルプでMax 5xが月額100ドル、Max 20xが月額200ドルと説明されています。また、Max 5xはProプランより多い使用量を提供するプランとして位置づけられています。
一方、OpenAIのCodexは、ChatGPT Plus、Pro、Business、Enterprise/Eduなどのプランに含まれます。OpenAIのヘルプでは、Codexの使用量はプランだけでなく、コーディングタスクの大きさ、複雑さ、どこで実行するかによって変わると説明されています。
ここで大事なのは、月額料金と作業量は同じ単位ではないということです。
月額料金は、提供される権利や優先度、利用上限、モデルアクセスなどを含んだパッケージです。一方で、実際の作業量は「1回の依頼でどれだけ文脈を読むか」「どれだけ長く同じセッションを引っ張るか」「何個のファイルを確認するか」に左右されます。
つまり、5倍の料金だから5倍の作業ができる、とは限りません。
Codexが軽く感じる理由:タスク単位で切りやすい
Codexが比較的軽く感じる理由のひとつは、タスク単位で作業を切りやすいことだと思います。
Codex cloudは、公式ドキュメントで「コードを読み、編集し、実行できる coding agent」と説明され、クラウド上の環境でバックグラウンド作業もできる設計になっています。
この使い方では、作業を次のように分けやすくなります。
- このページのCSSを直す
- この投稿のHTMLを更新する
- このテーマファイルを確認する
- このエラーの原因を調べる
- この差分を本番へ反映する
タスクが小さく切れていると、AIが毎回抱える文脈も比較的限定しやすくなります。
もちろんCodexも大きなコードベースを読めば消費は増えます。長い作業を任せれば、それなりに重くなります。それでも、使い方として「この作業を終わらせる」「次は別の作業」と区切りやすいので、文脈が無限に育っていく感じは比較的抑えやすい印象があります。
WordPress制作のように、テーマ、投稿、CSS、WP-CLI確認、本番反映と作業単位が分かれている場面では、この切り方がかなり合います。
Claude Codeが重く感じる理由:プロジェクトに深く住む
Claude Codeの良さは、プロジェクトに深く入り込めることです。
ターミナルの中で動き、既存コードを読み、PROJECT.mdやCLAUDE.mdのようなルールを参照し、テストやビルドまで含めて継続的に作業できます。自社開発しているWordPress保守アプリ【WP Maintenance Manager】のように、仕様、テスト、リリースノート、多言語対応、ビルド注意点が多いプロジェクトでは、この「プロジェクトに住む」感覚がとても強いです。
ただし、これは同時に文脈が大きくなりやすいということでもあります。
Claude Codeのコスト管理ドキュメントでは、コストはモデル選択、コードベースの大きさ、複数インスタンスや自動化などの使用パターンによって大きく変わると説明されています。また、MCPサーバーを減らす、CLIツールを使う、不要なファイル読み込みを減らす、hooksやskillsで前処理する、といったコスト削減策も紹介されています。
これは裏を返すと、Claude Codeは便利な周辺機能を増やすほど、AIに見せる文脈も増えやすいということです。
たとえば、次のようなものが効いてきます。
- 長く続くセッション
- 大きなPROJECT.mdやCLAUDE.md
- MCPサーバーのツール一覧
- skillsによる追加知識
- subagentや並列作業
- テスト結果やログの長い出力
- 何度も読み直す周辺ファイル
Claude Codeは、この厚い文脈を扱えるから強い。けれど、その強さがそのまま消費の重さにもつながります。
「5倍払って2〜3倍の余裕」は、悪い話とは限らない
ここで大事なのは、「Claude Codeは高いから悪い」という話ではないことです。
むしろ、Claude CodeのMaxプランは、継続開発の現場ではかなり心強いです。大きな修正、横断調査、仕様書を読みながらの改修、テスト追加、多言語対応の確認など、腰を据えた作業では助かる場面が多いです。
ただ、費用対効果を考えて「5倍払えば5倍ラクになる」とは考えない方がいいです。
AI開発支援では、上位プランにすると余裕は増えます。しかし、その余裕は直線的に増えるというより、「詰まりにくくなる」「深い作業に入りやすくなる」「中断しにくくなる」という性質に近いです。
体感として2〜3倍の余裕でも、仕事の内容によっては十分に価値があります。逆に、軽めのWordPress修正や記事HTMLの整形が中心なら、PlusプランのCodexでかなり足りる場面もあります。
ここを混同すると、プラン選びを間違えます。
道具の違いより、作業の切り方がコストを決める
CodexとClaude Codeのどちらを使うか以上に、作業の切り方が重要です。
たとえば、AIにこう頼むと重くなりやすいです。
- このプロジェクト全体を見て、いい感じに直して
- 関係ありそうなところを全部調べて
- 長いログを全部読んで原因を考えて
- 仕様もテストもUIも全部まとめて改善して
逆に、次のように切ると消費は抑えやすくなります。
- この1ファイルのこの表示だけ直して
- まず関連ファイル候補を3つだけ挙げて
- ログはエラー行だけ見て
- 実装前に変更範囲を確認して
- 今回は公開済み記事本文だけ直して
これはCodexでもClaude Codeでも同じです。
AI開発支援のコストは、ツールの価格だけでなく、人間側の依頼の粒度でかなり変わります。
実務での使い分け
現時点での感覚としては、次のように使い分けるのが現実的です。
| 作業 | 向いている使い方 |
|---|---|
| WordPress記事の修正 | Codexで投稿本文やHTMLをピンポイント修正 |
| テーマCSSの調整 | Codexで表示確認と反映まで進める |
| 本番反映の確認 | CodexでWP-CLIや表示確認を短いタスクに分ける |
| アプリの継続開発 | Claude Codeで仕様書を読みながら深く作業 |
| 横断的なバグ調査 | Claude Codeで関連ファイル、テスト、履歴まで追う |
| 長い仕様整理 | Claude Code。ただし文脈を絞る工夫が必要 |
Codexは、作業を細かく切って進める制作・運用系に向いています。
Claude Codeは、プロジェクトに深く入り込む継続開発に向いています。
どちらが上というより、消費の仕方が違います。
トークンを浪費しないために人間ができること
AI開発支援を使う側として、トークン消費を減らすためにできることもあります。
大きいのは、AIに「全部見て」と言わないことです。
まず目的を絞る。変更範囲を限定する。読み込む資料を指定する。ログや差分は必要な部分だけ渡す。作業後に確認してほしい項目を明確にする。
これだけで、同じAIでもかなり扱いやすくなります。
また、PROJECT.mdや運用ガイドも、ただ長くすればよいわけではありません。重要なルール、禁止事項、確認手順を整理して、AIが迷わず動ける形にする必要があります。
文脈は多ければ多いほどよい、ではありません。
必要な文脈だけを、必要なタイミングで渡す。
これが、AI開発支援を長く使うための基本だと思います。
まとめ:高いプランほど万能、ではない
OpenAI CodexとClaude Codeを比べると、Codexの方がトークン消費が少なく感じる場面があります。
その理由は、Codexが絶対的に軽いというより、タスク単位で切りやすく、必要な文脈に絞りやすい場面が多いからだと思います。
一方でClaude Codeは、プロジェクトに深く入り込めるぶん、文脈が厚くなりやすい。だから、費用は5倍でも、体感の作業余裕は2〜3倍くらいに感じることがある。
これは不満というより、AI開発支援ツールの性格の違いです。
高いプランほど万能になるわけではありません。軽い作業を短く切るならCodex。仕様やコードベースに深く入るならClaude Code。
そして、どちらを使う場合でも、最終的に効いてくるのは人間側の作業設計です。
AIに何を読ませるか。
どこまで任せるか。
どこで区切るか。
そこを設計できるほど、同じ月額料金でも得られる作業量は変わってきます。