「Codex CLI便利すぎて使いまくってたら、月のAPI費用が想定の3倍になった」——これ、あるあるです。
Codex CLIのコストは、モデル選択・プロンプト設計・ワークスペース戦略の3つを最適化するだけで、品質を維持しながら月額費用を40〜60%削減できます。この記事では、OpenAI Codex CLI 完全攻略シリーズ第38弾として、API費用を抑えるための実践テクニックを解説します。
この記事を3秒でまとめると
- 承認モードの使い分けでトークン消費量に最大5倍の差が出る
- タスク複雑度に応じたモデル切り替えで、コストパフォーマンスを最大化
- .codexignoreとワークスペース設計で無駄なコンテキスト消費を防止
Codex CLIのコスト構造を理解する
トークン消費の仕組みと課金モデル
Codex CLIのコストは入力トークン+出力トークンの合計で決まります。2026年3月時点の料金体系は以下の通りです。
| モデル | 入力(/1M tokens) | 出力(/1M tokens) | 特徴 |
|---|---|---|---|
| GPT-5.4 | $8.00 | $32.00 | 最高品質・高コスト |
| GPT-5.1-Codex | $3.00 | $12.00 | コーディング特化・コスパ良 |
| o3-mini | $1.50 | $6.00 | 軽量タスク向き |
重要なのは、出力トークンは入力の4倍の単価である点です。AIに長い回答を求めるほどコストが増大します。

承認モードごとのコスト比較(Suggest / Auto-Edit / Full Auto)
Codex CLIの3つの承認モードは、トークン消費に大きな差を生みます。
- Suggest(提案モード): 実行前に確認を求めるため、不要な実行を抑制。最もコスト効率が良い
- Auto-Edit(自動編集モード): ファイル変更は自動、コマンド実行は確認。中程度のコスト
- Full Auto(完全自動モード): すべて自動実行。試行錯誤が増えるため、Suggestの3〜5倍のトークン消費になることも
OpenAI公式ドキュメントでも、コスト管理の観点からSuggestモードの活用が推奨されています(出典: OpenAI Codex CLI Documentation)。
モデル選択によるコスト最適化
GPT-5.4 vs GPT-5.1-Codex:用途別の使い分け
すべてのタスクに最高スペックのモデルを使う必要はありません。
| タスク | 推奨モデル | 理由 |
|---|---|---|
| アーキテクチャ設計 | GPT-5.4 | 広い視野と深い推論が必要 |
| コード生成(標準) | GPT-5.1-Codex | コーディング特化で十分な品質 |
| バグ修正 | GPT-5.1-Codex | コンテキスト理解で十分 |
| テスト生成 | o3-mini | パターン化された作業 |
| ドキュメント生成 | o3-mini | テキスト生成は軽量モデルで十分 |
| コードレビュー | GPT-5.1-Codex | セキュリティ観点も含め中程度 |
タスク複雑度に応じたモデル切り替え戦略
Codex CLI設定ガイドで解説している設定を活用し、タスク複雑度に応じてモデルを自動切り替えするアプローチが効果的です。
# 軽量タスク
codex --model o3-mini "このファイルにJSDocコメントを追加して"
# 標準タスク
codex --model gpt-5.1-codex "認証機能をJWT方式にリファクタリングして"
# 複雑なタスク
codex --model gpt-5.4 "マイクロサービス全体のアーキテクチャを見直して"
プロンプト設計でトークン消費を削減
コンテキストウィンドウの効率的な活用
トークン消費を抑えるプロンプト設計のポイント:
- 具体的な指示を出す: 曖昧な指示はAIの試行錯誤を増やし、トークンを浪費
- スコープを限定する: 「全体を見直して」→「src/auth/配下のファイルを見直して」
- 出力形式を指定する: 「簡潔に」「箇条書きで」「diff形式で」
- 段階的に進める: 大きなタスクを小さなステップに分割
コスト削減率の目安:
- 曖昧なプロンプト → 具体的なプロンプト: 30〜40%削減
- スコープ限定なし → あり: 20〜30%削減
プロンプトエンジニアリングガイドで、詳細なテクニックを解説しています。
AGENTS.md / instructions設定の最適化
Codex CLIの AGENTS.md や --instructions に過剰な情報を詰め込むと、毎回のリクエストで無駄なトークンを消費します。
最適化のポイント:
- プロジェクト固有のルールのみを記載(一般的なベストプラクティスは不要)
- コーディング規約は必要最小限に
- 大きなドキュメントは参照リンクにとどめ、本文に含めない
キャッシュとワークスペース戦略
マルチファイル参照の最小化テクニック
Codex CLIがコンテキストに含めるファイル数が多いほど、入力トークンが増加します。
- ディレクトリ構造を整理: 関連ファイルを近くに配置し、検索範囲を最小化
- モノレポでの作業範囲限定:
codex --cwd apps/apiのようにサブディレクトリに限定 - 不要な依存関係の整理: 使っていないパッケージやファイルを定期的に削除
.codexignoreによる不要ファイル除外
.codexignore ファイルで、Codex CLIがスキャンしないファイルを指定できます。
# ビルド成果物
dist/
build/
.next/
# 依存パッケージ
node_modules/
# 大きなデータファイル
*.csv
*.sql
*.dump
# テスト用フィクスチャ
__fixtures__/
これだけで入力トークンを50%以上削減できるケースもあります。高度なテクニックでも、ワークスペース最適化を解説しています。
バッチ処理とスクリプト自動化の活用
非対話型実行でAPIコールを最小化
対話型セッションでは、各やり取りで入力トークンが再送信されます。非対話型(ワンショット)実行を活用することで、APIコールを最小化できます。
# 非対話型でまとめて処理
codex -q "以下の3ファイルのテストを生成: src/auth.ts, src/user.ts, src/api.ts"
シェルスクリプト連携パターン
定型作業をシェルスクリプトにまとめることで、プロンプトの再利用とコスト管理を両立できます。
#!/bin/bash
# daily-review.sh: 日次コードレビュー
CHANGED=$(git diff --name-only HEAD~1)
codex -q --model o3-mini "以下の変更ファイルを簡潔にレビュー: $CHANGED"
コスト監視ダッシュボードの構築
OpenAI Usage APIとの連携
OpenAIのUsage APIを活用して、コスト推移を可視化できます。
curl https://api.openai.com/v1/organization/usage \
-H "Authorization: Bearer $OPENAI_API_KEY" \
| jq '.daily_costs[-7:]'
月次コストアラートの設定
OpenAIダッシュボードで以下を設定しておきましょう。
- Usage Limit: 月額上限を設定(超過するとAPIが停止)
- Notification Threshold: 上限の80%で通知
- Project別の予算設定: チームやプロジェクトごとのAPI KEYで管理
カスタムモデル設定ガイドでも、コスト効率の良いモデル運用を解説しています。
まとめ:コスト意識を持った賢いCodex CLI運用
Codex CLIのコスト最適化は、使わないのではなく、賢く使うことがポイントです。
すぐに実践できるアクション:
.codexignoreを作成して不要ファイルを除外する- タスク複雑度に応じたモデル切り替えルールを決める
- Suggestモードを基本にし、Full Autoは限定的に使う
- OpenAI Usage Limitを設定する
- 月次でコスト推移を確認する習慣をつける
**コスト最適化は生産性の低下ではなく、投資対効果の最大化です。**適切な戦略で、Codex CLIの恩恵を最大限に享受しましょう。
SES BASEでは、AIコーディングツールのスキルが活かせるSES案件を多数掲載しています。案件を検索するからチェックしてみてください。