nun_game0

Copilot vs Claude Code vs Codex。使い分けの結論

AI開発ツール比較

AIコーディング支援ツールを3つ併用している。GitHub Copilot、Claude Code、Codex。全部使った上で、どう使い分けているかを書く。

「結局どれがいいの?」という質問をよくもらうけど、答えは「全部違う」。それぞれ得意な場面が明確に違うので、1つに絞ろうとすると損をする。

GitHub Copilot:手を止めずに書ける補完

Copilotはエディタ内の補完ツール。コードを書いている最中に次の行を予測して出してくれる。

タイピングの延長で使えるのが良い。変数名を書き始めたら残りを補完、コメントを書いたら実装を提案。Terraform の resource ブロックとか、似た構造を何個も書くときにTabを連打するだけで済むのは助かる。

ただ、自分の使い方だと正直そこまで依存度は高くない。インフラのコードは「量を書く」より「正しい設定値を調べて書く」ことの方が多いので、Copilotの補完が活きる場面が限られる。アプリケーションコードをガリガリ書く人の方が恩恵は大きいと思う。

あと、Copilotの補完は「それっぽいけど微妙に間違っている」ことがある。IAMの権限名とかGCPのAPI名を補完してくれるけど、存在しない権限名を自信満々に出してくることがあるので、そのまま受け入れると痛い目を見る。

Claude Code:自分のメインウェポン

3つの中で一番使っているのがClaude Code。ターミナルで対話しながら設計・実装・レビューまで全部やれる。自分の業務時間の中で、Claude Codeが起動していない時間の方が短いくらいには依存している。

インフラエンジニアとして一番ありがたいのが、複数ファイルをまたいだ変更を一発でやれること。たとえばTerraformでモジュールのインターフェースを変更したとき、そのモジュールを呼び出している全環境のtfファイルを探して書き換える必要がある。手作業だと漏れるし、sedで一括置換するには構造が複雑すぎる。Claude Codeなら「このモジュールの変数名を変えたから、呼び出し元を全部直して」で終わる。

設計の壁打ちにもよく使う。「GKEのクラスタをマルチリージョンにしたいんだけど、Terraformの構成どうする?」みたいな抽象的な相談をぶつけると、パターンをいくつか出してくれる。そこから自分の環境に合うものを選んで「じゃあこの方針で書いて」と依頼する流れ。一人で設計を考えていると煮詰まるけど、壁打ち相手がいると判断が早くなる。

CLAUDE.mdの仕組みも地味に強力で、プロジェクトのルールや命名規約を書いておくと、毎回「うちのTerraformはこういう構成で...」と説明しなくてよくなる。自分はCLAUDE.mdにGCPプロジェクトの一覧とかGKEクラスタの命名規則まで書いている。ここまでやると、ほぼプロジェクトメンバーと話しているのと変わらない精度で出力が返ってくる。

ツール比較表

K8sマニフェストの修正でも重宝する。「このDeploymentにreadinessProbeを追加して、あとHPAの設定も見直して」みたいな依頼を出すと、関連するファイルを全部見た上で整合性のある変更を出してくれる。YAMLのインデントミスで30分溶かすみたいな事故が激減した。

Claude Code導入で詰まりやすいポイント

指示の粒度が重要。「Terraformを直して」だと何をどう直すかわからないので微妙な結果になる。「このモジュールのoutputにcluster_endpointを追加して、呼び出し元のdev環境で使えるようにして」くらい具体的に言うと精度が上がる。

コスト面は正直それなりにかかる。自分はMax プラン(月200ドル)を使っているけど、従量課金で使っていた頃は月の後半に「今月使いすぎたな」と気づくことが何度かあった。定額プランにしてからはコストを気にせず使い倒せるようになった。

Codex:PRレビューを投げる先

Codexは非同期で動くのが特徴。タスクを投げて放置して、終わったら結果を見る。

自分の使い方はほぼPRレビュー専用。PRが上がってきたらCodexにレビューを投げておいて、自分は別の作業を続ける。15分くらいで結果が返ってくるので、指摘を確認してコメントする。Claude Codeでもレビューはできるけど、同期的に待つ必要があるので、その間手が空くのがもったいない。Codexなら投げっぱなしにできる。

正直、レビュー以外ではあまり使っていない。対話しながら進めたい作業はClaude Codeの方が圧倒的にやりやすいし、Codexはサンドボックスで動くので外部接続が必要な検証は制約がある。用途が限られる分、その用途ではしっかり役に立っている、という感じ。

使い分けの結論

比率でいうと、Claude Code 7割、Copilot 2割、Codex 1割くらい。

Claude Code → メイン。設計・実装・リファクタリング・調査、ほぼ全部ここでやる。

Copilot → コードを書いている最中の補完。手を止めずに済むのが良い。

Codex → PRレビューを非同期で投げる。それ以外はあまり使わない。

1日の流れで言うと、朝イチでPRが溜まっていたらCodexにレビューを投げる。そのあとはだいたいClaude Codeと一緒に作業している。Terraformの変更もK8sマニフェストの修正もClaude Codeで完結することが多い。Copilotの補完はエディタで直接コードを書くときに自然に効いている感じで、意識的に「Copilotを使おう」と思うことは少ない。

使い分けフロー

併用のコスト

3つとも有料なので、コストの目安を書いておく。

  • Copilot:月額10ドル(Individual)/ 19ドル(Business)。固定。
  • Claude Code:Max プランで月200ドル。従量課金もあるけど、自分は定額の方が気が楽。
  • Codex:ChatGPT Proプラン(月額200ドル)に含まれる。すでにPro契約しているなら追加コストゼロ。

合計すると月額でそれなりにかかる。でも生産性の向上を考えると、十分にペイしている。

会社の経費で出してもらえるなら全部入れるべき。個人で1つだけ試すなら、Claude Codeをすすめる。自分がそう思うのは、去年GKEクラスタのリージョン移行をやったとき、Terraformのstate操作とマニフェスト修正と監視設定の変更を全部Claude Codeと対話しながら進められた経験が大きい。設計相談から実装まで1つのツールで完結する守備範囲の広さは、他にない。Copilotだけだと補完しかできないし、Codexだけだと対話ができない。

結局Claudeメインに落ち着いた

3つ併用していると書いたけど、実態としてはClaude Codeへの依存度がどんどん上がっている。Copilotは入れてあるけど意識して使う場面は減ったし、Codexはレビュー以外だとあまり出番がない。

理由は単純で、Claude Codeが一番「仕事の進め方」に近いから。インフラの仕事って、調べて、方針を決めて、実装して、確認して、の繰り返し。この全工程を対話しながら進められるのはClaude Codeだけ。Copilotは「実装する」の一部分だけだし、Codexは「投げて待つ」しかできない。

あと、AIの出力を鵜呑みにしないのは大前提。特にIAMの権限設定とかネットワークポリシーとか、間違えるとインシデントになる領域は、AIが出したものを必ず自分で検証している。この点はどのツールを使っても変わらない。

関連記事

SharePost

他の記事