Narzędzia

Codex CLI 2.0 — co przynosi nowa wersja i czy warto migrować

OpenAI w listopadzie 2025 wypuściło Codex CLI 2.0. Sandboxowane workspace'y, agentic mode, integracja z GPT-5. Sprawdziliśmy w 4 zadaniach z naszych projektów. Wnioski: solidna alternatywa dla Claude Code w pewnych use case'ach, ale ekosystem jeszcze słabszy.

⏱ 8 min czytania · 📅 26.01.2026 · 👁 608 wyświetleń

OpenAI w listopadzie 2025 wypuściło Codex CLI 2.0 — przepisaną wersję narzędzia developerskiego z sandboxowanymi workspace'."'".'ami, agentic mode i głębszą integracją z GPT-5. Sprawdziliśmy w 4 zadaniach z naszych projektów. Wnioski poniżej: gdzie wygrywa z Claude Code, gdzie przegrywa i czy warto migrować zespół.

Co nowego w 2.0

  • Sandbox per workspace — każda sesja w izolowanym kontenerze, brak ryzyka destrukcyjnych komend na hoście
  • Agentic mode — natywny multi-step planning z reflection
  • GPT-5 jako default — wcześniej GPT-4 Turbo
  • Plugins API — własne narzędzia w TS lub Python
  • Snapshot / restore — punkt kontrolny w workspace, możliwość rollback

4 zadania testowe

ZadanieCodex CLI 2.0Claude Code 2.xWynik
Migracja 12k linii z PHP 7 do PHP 8.34h 20m3h 45mClaude
Generacja testów PHPUnit dla 38 klas1h 12m1h 28mCodex
Refactor architektury (DDD-light)nie ukończyłukończyłClaude
Setup CI/CD od zera (GitHub Actions)32 min41 minCodex

Counted 2-2. Codex CLI wygrywa w wąskich, jasno zdefiniowanych taskach. Claude Code wygrywa w pracach wymagających szerokiego kontekstu i wytrwałości.

Sandbox — feature, którego potrzebowaliśmy

To największa nowość 2.0. Każda sesja działa w lekkim kontenerze (alpine + Node + Python + git). Hookcie do hosta tylko określone wolumeny. Komenda rm -rf / w sandboxie nie tknie waszego laptopa.

codex workspace create my-project --image alpine-dev
codex workspace exec my-project -- npm install
codex workspace snapshot my-project before-refactor

Dla zespołów enterprise to ważne — zmniejsza ryzyko prompt injection i przypadkowej destrukcji.

Plugins API — pierwsze wnioski

Plugin to TypeScript lub Python module eksportujący narzędzia. Mniej elastyczny niż MCP, ale prostszy. Idealne do jednorazowych integracji z firmowym systemem.

// plugin.ts
import { definePlugin } from "@openai/codex-plugins";

export default definePlugin({
  name: "crm-lookup",
  tools: [{
    name: "lookup_customer",
    description: "Get customer by NIP from CRM",
    parameters: { nip: "string" },
    execute: async ({ nip }) => {
      const res = await fetch(`https://crm/api/customer/${nip}`);
      return await res.json();
    }
  }]
});

Gdzie Codex wygrywa

  • Bardzo wąskie taski z jasnym brief'."'".'em
  • Setup nowych projektów (boilerplate)
  • Generowanie testów do istniejącego kodu
  • Operacje DevOps (CI/CD config, Dockerfiles)
  • Tam, gdzie zespół już używa GPT i nie chce zmieniać ekosystemu

Gdzie Claude Code wygrywa

  • Duże refactory wymagające szerokiego kontekstu
  • Code review wieloplikowy
  • Sub-agenty i orkiestracja workflow
  • Ekosystem MCP (większy i lepiej utrzymany niż Codex Plugins)
  • Praca w długich sesjach (Claude trzyma kontekst lepiej)

Rekomendacja

Dla zespołów już używających Claude Code — zostańcie. Migracja nie zwróci się. Dla zespołów na czysto — Claude Code jako default + Codex CLI jako "drugi mózg" dla wąskich tasków. Dla firm zamkniętych w OpenAI ecosystem — Codex 2.0 jest wystarczająco dobry, żeby nie szukać dalej.

Następny krok

Pomagamy w setupie środowiska deweloperskiego z AI dla zespołów 4-30 osób. Mix Claude Code + Codex CLI + polityki bezpieczeństwa. Umówmy demo.

Chcesz przetestować, jak AI rozwiąże to u Ciebie?

30 minut rozmowy + pokaz działającego wdrożenia u klienta. Bez NDA.

Umów demo

Może Cię też zainteresować

Newsletter redai

Dostawaj kolejne wpisy do skrzynki

Co dwa tygodnie: nowy case, nowe moduły AI, błędy klientów. Bez spamu.