Codex CLI 2.0 — co przynosi nowa wersja i czy warto migrować
OpenAI w listopadzie 2025 wypuściło Codex CLI 2.0. Sandboxowane workspace'y, agentic mode, integracja z GPT-5. Sprawdziliśmy w 4 zadaniach z naszych projektów. Wnioski: solidna alternatywa dla Claude Code w pewnych use case'ach, ale ekosystem jeszcze słabszy.
OpenAI w listopadzie 2025 wypuściło Codex CLI 2.0 — przepisaną wersję narzędzia developerskiego z sandboxowanymi workspace'."'".'ami, agentic mode i głębszą integracją z GPT-5. Sprawdziliśmy w 4 zadaniach z naszych projektów. Wnioski poniżej: gdzie wygrywa z Claude Code, gdzie przegrywa i czy warto migrować zespół.
Co nowego w 2.0
- Sandbox per workspace — każda sesja w izolowanym kontenerze, brak ryzyka destrukcyjnych komend na hoście
- Agentic mode — natywny multi-step planning z reflection
- GPT-5 jako default — wcześniej GPT-4 Turbo
- Plugins API — własne narzędzia w TS lub Python
- Snapshot / restore — punkt kontrolny w workspace, możliwość rollback
4 zadania testowe
| Zadanie | Codex CLI 2.0 | Claude Code 2.x | Wynik |
|---|---|---|---|
| Migracja 12k linii z PHP 7 do PHP 8.3 | 4h 20m | 3h 45m | Claude |
| Generacja testów PHPUnit dla 38 klas | 1h 12m | 1h 28m | Codex |
| Refactor architektury (DDD-light) | nie ukończył | ukończył | Claude |
| Setup CI/CD od zera (GitHub Actions) | 32 min | 41 min | Codex |
Counted 2-2. Codex CLI wygrywa w wąskich, jasno zdefiniowanych taskach. Claude Code wygrywa w pracach wymagających szerokiego kontekstu i wytrwałości.
Sandbox — feature, którego potrzebowaliśmy
To największa nowość 2.0. Każda sesja działa w lekkim kontenerze (alpine + Node + Python + git). Hookcie do hosta tylko określone wolumeny. Komenda rm -rf / w sandboxie nie tknie waszego laptopa.
codex workspace create my-project --image alpine-dev
codex workspace exec my-project -- npm install
codex workspace snapshot my-project before-refactor
Dla zespołów enterprise to ważne — zmniejsza ryzyko prompt injection i przypadkowej destrukcji.
Plugins API — pierwsze wnioski
Plugin to TypeScript lub Python module eksportujący narzędzia. Mniej elastyczny niż MCP, ale prostszy. Idealne do jednorazowych integracji z firmowym systemem.
// plugin.ts
import { definePlugin } from "@openai/codex-plugins";
export default definePlugin({
name: "crm-lookup",
tools: [{
name: "lookup_customer",
description: "Get customer by NIP from CRM",
parameters: { nip: "string" },
execute: async ({ nip }) => {
const res = await fetch(`https://crm/api/customer/${nip}`);
return await res.json();
}
}]
});
Gdzie Codex wygrywa
- Bardzo wąskie taski z jasnym brief'."'".'em
- Setup nowych projektów (boilerplate)
- Generowanie testów do istniejącego kodu
- Operacje DevOps (CI/CD config, Dockerfiles)
- Tam, gdzie zespół już używa GPT i nie chce zmieniać ekosystemu
Gdzie Claude Code wygrywa
- Duże refactory wymagające szerokiego kontekstu
- Code review wieloplikowy
- Sub-agenty i orkiestracja workflow
- Ekosystem MCP (większy i lepiej utrzymany niż Codex Plugins)
- Praca w długich sesjach (Claude trzyma kontekst lepiej)
Rekomendacja
Dla zespołów już używających Claude Code — zostańcie. Migracja nie zwróci się. Dla zespołów na czysto — Claude Code jako default + Codex CLI jako "drugi mózg" dla wąskich tasków. Dla firm zamkniętych w OpenAI ecosystem — Codex 2.0 jest wystarczająco dobry, żeby nie szukać dalej.
Następny krok
Pomagamy w setupie środowiska deweloperskiego z AI dla zespołów 4-30 osób. Mix Claude Code + Codex CLI + polityki bezpieczeństwa. Umówmy demo.
Chcesz przetestować, jak AI rozwiąże to u Ciebie?
30 minut rozmowy + pokaz działającego wdrożenia u klienta. Bez NDA.
Umów demo