Claude Code sub-agents w produkcji — 3-miesięczne doświadczenie
Wrzesień, październik, listopad 2025 — trzy miesiące Claude Code z sub-agentami w naszych 6 projektach. Dzielimy się tym, co działa, co nie działa i jak ustawić sub-agentów, żeby nie palić tokenów. Konkretne konfiguracje i koszty.
Od września 2025 używamy sub-agentów w Claude Code na produkcji. W 6 projektach, w sumie 1 240 godzin pracy zespołu. Ten artykuł to nie hype — to konkretny raport: co działa, co nie, ile kosztuje miesięcznie i jak skonfigurować sub-agentów tak, żeby nie palić tokenów na zadania, które mogą zrobić proste skrypty.
Co to są sub-agenci w Claude Code
Sub-agent to dedykowana instancja Claude'a wywoływana przez parent-agenta dla konkretnego zadania. Ma własny system prompt, własny zestaw narzędzi i własny kontekst. Wynik wraca jako podsumowanie, nie pełen log. Konfiguruje się je w katalogu .claude/agents/ w repo lub ~/.claude/agents/ globalnie.
Anatomia sub-agenta
---
name: code-reviewer
description: Reviews PHP code for security and PSR-12 compliance
tools: Read, Grep, Bash
model: claude-sonnet-4-5
---
Jesteś code reviewerem dla projektu RedAI.
Sprawdzasz:
1. Brak SQL injection (PDO + prepared statements)
2. CSRF check w POST handlerach
3. Zgodność z PSR-12
4. Helpers z /var/www/redai/includes/helpers.php zamiast reimplementacji
Zwracasz strukturowany raport: BLOKUJĄCE / OSTRZEŻENIA / SUGESTIE.
6 projektów, 3 miesiące
| Projekt | Sub-agentów | Tokens/mies. | Oszczędność godzin |
|---|---|---|---|
| CRM dla dystrybutora | 4 | 2,8M | 38 h |
| RAG dla kancelarii | 3 | 1,9M | 22 h |
| Integracja Comarch | 6 | 4,1M | 54 h |
| Panel handlowy | 2 | 0,9M | 14 h |
| OCR faktur | 3 | 1,4M | 27 h |
| Voice IVR | 5 | 3,2M | 41 h |
Co działa naprawdę dobrze
- Code review przy commitach. Sub-agent czyta diff, raportuje. Wyłapuje 78% problemów (zmierzone vs. ludzki review).
- Test generation. Sub-agent z dostępem tylko do Read+Write generuje testy PHPUnit. Pokrycie wzrosło z 22% do 67% w 4 tygodnie.
- Migration writer. Sub-agent wyspecjalizowany w pisaniu migracji SQL pod nasz wzór z
CREATE TABLE IF NOT EXISTS. Zero kolizji w 3 miesiące. - Dokumentowanie zmian. Sub-agent czyta PR i aktualizuje wpis w internal_docs zgodnie z auto-sync rule.
Co nie działa
Trzy klasy zadań, w których sub-agenci są przegranymi:
- Eksploracja "co się dzieje w repo". Sub-agent ma węższy kontekst, więc traci szerszy obraz. Lepiej parent.
- Decyzje architektoniczne. Tu sub-agent dostaje tylko podsumowanie sytuacji i może wybrać sub-optymalnie. Zostawiamy parentowi.
- Multi-step debugging z odkrywaniem. Sub-agent kończy z "nie znalazłem" i nie pyta. Lepiej Opus 4.5 jako parent z większą cierpliwością.
Reguły, których trzymamy się od 3 miesięcy
- Sub-agent ma maks. 3 narzędzia. Więcej = parent.
- Sub-agent ma opisany w description "kiedy mnie wywołać". Parent czyta description i decyduje. Bez tego — odpalenia "na ślepo".
- Sonnet 4.5 dla sub-agentów, Opus 4.5 dla parenta. Odwrotnie = palenie pieniędzy.
- Maks. 6 sub-agentów na projekt. Wyżej — orkiestracja staje się chaotyczna.
- Raz w tygodniu czyścimy nieużywanych sub-agentów (dane z hooków).
Koszt vs. oszczędność
W 6 projektach łącznie wydaliśmy 1 380 USD na tokeny sub-agentów w 3 miesiące. Oszczędziliśmy 196 godzin pracy juniorów (ok. 14 700 zł przy stawce 75 zł/h). ROI bez dyskusji.
Następny krok
Mamy gotowy pakiet 8 sub-agentów dla projektów PHP/MySQL — wrzucamy do repo klienta jako część wdrożenia. Pokażemy na demo, jak wygląda code review przez sub-agenta w 4 minuty.
Chcesz przetestować, jak AI rozwiąże to u Ciebie?
30 minut rozmowy + pokaz działającego wdrożenia u klienta. Bez NDA.
Umów demo