Agentic patterns — ReAct, Plan-and-Execute, Reflexion w polskich wdrożeniach
Trzy wzorce projektowe dominują w 2025 w budowie agentów AI: ReAct, Plan-and-Execute, Reflexion. Każdy do innego scenariusza. Pokazujemy na konkretnych polskich wdrożeniach, kiedy wybrać który, z liczbami sukcesów i pułapek implementacyjnych.
Agentic patterns to dziś nie ezoteryczna teoria, tylko codzienność polskich zespołów wdrażających AI. Po 23 produkcyjnych wdrożeniach RedAI mamy mapę: gdzie ReAct, gdzie Plan-and-Execute, gdzie Reflexion. Ten artykuł to przewodnik decyzyjny z konkretnymi przykładami z polskich firm. Bez teorii akademickiej — praktyka.
Trzy wzorce w skrócie
- ReAct (Reasoning + Acting) — agent myśli krok po kroku, na każdym kroku może wywołać narzędzie. Iteracja Thought → Action → Observation → Thought ... Najprostszy, najtańszy.
- Plan-and-Execute — agent najpierw układa plan (wszystkie kroki), potem wykonuje. Może mieć plannera i executora jako oddzielne instancje. Lepszy dla zadań strukturalnych.
- Reflexion — agent po każdym wyniku ocenia, czy zrobił dobrze. Jeśli nie — próbuje ponownie z poprawioną strategią. Najdroższy, ale dla zadań krytycznych jakościowo.
Macierz decyzyjna
| Cecha | ReAct | Plan-Execute | Reflexion |
|---|---|---|---|
| Krytyczność jakości | średnia | wysoka | krytyczna |
| Liczba kroków | 2-5 | 5-15 | 3-10 |
| Koszt tokenów (relatywnie) | 1x | 1,4x | 2,3x |
| Latencja | niska | średnia | wysoka |
| Sukces (avg, nasze wdrożenia) | 78% | 87% | 93% |
| Najlepszy use case | chatbot z narzędziami | raport, analiza | krytyczna decyzja |
ReAct w praktyce — chatbot hurtowni
Klient: hurtownia farmaceutyczna, asystent dla call center B2B. Workflow: klient pyta "czy macie X", agent szuka w katalogu (narzędzie), patrzy stany magazynowe (narzędzie), sprawdza cenę dla danego klienta (narzędzie), odpowiada.
Kiedy ReAct wystarcza
- Zadanie krótkie, niewielka liczba narzędzi (3-7).
- Jakość "good enough" — 78% sukces wystarcza.
- Koszt i latencja są priorytetem.
- Mamy fallback do człowieka.
Plan-and-Execute — raport sprzedażowy
Klient: SaaS B2B, automatyczne raporty miesięczne dla 41 klientów. Workflow: planner układa kroki (zaciągnij dane, agreguj, porównaj rok do roku, generuj wykresy, wygeneruj komentarz), potem executor wykonuje. Każdy krok niezależnie.
Architektura Plan-and-Execute
# Pseudokod — uproszczony
def plan_and_execute(task):
plan = planner.create_plan(task) # Sonnet 4.5
results = []
for step in plan.steps:
result = executor.run(step, context=results) # Haiku 4.5
results.append(result)
return synthesizer.compose(task, results) # Sonnet 4.5
Kiedy Plan-and-Execute wygrywa
- Zadanie multi-step (5+ kroków).
- Plan można policzyć z góry (nie zależy od wyników pośrednich).
- Możliwa paralelizacja kroków (50% naszych planów ma niezależne gałęzie).
- Audyt: plan widać przed wykonaniem, można go zaakceptować.
Reflexion — analiza umów (kancelaria)
Klient: kancelaria (ta sama, którą opisywaliśmy w innym case study). Workflow analizy klauzuli ryzyka: agent identyfikuje ryzyko, ocenia własną pewność, jeśli <0,85 — sprawdza precedensy, rewiduje opinię, znów ocenia. Loop max 3 iteracje.
Kiedy Reflexion jest warta swojej ceny
- Konsekwencje błędu kosztują >10x koszt iteracji Reflexion.
- Mamy dobry "self-evaluator" — model umie ocenić własną odpowiedź.
- Czas nie jest krytyczny (sekundy, nie milisekundy).
- Jakość 93% sukces jest warta 2,3x kosztu.
Antywzorce — czego unikać
- Reflexion dla wszystkiego — drogo, wolno, niepotrzebnie. Trzymaj dla 10-20% workflow.
- ReAct dla raportów — agent gubi się przy długich łańcuchach, Plan-and-Execute lepiej.
- Plan-and-Execute dla chat-u — opóźnienie odpowiedzi zabija UX.
- Mieszanie wzorców w jednym agencie — wybierz jeden, trzymaj się go.
Praktyczne wskazówki implementacyjne
- Loguj każdy krok agenta — to fundamentalne dla debug i audytu.
- Limit kroków twardy — Reflexion z 3+ pętlami często wpada w nieskończoność.
- Timeout per step — 30s max, długie kroki to czerwona flaga.
- Cost guard — abort, gdy koszt przekracza próg dla pojedynczego zadania.
- Human-in-the-loop dla zadań krytycznych.
Mix wzorców w produkcji RedAI
W naszych 23 produkcyjnych wdrożeniach rozkład: 11 × ReAct (chatboty, asystenci), 8 × Plan-and-Execute (raporty, analizy, generowanie dokumentów), 4 × Reflexion (krytyczne decyzje prawne, finansowe). 60% wartości daje ReAct, ale Reflexion to najwyższy ROI dla high-stakes.
Podsumowanie
Wybór wzorca = wybór kompromisu jakość ↔ koszt ↔ latencja. Polski biznes 2025 najczęściej wybiera ReAct dla MVP, Plan-and-Execute dla raportów, Reflexion dla krytycznych decyzji. Pokażemy wam mapę decyzyjną dla waszych konkretnych workflow.
Chcesz przetestować, jak AI rozwiąże to u Ciebie?
30 minut rozmowy + pokaz działającego wdrożenia u klienta. Bez NDA.
Umów demo