RAG w 2026 — graf wiedzy, agentic retrieval czy zwykłe wektory
RAG w 2026 nie jest już prostym "wektor + LLM". Agentic retrieval, knowledge graphs, hybrid search — co wybrać dla swojej firmy. Praktyczny przewodnik.
"Zróbcie nam RAG-a na naszych dokumentach" — to jedno z najczęstszych zleceń, które dostajemy. W 2024 odpowiedź była prosta: embeddingi + vector DB + Claude. W 2026 to nie wystarcza — wymagania klientów rosną, modele się zmieniają, pojawia się agentic retrieval. Co wybrać?
Pięć podejść do RAG-a w 2026
1. Klasyczny RAG (wektor + LLM)
Tekst → embedding → zapis w vector DB → wyszukiwanie semantyczne → top-K → LLM. Działa do prostych pytań na małym zbiorze (do ~50k stron).
- ✓ Tani i prosty
- ✗ Słaba dokładność przy dużych zbiorach
- ✗ Nie rozumie "jakie są relacje między X a Y"
- ✗ Halucynuje, gdy odpowiedź wymaga połączenia 5+ źródeł
2. Hybrid search (wektor + BM25/keyword)
Wektor + tradycyjne wyszukiwanie po słowach kluczowych, scoring ważony. Lepsze wyniki dla pytań ze specyficznym słownictwem (nazwy własne, numery faktur, kody produktów).
3. Late chunking + reranking
Chunkujemy dopiero po embeddingu całego dokumentu (lub dużych kawałków), używamy rerankera (np. Cohere Rerank 3, BGE) — top 100 z wektora, reranker wybiera top 5. Dokładność rośnie o 20-40%.
4. Knowledge graph + RAG (GraphRAG)
Buduemy graf encji (firmy, osoby, produkty, faktury) na podstawie dokumentów. LLM ma dostęp zarówno do tekstu jak i grafu. Wygrywa przy pytaniach relacyjnych: "kto rozmawiał z Janem w sprawie projektu X w ostatnich 3 miesiącach".
5. Agentic RAG / dynamic retrieval
LLM sam decyduje, co i ile razy zapytać. Może zrobić 3-5 zapytań wektorowych, czytać dokumenty, generować doprecyzowujące pytania. Najwyższa dokładność, najwyższy koszt.
Macierz decyzji — co wybrać
| Sytuacja | Co wybrać |
|---|---|
| FAQ na stronie firmy | Klasyczny RAG |
| Polityki HR, instrukcje wewnętrzne (do 5k stron) | Hybrid search |
| Baza klientów + historia komunikacji | GraphRAG |
| Bazy umów, kontraktów, opinii prawnych | Late chunking + reranking |
| Centrum wiedzy techniczne (dokumentacja, ticketing) | Agentic RAG |
| Audyt księgowy (faktury + księgi + przepisy) | GraphRAG + Agentic |
Konkretny przykład: kancelaria 30 prawników
Kancelaria miała problem: 10 lat opinii prawnych (45 tys. dokumentów). Klient pyta "czy mieliśmy podobną sprawę?", odpowiedź potrafi zająć dzień (junior szuka, sennior weryfikuje).
Pierwsza próba (2024): klasyczny RAG
Wektor + Claude. Wyniki "ok", ale 30-40% pytań źle dopasowane — bo prawo polskie wymaga znalezienia analogii, nie podobieństwa tekstowego.
Druga próba (2025): hybrid search
Lepiej w wyszukiwaniu po sygnaturach, numerach kodeksów. Ale nadal nie rozumie "tej samej sytuacji w innym ubraniu prawnym".
Wersja produkcyjna (2026): GraphRAG + Agentic
Zbudowaliśmy graf: opinie → klienci → branże → kodeksy → przepisy → analogie. Agent zadaje serie pytań do grafu i wektora. 92% trafność na zbiorze testowym, czas znalezienia: 30 sekund.
Cena vs jakość
| Wariant | Koszt wdrożenia | Operacja /mc | Trafność |
|---|---|---|---|
| Klasyczny RAG | 8-15 tys. zł | 500-1500 zł | ~60% |
| Hybrid + Reranker | 15-25 tys. zł | 1000-2500 zł | ~75% |
| GraphRAG | 35-60 tys. zł | 2000-4500 zł | ~85% |
| Agentic RAG | 50-90 tys. zł | 3500-7000 zł | ~92% |
Czego unikać
- "Wrzucamy wszystko do wektora i jakoś się złoży" — przy 100k+ dokumentów to się sypie. Trzeba mieć strategię chunkowania, metadanych, filtrowania.
- RAG bez ewaluacji — bez datasetu testowego nie wiecie, czy system działa. To pierwsze 1-2 tygodnie projektu — zbudować zestaw 50-100 pytań z poprawnymi odpowiedziami.
- RAG z prywatnymi danymi w publicznym vector DB — kontrolujcie, gdzie dane leżą (Pinecone, Weaviate, Qdrant — różnią się hostingiem i RODO).
Audytujemy istniejące RAG-i, mierzymy trafność, rekomendujemy ulepszenia. Robimy też wdrożenia od zera. 30-min konsultacja darmowa — pokażemy konkretne dane z innych projektów.
Chcesz przetestować, jak AI rozwiąże to u Ciebie?
30 minut rozmowy + pokaz działającego wdrożenia u klienta. Bez NDA.
Umów demo