Wpisy o AI, których nie ma w polskich książkach.
Piszemy o tym, co realnie robimy w firmach klientów: hooks Claude, MCP, RAG, ROI, bezpieczeństwo, compliance. Bez teorii — z liczbami z wdrożeń.
RAG w 2026 — graf wiedzy, agentic retrieval czy zwykłe wektory
RAG w 2026 nie jest już prostym "wektor + LLM". Agentic retrieval, knowledge graphs, hybrid search — co wybrać dla swojej firmy. Praktyczny …
RAG na wewnętrznych dokumentach — jak to robimy bez wycieku do chmury
Retrieval-Augmented Generation na umowach, regulaminach, wiedzy z Confluence — wszystko w prywatnej instancji RedAI. Bez OpenAI, bez Pinecon…
Hooks w Claude — czym są, po co i co bez nich nie zadziała
Hooks w Claude to mechanizm, dzięki któremu prywatna instancja RedAI przechodzi audyt NIS2 i KSC. SessionStart, PreToolUse, PostToolUse, Ses…
MCP — Model Context Protocol. Co to, czemu zmienia integracje AI
Model Context Protocol (MCP) — standard wprowadzony przez Anthropic w grudniu 2024, dojrzewa w 2026. Co to jest, jak to działa, czy warto pr…
Multi-tenancy w prywatnej instancji AI — architektura dla zespołów
Jak obsłużyć 15 zespołów wewnętrznych w jednej prywatnej instancji AI — z separacją danych, kontrolą kosztów per zespół i własnymi promptami…
MCP servers w produkcji — 6 wdrożeń RedAI po 4 miesiącach
Model Context Protocol weszedł do naszych wdrożeń w październiku 2025. Po 4 miesiącach na produkcji w 6 firmach mamy konkretne wnioski: gdzi…
Fine-tuning vs RAG vs prompt engineering — kiedy co (2026 update)
Po 47 wdrożeniach mamy twardą regułę: 90% problemów rozwiązuje dobry prompt z dobrym kontekstem, 8% wymaga RAG, 2% naprawdę potrzebuje fine-…
Voice AI w call center — ElevenLabs vs OpenAI Voice. Test produkcyjny
Dwa pilote w polskich call centerach: ElevenLabs Conversational + OpenAI Voice. Cel: przyjmowanie standardowych zapytań klientów, eskalacja …
Long-context RAG — wykorzystanie 1M+ kontekstu modeli
Modele 2026 oferują 1-2M tokenów kontekstu. Czy to oznacza koniec RAG? Nie. To oznacza nową architekturę: hybrydę long-context + retrieval. …
LangChain vs LangGraph — kiedy które, decyzja dla polskiego zespołu
LangChain to dziś wzorzec dla większości tutoriali AI. LangGraph (od tych samych autorów) to nowsza biblioteka skupiona na agentach z grafem…
Multimodal RAG — kiedy potrzeba, jak wdrożyć w polskiej firmie
Klasyczny RAG działa na tekście. Multimodal RAG dorzuca obrazy, tabele, wykresy, schematy. Dla firm, które mają w dokumentach więcej niż tek…
Embedding modele dla polskich tekstów — benchmark dla wdrożeń RAG
Wybór modelu embeddingowego decyduje o jakości RAG bardziej niż wybór bazy wektorowej. Dla polskich tekstów to nietrywialne — większość benc…
Vector DB w 2025 — Qdrant vs Weaviate vs pgvector dla polskiej firmy
Wybór bazy wektorowej to dziś dla większości polskich firm pytanie nie "którego dostawcę chmury", tylko "Qdrant, Weaviate czy pgvector". Po …