Wpisy o AI, których nie ma w polskich książkach.
Piszemy o tym, co realnie robimy w firmach klientów: hooks Claude, MCP, RAG, ROI, bezpieczeństwo, compliance. Bez teorii — z liczbami z wdrożeń.
Gemini 3.5 Flash i pivot Google na agentów — co to znaczy dla biznesu
Na Google I/O 2026 (19 maja) Google ogłosił Gemini 3.5 Flash jako "agentowy" model. Pivot z chatbotów na agenty wykonujące zadania — co to z…
Claude Opus 4.7 — co zmienia dla polskich firm wdrażających AI
Anthropic wypuścił Opus 4.7 w kwietniu 2026. Krótszy czas odpowiedzi, lepsze rozumowanie w polskim, niższa cena za token wyjścia. Sprawdzamy…
GPT-5.1 w lutym 2026 — test na polskich zadaniach biznesowych
OpenAI wydał GPT-5.1 w pierwszym tygodniu lutego. Przebiegliśmy go przez nasz standardowy zestaw 8 zadań na polskich danych: streszczenia ra…
Claude Opus 4.6 — co naprawdę zmienia w pracy polskich zespołów
Anthropic wypuścił Claude Opus 4.6 w pierwszej dekadzie lutego. Przerobiliśmy go przez 11 realnych zadań z naszych wdrożeń: analiza umów, ek…
DeepSeek R2 — zapowiedzi i przecieki, co wiemy w lutym 2026
DeepSeek zapowiedział wydanie R2 na marzec 2026 — następcę modelu R1, który w 2025 zmienił rynek kosztów inferencji. Zbieramy w jednym miejs…
DeepSeek V4 / R2 — co wiadomo na styczeń 2026
DeepSeek w styczniu 2026 zapowiada V4 i nowy reasoning model R2 (premiera spodziewana w marcu). Polskie firmy pytają: czy warto czekać, czy …
Gemini 3 Pro — co się zmieniło w grudniowych update
Google w grudniu 2025 podbiło Gemini 3 Pro — context 2M, lepsze multimodal i polski model card. Sprawdziliśmy w 3 zadaniach, gdzie ma przewa…
Claude Haiku 4.5 po 2 miesiącach — czy zasługuje na produkcję
Anthropic wypuścił Haiku 4.5 w październiku 2025. Przez 2 miesiące używamy go w 9 zadaniach: routing, klasyfikacja, OCR, ekstrakcja danych. …
Claude Opus 4.5 — premiera grudnia 2025. Co zmienia dla polskich firm
Anthropic wypuścił Claude Opus 4.5 z trybem agentic-first, sub-agentami w SDK i kontekstem 1M tokenów. Przetestowaliśmy go na 4 realnych zad…
Gemini 3 Pro — premiera i pierwsza analiza w polskim biznesie
Google wypuścił Gemini 3 Pro 18 listopada 2025 jako odpowiedź na Claude Sonnet 4.5 i GPT-5. Mamy 48 godzin testów na pełnym benchmarku RedAI…
Claude Haiku 4.5 — light model, który zaskoczył benchmarkami
Anthropic wypuścił Claude Haiku 4.5 15 października 2025 jako "small, fast, cheap" model do zadań wolumenowych. Niespodzianka: w niektórych …
Claude Sonnet 4.5 — premiera i pierwsza analiza w polskich firmach
Anthropic wypuścił Claude Sonnet 4.5 29 września 2025 jako najmocniejszy model do agentic coding i complex agents. Jeden z najważniejszych r…
GPT-5 po dwóch miesiącach — co się sprawdziło w polskich wdrożeniach, co nie
OpenAI wypuścił GPT-5 w sierpniu 2025 z dużą fanfarą. Po 60 dniach mamy 23 produkcyjne wdrożenia u polskich klientów i twarde dane: gdzie GP…
Claude Opus 4.1 miesiąc po premierze — co się sprawdziło w polskich firmach
Anthropic wypuścił Claude Opus 4.1 w sierpniu 2025. Po czterech tygodniach mamy 18 wdrożeń u polskich klientów (kancelarie, biura księgowe, …
Claude Opus 4.1 — co zmienia drobna aktualizacja sierpniowa
Anthropic 5 sierpnia 2025 wydało Claude Opus 4.1 — drobną aktualizację rodziny Claude 4. Numer "4.1" sugeruje minor update, ale w naszych te…
GPT-5 — pierwsze 72 godziny w naszych testach
OpenAI wydało GPT-5 7 sierpnia 2025. W ciągu 72 godzin uruchomiliśmy go na pięciu wewnętrznych testach RedAI — segregacja maili, generowanie…
DeepSeek V3 i R1 — gdzie się sprawdzają w polskich firmach
DeepSeek V3 (grudzień 2024) i DeepSeek R1 (styczeń 2025) zrewolucjonizowały rozumienie cen w świecie LLM. R1 jako pierwszy open-weights mode…
Mistral Magistral — pierwszy europejski model rozumowania w polskich testach
Mistral AI w czerwcu 2025 wypuściło Magistral Small (24B, open weights) i Magistral Medium (przez API). To pierwsza europejska próba modelu …
Claude Opus 4 — pierwsze tygodnie w polskich wdrożeniach
Anthropic wydało Claude Opus 4 i Sonnet 4 pod koniec maja 2025. Po trzech tygodniach intensywnych testów na realnych dokumentach klientów — …