Modele

Claude Haiku 4.5 po 2 miesiącach — czy zasługuje na produkcję

Anthropic wypuścił Haiku 4.5 w październiku 2025. Przez 2 miesiące używamy go w 9 zadaniach: routing, klasyfikacja, OCR, ekstrakcja danych. Tutaj liczby — gdzie zastępuje Sonneta bez utraty jakości, a gdzie nie warto oszczędzać.

⏱ 7 min czytania · 📅 15.12.2025 · 👁 584 wyświetleń

Claude Haiku 4.5 pojawił się na rynku 15 października 2025. Po 2 miesiącach w produkcji u naszych klientów mamy konkretne liczby: gdzie wygrywa z Sonnetem 4.5 (bo jest tańszy i wystarczająco dobry), a gdzie nie warto oszczędzać. Przetestowaliśmy go w 9 typach zadań na łącznie 2,4 miliona requestów.

Czym jest Haiku 4.5

To najlżejszy model z rodziny Claude 4.5. Kosztuje 0,80 USD za 1M tokenów input (vs. 3 USD Sonneta i 15 USD Opusa). Latencja 3-4x niższa niż Sonnet. Kontekst 200k tokenów. Anthropic pozycjonuje go jako "default for high-volume" — i to dobra rama.

Co się zmieniło wobec Haiku 3.5

  • +34% accuracy w klasyfikacji (wewnętrzny benchmark naszych projektów)
  • +19% w extraction tasks (CV, faktury, oferty)
  • Tool use 4.5x lepszy — pierwszy Haiku, który nadaje się do routera w pipeline
  • Polski język bez "obcego akcentu" w stylu (problem 3.5)

9 zadań w 2 miesiące

ZadanieRequestówHaiku vs SonnetDecyzja
Klasyfikacja maili przychodzących318 00097% accuracy vs 98%Haiku
OCR + ekstrakcja faktur112 00091% vs 96%Sonnet
Routing zapytań do agentów89 00094% vs 95%Haiku
Tagging dokumentów234 00089% vs 93%Haiku
Generacja podsumowań spotkań4 20072% vs 91%Sonnet
Pierwsza linia chatbota156 00088% vs 92%Haiku
Tłumaczenia PL-EN43 00087% vs 95%Sonnet
Ekstrakcja danych z CV28 00093% vs 95%Haiku
Generacja kodu11 00061% vs 89%Sonnet

Zasada router-first

Najmocniej Haiku 4.5 sprawdza się w wzorcu router-first: tania pierwsza linia, która klasyfikuje zapytanie i deleguje. 70% zapytań kończy się na Haiku, 25% przechodzi do Sonneta, 5% do Opusa.

Wzorzec routingu

def route_request(prompt):
    # Haiku decyduje, czy zadanie jest "simple"
    classification = haiku.classify(prompt, categories=[
        "simple_lookup", "complex_reasoning", "code_generation"
    ])
    if classification == "simple_lookup":
        return haiku.complete(prompt)
    elif classification == "complex_reasoning":
        return sonnet.complete(prompt)
    else:
        return opus.complete(prompt)

U naszego klienta w branży B2B wdrożyliśmy ten router 12 listopada. Średni koszt requestu spadł z 0,043 USD do 0,011 USD. Latencja P95 z 4,2s do 1,1s.

Gdzie Haiku zawodzi

  • Generacja kodu — 61% accuracy. Nie warto, nawet jeśli "tani". Bugi kosztują więcej.
  • Złożone tłumaczenia — straci niuanse, szczególnie w prawie i marketingu.
  • Długie podsumowania — zapomina o szczegółach z połowy kontekstu.
  • Tabele i strukturyzowane dane — zdarzają się halucynacje numerów.

Rekomendacja

Haiku 4.5 to default dla high-volume klasyfikacji, routingu i ekstrakcji typowych pól. Sonnet 4.5 zostaje dla "myślenia". Opus 4.5 dla orchestracji multi-step. To trójca, której trzymamy się od listopada we wszystkich nowych wdrożeniach.

Pokażemy, jak ułożyć routing 3-modelowy w waszym workflow. To zwykle 1-2 dni pracy i 4-6x niższy rachunek.

Chcesz przetestować, jak AI rozwiąże to u Ciebie?

30 minut rozmowy + pokaz działającego wdrożenia u klienta. Bez NDA.

Umów demo

Może Cię też zainteresować

Newsletter redai

Dostawaj kolejne wpisy do skrzynki

Co dwa tygodnie: nowy case, nowe moduły AI, błędy klientów. Bez spamu.