Claude Haiku 4.5 po 2 miesiącach — czy zasługuje na produkcję
Anthropic wypuścił Haiku 4.5 w październiku 2025. Przez 2 miesiące używamy go w 9 zadaniach: routing, klasyfikacja, OCR, ekstrakcja danych. Tutaj liczby — gdzie zastępuje Sonneta bez utraty jakości, a gdzie nie warto oszczędzać.
Claude Haiku 4.5 pojawił się na rynku 15 października 2025. Po 2 miesiącach w produkcji u naszych klientów mamy konkretne liczby: gdzie wygrywa z Sonnetem 4.5 (bo jest tańszy i wystarczająco dobry), a gdzie nie warto oszczędzać. Przetestowaliśmy go w 9 typach zadań na łącznie 2,4 miliona requestów.
Czym jest Haiku 4.5
To najlżejszy model z rodziny Claude 4.5. Kosztuje 0,80 USD za 1M tokenów input (vs. 3 USD Sonneta i 15 USD Opusa). Latencja 3-4x niższa niż Sonnet. Kontekst 200k tokenów. Anthropic pozycjonuje go jako "default for high-volume" — i to dobra rama.
Co się zmieniło wobec Haiku 3.5
- +34% accuracy w klasyfikacji (wewnętrzny benchmark naszych projektów)
- +19% w extraction tasks (CV, faktury, oferty)
- Tool use 4.5x lepszy — pierwszy Haiku, który nadaje się do routera w pipeline
- Polski język bez "obcego akcentu" w stylu (problem 3.5)
9 zadań w 2 miesiące
| Zadanie | Requestów | Haiku vs Sonnet | Decyzja |
|---|---|---|---|
| Klasyfikacja maili przychodzących | 318 000 | 97% accuracy vs 98% | Haiku |
| OCR + ekstrakcja faktur | 112 000 | 91% vs 96% | Sonnet |
| Routing zapytań do agentów | 89 000 | 94% vs 95% | Haiku |
| Tagging dokumentów | 234 000 | 89% vs 93% | Haiku |
| Generacja podsumowań spotkań | 4 200 | 72% vs 91% | Sonnet |
| Pierwsza linia chatbota | 156 000 | 88% vs 92% | Haiku |
| Tłumaczenia PL-EN | 43 000 | 87% vs 95% | Sonnet |
| Ekstrakcja danych z CV | 28 000 | 93% vs 95% | Haiku |
| Generacja kodu | 11 000 | 61% vs 89% | Sonnet |
Zasada router-first
Najmocniej Haiku 4.5 sprawdza się w wzorcu router-first: tania pierwsza linia, która klasyfikuje zapytanie i deleguje. 70% zapytań kończy się na Haiku, 25% przechodzi do Sonneta, 5% do Opusa.
Wzorzec routingu
def route_request(prompt):
# Haiku decyduje, czy zadanie jest "simple"
classification = haiku.classify(prompt, categories=[
"simple_lookup", "complex_reasoning", "code_generation"
])
if classification == "simple_lookup":
return haiku.complete(prompt)
elif classification == "complex_reasoning":
return sonnet.complete(prompt)
else:
return opus.complete(prompt)
U naszego klienta w branży B2B wdrożyliśmy ten router 12 listopada. Średni koszt requestu spadł z 0,043 USD do 0,011 USD. Latencja P95 z 4,2s do 1,1s.
Gdzie Haiku zawodzi
- Generacja kodu — 61% accuracy. Nie warto, nawet jeśli "tani". Bugi kosztują więcej.
- Złożone tłumaczenia — straci niuanse, szczególnie w prawie i marketingu.
- Długie podsumowania — zapomina o szczegółach z połowy kontekstu.
- Tabele i strukturyzowane dane — zdarzają się halucynacje numerów.
Rekomendacja
Haiku 4.5 to default dla high-volume klasyfikacji, routingu i ekstrakcji typowych pól. Sonnet 4.5 zostaje dla "myślenia". Opus 4.5 dla orchestracji multi-step. To trójca, której trzymamy się od listopada we wszystkich nowych wdrożeniach.
Pokażemy, jak ułożyć routing 3-modelowy w waszym workflow. To zwykle 1-2 dni pracy i 4-6x niższy rachunek.
Chcesz przetestować, jak AI rozwiąże to u Ciebie?
30 minut rozmowy + pokaz działającego wdrożenia u klienta. Bez NDA.
Umów demo