Hurtownia farmaceutyczna — AI w call center B2B (47 osób, 5 mies. produkcji)
Hurtownia farmaceutyczna z 47 pracownikami obsługuje 4 200 zamówień telefonicznych miesięcznie od aptek i klinik. Wdrożenie AI w pierwszej linii call center skróciło czas odpowiedzi o 71% i zwiększyło konwersję pytanie-zamówienie o 18 pp. Pełne case study z architekturą RAG i kosztami.
Hurtownia farmaceutyczna z Mazowsza (47 osób, 280 000 SKU, 1 800 aktywnych klientów B2B aptek i klinik) wdrożyła AI w obsłudze call center w pięć miesięcy. Skala problemu: 4 200 zamówień telefonicznych miesięcznie, 18-22 sek. czas dotarcia do informacji per zapytanie, frustracja konsultantów i klientów. Po 5 miesiącach produkcji mamy jeden z najczystszych pomiarów ROI naszych wdrożeń.
Punkt wyjścia
Hurtownia działa w trudnej branży: marża cienka (1,8-4,2%), klientów dużo, każdy z indywidualnym cennikiem, każdy lek z indywidualną dostępnością (dwa magazyny, częściowo dostawy bezpośrednie od producenta). Konsultant call center w średnim zamówieniu musiał: zidentyfikować klienta, sprawdzić cennik, sprawdzić stany, sprawdzić alternatywy dla braków, sfinalizować zamówienie. Czas: 6-12 min na rozmowę, 71% wypełnienia smen pracą.
Cele wdrożenia
- Skrócić czas dotarcia konsultanta do informacji o 50%.
- Obniżyć odsetek "muszę oddzwonić" z 24% do <8%.
- Podnieść konwersję pytanie → zamówienie z 64% do 80%+.
- Zachować pełną kontrolę nad danymi (zamówienia leków = wrażliwe).
- Brak migracji do innego CRM (Comarch Optima zostaje).
Architektura
Prywatna instancja RedAI w infrastrukturze hurtowni. Stack:
- Konsultant odbiera połączenie, jego CRM ma asystenta AI w widoku.
- Asystent słucha transkrypcji (real-time, Whisper local).
- Wykrywa intencję: "pyta o cenę", "chce zamówić", "reklamuje", "anuluje".
- RAG na bazie 280k produktów + cenniki indywidualne + stany magazynowe + historia klienta.
- Asystent podpowiada w panelu konsultanta: produkty pasujące, ceny, alternatywy dla braków.
- Konsultant klika "dodaj", "zaproponuj alternatywę", "potwierdź zamówienie".
- Wszystko logowane: prompt-hash, decyzje konsultanta, wynik.
Modele w stack-u
- Whisper (local) — transkrypcja, latencja <800ms.
- Haiku 4.5 — klasyfikacja intencji, ekstrakcja produktów z transkrypcji.
- bge-m3 (local) — embeddingi katalogu, prywatność.
- Qdrant — vector DB dla 280k produktów + 14 000 dokumentów technicznych.
- Bielik 2.3 (local) — generowanie polskich opisów alternatyw.
- Sonnet 4.5 (przez RedAI proxy) — dla trudniejszych pytań technicznych.
Wyniki po 5 miesiącach
| Metryka | Przed | Po | Zmiana |
|---|---|---|---|
| Czas dotarcia do informacji | 18,4 sek. | 5,3 sek. | -71% |
| Czas rozmowy (avg) | 9,2 min | 5,8 min | -37% |
| Odsetek "oddzwonię" | 24% | 6% | -18 pp |
| Konwersja pyt. → zamówienie | 64% | 82% | +18 pp |
| Średni koszyk zamówienia | 1 840 zł | 2 110 zł | +15% |
| NPS klientów B2B | +22 | +47 | +25 pkt |
| Rotacja konsultantów | 28%/rok | 14%/rok | -14 pp |
Finanse
- Wdrożenie: 132 000 zł (jednorazowo).
- Utrzymanie: 5 800 zł/mies. (prywatna instancja, support).
- API zewn.: 480 zł/mies. (Sonnet dla trudnych przypadków).
- Oszczędność czasu konsultantów: 478 godz./mies. × 48 zł = 22 944 zł/mies.
- Dodatkowy przychód z wyższego średniego koszyka: ok. 18 200 zł/mies. (po marży).
- Spadek rotacji: ok. 14 000 zł/mies. (mniej rekrutacji i onboardingów).
- ROI: 2,4 miesiąca, potem ok. 49 000 zł/mies. nadwyżki.
Kluczowe decyzje architektoniczne
1. Whisper lokalnie — nie cloud
Transkrypcje rozmów z aptekami zawierają dane wrażliwe (nazwiska klientów, leki). Whisper hostowany lokalnie eliminuje problem RODO i daje latencję <1s. Koszt: dodatkowy serwer GPU w prywatnej instancji.
2. RAG na 280k produktów wymagał segmentacji
Pierwszy proof of concept zrzucił wszystko do jednej kolekcji Qdrant — recall@10 = 0,84. Po segmentacji na 4 kolekcje (leki Rx, OTC, suplementy, sprzęt) recall@10 = 0,93. Lekcja: domena ma znaczenie, nie wszystko do jednego worka.
3. Indywidualne cenniki przez metadata filtering
Każdy klient ma cennik. Cena wyszukiwana RAG-iem byłaby błędem. Cena pobierana z bazy po znalezieniu produktu — pewność matematyczna.
4. Konsultant zawsze decyduje
AI podpowiada, konsultant klika. Nigdy automatyczne zamówienie z AI. Klient pyta — konsultant proponuje (z podpowiedzi AI) — klient potwierdza — konsultant finalizuje. Pełna kontrola, audyt każdej decyzji.
Pułapki, które zobaczyliśmy
- Halucynacje stanów magazynowych — pierwszy tydzień AI "wymyślało" dostępność. Naprawa: stany pobierane z bazy live, nie z embeddingu.
- Polskie nazwy leków — końcówki, skróty (np. "polopiryna" vs "Polopiryna S"). Tuning embeddingu + alias-table.
- Klienci kwestionowali ceny — gdy konsultant podawał cenę z AI, klient czasem dostawał wcześniej inną. Naprawa: ceny tylko z systemu, AI nie podaje cen.
- Konsultanci sceptyczni pierwsze 2 tyg. — czuli "AI mnie zastąpi". Po miesiącu — entuzjazm, bo praca lżejsza.
- Onboarding zajął więcej niż planowaliśmy — 18 dni zamiast 10. 47 osób to nie 12.
Co rozszerzamy w 2026
- Predykcja popytu na poziomie SKU (forecasting AI).
- Automatyczne sugerowanie cross-sellingu dla klientów (na podst. historii).
- AI w obsłudze e-mailowej (ten sam stack, inny kanał).
- Bot na stronie B2B do drobnych zamówień bez konsultanta.
Lessons learned dla podobnych branż
- Call center B2B + RAG = jedno z najsilniejszych use case dla AI w 2025.
- Lokalna prywatna instancja kluczowa dla danych klientów branżowych.
- RAG wymaga segmentacji domenowej, nie "wszystko do jednego worka".
- Ceny i stany z bazy, opis i alternatywy z AI.
- Konsultant decyduje, AI sugeruje. Bez wyjątków.
- Mierzcie NPS klientów, nie tylko czas — to argument dla zarządu.
Podsumowanie
Hurtownia z Mazowsza to dziś nasza referencja "jak wdrożyć AI w call center B2B z setkami tysięcy SKU". Pipeline replikowany u kolejnych klientów branż hurtowych, dystrybucji, e-commerce z dużym katalogiem. Pokażemy wam workflow dopasowany do waszej skali i branży — 45 min demo, konkretne liczby.
Chcesz przetestować, jak AI rozwiąże to u Ciebie?
30 minut rozmowy + pokaz działającego wdrożenia u klienta. Bez NDA.
Umów demo