Praktyka

Hurtownia farmaceutyczna — AI w call center B2B (47 osób, 5 mies. produkcji)

Hurtownia farmaceutyczna z 47 pracownikami obsługuje 4 200 zamówień telefonicznych miesięcznie od aptek i klinik. Wdrożenie AI w pierwszej linii call center skróciło czas odpowiedzi o 71% i zwiększyło konwersję pytanie-zamówienie o 18 pp. Pełne case study z architekturą RAG i kosztami.

⏱ 9 min czytania · 📅 28.11.2025 · 👁 1 343 wyświetleń

Hurtownia farmaceutyczna z Mazowsza (47 osób, 280 000 SKU, 1 800 aktywnych klientów B2B aptek i klinik) wdrożyła AI w obsłudze call center w pięć miesięcy. Skala problemu: 4 200 zamówień telefonicznych miesięcznie, 18-22 sek. czas dotarcia do informacji per zapytanie, frustracja konsultantów i klientów. Po 5 miesiącach produkcji mamy jeden z najczystszych pomiarów ROI naszych wdrożeń.

Punkt wyjścia

Hurtownia działa w trudnej branży: marża cienka (1,8-4,2%), klientów dużo, każdy z indywidualnym cennikiem, każdy lek z indywidualną dostępnością (dwa magazyny, częściowo dostawy bezpośrednie od producenta). Konsultant call center w średnim zamówieniu musiał: zidentyfikować klienta, sprawdzić cennik, sprawdzić stany, sprawdzić alternatywy dla braków, sfinalizować zamówienie. Czas: 6-12 min na rozmowę, 71% wypełnienia smen pracą.

Cele wdrożenia

  • Skrócić czas dotarcia konsultanta do informacji o 50%.
  • Obniżyć odsetek "muszę oddzwonić" z 24% do <8%.
  • Podnieść konwersję pytanie → zamówienie z 64% do 80%+.
  • Zachować pełną kontrolę nad danymi (zamówienia leków = wrażliwe).
  • Brak migracji do innego CRM (Comarch Optima zostaje).

Architektura

Prywatna instancja RedAI w infrastrukturze hurtowni. Stack:

  1. Konsultant odbiera połączenie, jego CRM ma asystenta AI w widoku.
  2. Asystent słucha transkrypcji (real-time, Whisper local).
  3. Wykrywa intencję: "pyta o cenę", "chce zamówić", "reklamuje", "anuluje".
  4. RAG na bazie 280k produktów + cenniki indywidualne + stany magazynowe + historia klienta.
  5. Asystent podpowiada w panelu konsultanta: produkty pasujące, ceny, alternatywy dla braków.
  6. Konsultant klika "dodaj", "zaproponuj alternatywę", "potwierdź zamówienie".
  7. Wszystko logowane: prompt-hash, decyzje konsultanta, wynik.

Modele w stack-u

  • Whisper (local) — transkrypcja, latencja <800ms.
  • Haiku 4.5 — klasyfikacja intencji, ekstrakcja produktów z transkrypcji.
  • bge-m3 (local) — embeddingi katalogu, prywatność.
  • Qdrant — vector DB dla 280k produktów + 14 000 dokumentów technicznych.
  • Bielik 2.3 (local) — generowanie polskich opisów alternatyw.
  • Sonnet 4.5 (przez RedAI proxy) — dla trudniejszych pytań technicznych.

Wyniki po 5 miesiącach

MetrykaPrzedPoZmiana
Czas dotarcia do informacji18,4 sek.5,3 sek.-71%
Czas rozmowy (avg)9,2 min5,8 min-37%
Odsetek "oddzwonię"24%6%-18 pp
Konwersja pyt. → zamówienie64%82%+18 pp
Średni koszyk zamówienia1 840 zł2 110 zł+15%
NPS klientów B2B+22+47+25 pkt
Rotacja konsultantów28%/rok14%/rok-14 pp

Finanse

  • Wdrożenie: 132 000 zł (jednorazowo).
  • Utrzymanie: 5 800 zł/mies. (prywatna instancja, support).
  • API zewn.: 480 zł/mies. (Sonnet dla trudnych przypadków).
  • Oszczędność czasu konsultantów: 478 godz./mies. × 48 zł = 22 944 zł/mies.
  • Dodatkowy przychód z wyższego średniego koszyka: ok. 18 200 zł/mies. (po marży).
  • Spadek rotacji: ok. 14 000 zł/mies. (mniej rekrutacji i onboardingów).
  • ROI: 2,4 miesiąca, potem ok. 49 000 zł/mies. nadwyżki.

Kluczowe decyzje architektoniczne

1. Whisper lokalnie — nie cloud

Transkrypcje rozmów z aptekami zawierają dane wrażliwe (nazwiska klientów, leki). Whisper hostowany lokalnie eliminuje problem RODO i daje latencję <1s. Koszt: dodatkowy serwer GPU w prywatnej instancji.

2. RAG na 280k produktów wymagał segmentacji

Pierwszy proof of concept zrzucił wszystko do jednej kolekcji Qdrant — recall@10 = 0,84. Po segmentacji na 4 kolekcje (leki Rx, OTC, suplementy, sprzęt) recall@10 = 0,93. Lekcja: domena ma znaczenie, nie wszystko do jednego worka.

3. Indywidualne cenniki przez metadata filtering

Każdy klient ma cennik. Cena wyszukiwana RAG-iem byłaby błędem. Cena pobierana z bazy po znalezieniu produktu — pewność matematyczna.

4. Konsultant zawsze decyduje

AI podpowiada, konsultant klika. Nigdy automatyczne zamówienie z AI. Klient pyta — konsultant proponuje (z podpowiedzi AI) — klient potwierdza — konsultant finalizuje. Pełna kontrola, audyt każdej decyzji.

Pułapki, które zobaczyliśmy

  1. Halucynacje stanów magazynowych — pierwszy tydzień AI "wymyślało" dostępność. Naprawa: stany pobierane z bazy live, nie z embeddingu.
  2. Polskie nazwy leków — końcówki, skróty (np. "polopiryna" vs "Polopiryna S"). Tuning embeddingu + alias-table.
  3. Klienci kwestionowali ceny — gdy konsultant podawał cenę z AI, klient czasem dostawał wcześniej inną. Naprawa: ceny tylko z systemu, AI nie podaje cen.
  4. Konsultanci sceptyczni pierwsze 2 tyg. — czuli "AI mnie zastąpi". Po miesiącu — entuzjazm, bo praca lżejsza.
  5. Onboarding zajął więcej niż planowaliśmy — 18 dni zamiast 10. 47 osób to nie 12.

Co rozszerzamy w 2026

  • Predykcja popytu na poziomie SKU (forecasting AI).
  • Automatyczne sugerowanie cross-sellingu dla klientów (na podst. historii).
  • AI w obsłudze e-mailowej (ten sam stack, inny kanał).
  • Bot na stronie B2B do drobnych zamówień bez konsultanta.

Lessons learned dla podobnych branż

  • Call center B2B + RAG = jedno z najsilniejszych use case dla AI w 2025.
  • Lokalna prywatna instancja kluczowa dla danych klientów branżowych.
  • RAG wymaga segmentacji domenowej, nie "wszystko do jednego worka".
  • Ceny i stany z bazy, opis i alternatywy z AI.
  • Konsultant decyduje, AI sugeruje. Bez wyjątków.
  • Mierzcie NPS klientów, nie tylko czas — to argument dla zarządu.

Podsumowanie

Hurtownia z Mazowsza to dziś nasza referencja "jak wdrożyć AI w call center B2B z setkami tysięcy SKU". Pipeline replikowany u kolejnych klientów branż hurtowych, dystrybucji, e-commerce z dużym katalogiem. Pokażemy wam workflow dopasowany do waszej skali i branży — 45 min demo, konkretne liczby.

Chcesz przetestować, jak AI rozwiąże to u Ciebie?

30 minut rozmowy + pokaz działającego wdrożenia u klienta. Bez NDA.

Umów demo

Może Cię też zainteresować

Newsletter redai

Dostawaj kolejne wpisy do skrzynki

Co dwa tygodnie: nowy case, nowe moduły AI, błędy klientów. Bez spamu.