Architektura

Voice AI w call center — ElevenLabs vs OpenAI Voice. Test produkcyjny

Dwa pilote w polskich call centerach: ElevenLabs Conversational + OpenAI Voice. Cel: przyjmowanie standardowych zapytań klientów, eskalacja trudnych do człowieka. Dzielimy się 90-dniowymi wynikami z dwóch projektów, kosztami i czego nie warto powierzać voice AI w 2026.

⏱ 9 min czytania · 📅 29.01.2026 · 👁 669 wyświetleń

W ostatnich 4 miesiącach uruchomiliśmy dwa pilote voice AI w polskich call centerach — jeden na ElevenLabs Conversational, drugi na OpenAI Voice. Cel obu identyczny: przyjmowanie standardowych zapytań klientów (status zamówienia, godziny otwarcia, podstawowy support), eskalacja trudnych spraw do żywego konsultanta. Tutaj 90-dniowe wyniki, koszty i lista zadań, których nie warto powierzać voice AI w 2026.

Dwa projekty

ProjektBranżaSkalaPlatforma
Klient AE-commerce (sprzęt RTV)~3 200 połączeń/mies.ElevenLabs
Klient BUsługi finansowe~1 800 połączeń/mies.OpenAI Voice

Architektura

Schemat dla obu projektów ten sam: telefon → SIP/SBC → ASR (Whisper / ElevenLabs STT) → LLM (Claude Sonnet 4.5) → TTS (ElevenLabs / OpenAI) → telefon. Eskalacja do człowieka via warm transfer.

Klucze sukcesu

  • Pierwsza linia AI = maks. 3 podstawowe scenariusze. Reszta — eskalacja.
  • "Mogę połączyć z konsultantem?" — magiczne słowa, eskalacja bezdyskusyjna.
  • Transkrypcja w czasie rzeczywistym przekazywana konsultantowi przy eskalacji.
  • Krótka identyfikacja "Jestem asystentem AI firmy X" — wymóg AI Act limited risk.

Wyniki klient A (ElevenLabs)

  • Średni czas połączenia: 1 min 47 s
  • Containment rate (rozwiązane bez człowieka): 41%
  • Satysfakcja klienta (ankieta SMS): 6,8/10
  • Koszt per połączenie: 0,38 zł
  • Główne wyzwanie: czasem niezrozumienie polskiego akcentu z południa

Wyniki klient B (OpenAI Voice)

  • Średni czas połączenia: 2 min 12 s
  • Containment rate: 29% (bardziej skomplikowana branża)
  • Satysfakcja klienta: 5,9/10
  • Koszt per połączenie: 0,52 zł
  • Główne wyzwanie: latencja czasem dochodząca do 1,4 s w odpowiedziach

Porównanie platform

CechaElevenLabs Conv.OpenAI Voice
Jakość polskiego głosu9/107/10
Latencja P95820 ms1 400 ms
Customizacja głosuPełna (voice cloning)6 głosów stock
Integracja LLMDowolny przez webhookNatywny GPT
Koszt / minuta~0,18 zł~0,26 zł
Stabilność (uptime)99,7%99,4%

Czego nie warto powierzać voice AI w 2026

  • Reklamacje finansowe — emocje + złożoność = porażka voice AI
  • Sprzedaż "od zera" — kontekst budowany za krótko, klient się rozłącza
  • Wsparcie medyczne — etyka + AI Act high risk
  • Skomplikowany IVR z 8 poziomami — lepiej zredukować menu i potem AI
  • Klienci 65+ — niska tolerancja na "robota", wyższa frustracja

Co warto powierzyć

  • Status zamówienia, dostawy
  • Godziny otwarcia, lokalizacje
  • Resetowanie haseł (z weryfikacją tożsamości)
  • Umówienie spotkania / wizyty
  • Podstawowe FAQ branżowe
  • Routing do właściwego konsultanta

Rekomendacja

Dla polskiego rynku ElevenLabs Conversational ma w 2026 wyraźną przewagę głosową i kosztową. OpenAI Voice nadaje się dla zespołów już głęboko w ekosystemie OpenAI. W obu wypadkach AI to pierwsza linia, nie zastępstwo dla call centera.

Następny krok

Robimy pilot voice AI w 6-8 tygodni: discovery, scenariusze, integracja telefonia, testy A/B z żywymi klientami. Umówmy demo — zadzwońcie do działającego pilotu i sami posłuchajcie jakości.

Chcesz przetestować, jak AI rozwiąże to u Ciebie?

30 minut rozmowy + pokaz działającego wdrożenia u klienta. Bez NDA.

Umów demo

Może Cię też zainteresować

Newsletter redai

Dostawaj kolejne wpisy do skrzynki

Co dwa tygodnie: nowy case, nowe moduły AI, błędy klientów. Bez spamu.