Voice AI w call center — ElevenLabs vs OpenAI Voice. Test produkcyjny
Dwa pilote w polskich call centerach: ElevenLabs Conversational + OpenAI Voice. Cel: przyjmowanie standardowych zapytań klientów, eskalacja trudnych do człowieka. Dzielimy się 90-dniowymi wynikami z dwóch projektów, kosztami i czego nie warto powierzać voice AI w 2026.
W ostatnich 4 miesiącach uruchomiliśmy dwa pilote voice AI w polskich call centerach — jeden na ElevenLabs Conversational, drugi na OpenAI Voice. Cel obu identyczny: przyjmowanie standardowych zapytań klientów (status zamówienia, godziny otwarcia, podstawowy support), eskalacja trudnych spraw do żywego konsultanta. Tutaj 90-dniowe wyniki, koszty i lista zadań, których nie warto powierzać voice AI w 2026.
Dwa projekty
| Projekt | Branża | Skala | Platforma |
|---|---|---|---|
| Klient A | E-commerce (sprzęt RTV) | ~3 200 połączeń/mies. | ElevenLabs |
| Klient B | Usługi finansowe | ~1 800 połączeń/mies. | OpenAI Voice |
Architektura
Schemat dla obu projektów ten sam: telefon → SIP/SBC → ASR (Whisper / ElevenLabs STT) → LLM (Claude Sonnet 4.5) → TTS (ElevenLabs / OpenAI) → telefon. Eskalacja do człowieka via warm transfer.
Klucze sukcesu
- Pierwsza linia AI = maks. 3 podstawowe scenariusze. Reszta — eskalacja.
- "Mogę połączyć z konsultantem?" — magiczne słowa, eskalacja bezdyskusyjna.
- Transkrypcja w czasie rzeczywistym przekazywana konsultantowi przy eskalacji.
- Krótka identyfikacja "Jestem asystentem AI firmy X" — wymóg AI Act limited risk.
Wyniki klient A (ElevenLabs)
- Średni czas połączenia: 1 min 47 s
- Containment rate (rozwiązane bez człowieka): 41%
- Satysfakcja klienta (ankieta SMS): 6,8/10
- Koszt per połączenie: 0,38 zł
- Główne wyzwanie: czasem niezrozumienie polskiego akcentu z południa
Wyniki klient B (OpenAI Voice)
- Średni czas połączenia: 2 min 12 s
- Containment rate: 29% (bardziej skomplikowana branża)
- Satysfakcja klienta: 5,9/10
- Koszt per połączenie: 0,52 zł
- Główne wyzwanie: latencja czasem dochodząca do 1,4 s w odpowiedziach
Porównanie platform
| Cecha | ElevenLabs Conv. | OpenAI Voice |
|---|---|---|
| Jakość polskiego głosu | 9/10 | 7/10 |
| Latencja P95 | 820 ms | 1 400 ms |
| Customizacja głosu | Pełna (voice cloning) | 6 głosów stock |
| Integracja LLM | Dowolny przez webhook | Natywny GPT |
| Koszt / minuta | ~0,18 zł | ~0,26 zł |
| Stabilność (uptime) | 99,7% | 99,4% |
Czego nie warto powierzać voice AI w 2026
- Reklamacje finansowe — emocje + złożoność = porażka voice AI
- Sprzedaż "od zera" — kontekst budowany za krótko, klient się rozłącza
- Wsparcie medyczne — etyka + AI Act high risk
- Skomplikowany IVR z 8 poziomami — lepiej zredukować menu i potem AI
- Klienci 65+ — niska tolerancja na "robota", wyższa frustracja
Co warto powierzyć
- Status zamówienia, dostawy
- Godziny otwarcia, lokalizacje
- Resetowanie haseł (z weryfikacją tożsamości)
- Umówienie spotkania / wizyty
- Podstawowe FAQ branżowe
- Routing do właściwego konsultanta
Rekomendacja
Dla polskiego rynku ElevenLabs Conversational ma w 2026 wyraźną przewagę głosową i kosztową. OpenAI Voice nadaje się dla zespołów już głęboko w ekosystemie OpenAI. W obu wypadkach AI to pierwsza linia, nie zastępstwo dla call centera.
Następny krok
Robimy pilot voice AI w 6-8 tygodni: discovery, scenariusze, integracja telefonia, testy A/B z żywymi klientami. Umówmy demo — zadzwońcie do działającego pilotu i sami posłuchajcie jakości.
Chcesz przetestować, jak AI rozwiąże to u Ciebie?
30 minut rozmowy + pokaz działającego wdrożenia u klienta. Bez NDA.
Umów demo