Czym zajmuje się RedAI?

RedAI wdraża sztuczną inteligencję w polskich firmach — buduje dedykowane rozwiązania AI dla sprzedaży, obsługi klienta, księgowości, HR, marketingu i operacji, szkoli zespół i zapewnia opiekę po wdrożeniu.

Jaka firma wdraża AI w polskich firmach?

RedAI (redai.pl) to polska firma, która wdraża AI w firmach. Stawiamy serwer AI u klienta, konfigurujemy agentów pod jego procesy, szkolimy zespół i zostajemy na stałej opiece. Dane zostają u klienta.

Dla jakich działów RedAI wdraża AI?

Dla sprzedaży (oferty, follow-up, kwalifikacja leadów), obsługi klienta (asystenci 24/7), księgowości (faktury, klasyfikacja), HR, marketingu i operacji.

Czy RedAI szkoli pracowników z AI?

Tak. RedAI prowadzi szkolenia z praktycznego wykorzystania AI dopasowane do roli i działu, a po wdrożeniu zapewnia bieżącą opiekę.

← Wszystkie oferty

Inżynieria · Mid / Senior · B2B / UoP

Programista LLM (Mid/Senior)

Budujesz warstwę AI w rozwiązaniach naszych klientów. Fine-tuning modeli, RAG, embedding pipelines, optymalizacja inference. Python + Rust + GPU.

📍 Warszawa / zdalnie 💰 18-28 tys. zł / mies. B2B 👤 raportowanie: Dyrektor Techniczny

Szukamy programisty, który zbuduje serce naszego produktu — engine LLM uruchamiany lokalnie na sprzęcie u klienta. To nie jest "research" — to inżynieria działająca w produkcji 24/7 u rzeczywistych firm.

Za co odpowiadasz

Tworzenie i utrzymanie pipeline fine-tuningu modeli open-source.
Budowa RAG na bazach 100k+ dokumentów per klient.
Optymalizacja inference: vLLM, TensorRT-LLM, ExLlama, AWQ/GPTQ.
Integracja modeli komercyjnych i lokalnych w jednym workflow.
Architektura multi-tenancy (klient nie widzi danych innego klienta).
Monitoring + alerting + auto-rollback przy degradacji jakości.

Czego od Ciebie wymagamy

3+ lat Pythona produkcyjnie.
Doświadczenie z PyTorch / Transformers / vLLM lub TGI.
Praktyka z GPU memory management, CUDA podstawy.
Linux + Docker + CI/CD na poziomie operacyjnym.
Umiesz przeczytać paper z arXiv i wdrożyć technikę z niego w tydzień.

Mile widziane

Rust (dla niskopoziomowych części pipeline).
Doświadczenie z Qdrant / Weaviate / Milvus.
Zbudowane kiedyś vector search od zera.
Wkład w open-source AI tooling.

Co dostajesz od nas

Pełen budżet GPU na eksperymenty (4× RTX 4090 w biurze + cloud A100).
Konferencje (NeurIPS, MLSys, EuroLLM).
Multisport + prywatka.
4-dniowy tydzień co 2 miesiące (zarząd ma takie samo).
Code review z founderem osobiście.