PLLuM w administracji publicznej — gdzie wdrażają, co działa, co nie
PLLuM to polski model językowy budowany z funduszy publicznych przez konsorcjum NCBR. Wersje publikowane od 2024 r. powoli wchodzą do administracji. Sprawdzamy, które urzędy faktycznie pilotują, jakie zadania działają, gdzie kuleje. Plus: czy PLLuM ma sens dla prywatnej firmy.
PLLuM (Polish Large Language Model) to inicjatywa konsorcjum kierowanego przez NASK, finansowana z funduszy publicznych. Model otwarty, polskojęzyczny, zaprojektowany z myślą o administracji publicznej. W 2025 r. zaczyna wchodzić do realnych wdrożeń — w 2026 wejdzie szerzej. Co już działa, co dopiero raczkuje, czy ma sens dla prywatnej firmy. Bez politycznego komentarza, tylko fakty.
Co to jest PLLuM i czym się różni od Bielika
PLLuM i Bielik to dwa różne projekty polskich LLM, ale często mylone:
- PLLuM — projekt państwowy (NASK, NCBR, OPI PIB i in.), bardziej skupiony na administracji.
- Bielik — projekt społecznościowy (SpeakLeash), bardziej business-friendly.
- Obydwa są open-source, obydwa polskojęzyczne, ale mają różne dane treningowe i licencje.
Gdzie PLLuM realnie się wdraża w 2025
- ZUS — pilotaż asystenta dla pracowników infolinii. Status: testy wewnętrzne, ok. 8% interakcji obsłużonych z asystentem PLLuM jako "drugą parą oczu".
- e-Doręczenia — klasyfikacja dokumentów wpływających. Wczesny pilot, mała skala.
- Wybrane urzędy miast (Gdynia, Poznań, Wrocław) — chatboty informacyjne na stronach miejskich. Niewielka skala, ale produkcyjne.
- Resorty — zastosowania wewnętrzne, najczęściej drafty pism, analiza dokumentów.
- Bibliotek Narodowa, archiwa — ekstrakcja metadanych z dokumentów historycznych.
Co PLLuM robi dobrze
- Pisma urzędowe — naturalny rejestr "administracyjny polski".
- Dokumenty z polskim kontekstem prawnym — zna terminy, urzędy, procedury.
- Etykietowanie po polsku — klasyfikacja tematu pisma działa dobrze.
- Działa lokalnie — zgodność z wymogami administracji publicznej.
Co PLLuM robi gorzej
- Generowanie kodu — daleko za Sonnet 4.5 czy nawet Bielikiem.
- Multimodal — brak vision, brak audio.
- Długi kontekst — wciąż słaby względem komercyjnych modeli.
- Reasoning łańcuchowy — wyraźnie za Claude/GPT.
| Zadanie | PLLuM | Bielik 2.3 | Claude Sonnet 4.5 |
|---|---|---|---|
| Pisma urzędowe PL | 4,5/5 | 4,4/5 | 4,4/5 |
| Klasyfikacja dokumentu | 92% | 91,3% | 97,1% |
| Generowanie kodu PHP | 28% | 42% | 83% |
| Reasoning łańcuchowy | 41% | 54% | 83% |
| Multimodal | nie | nie | tak |
| Licencja | otwarta (CC BY) | Apache 2.0 | komercyjna |
Czy PLLuM ma sens dla prywatnej firmy
Krótka odpowiedź: dla większości — nie. Długa: tak, jeśli:
- Pracujesz z urzędami (kancelarie obsługujące postępowania administracyjne).
- Generujesz pisma urzędowe regularnie (kancelaria, biuro nieruchomości, doradca podatkowy).
- Masz wymóg "polski model z funduszy polskich" (przetarg publiczny).
- Twój klient (np. publiczny) preferuje PLLuM.
Hybrid stack — najczęstsza rekomendacja
W RedAI dla klientów współpracujących z administracją zalecamy hybrid:
- PLLuM — generowanie pism urzędowych, drafty odwołań, formularze.
- Bielik 2.3 — codzienna korespondencja, klasyfikacja.
- Claude Sonnet 4.5 — analiza dokumentów, reasoning, vision.
- Haiku 4.5 — wolumenowe klasyfikacje, OCR support.
Praktyka: doradca podatkowy z Warszawy, 9 osób
Klient: obsługa głównie procedur administracyjnych. Wdrożenie hybrid: PLLuM + Bielik + Claude. Workflow draftowania odwołań od decyzji urzędu skarbowego: PLLuM generuje szkielet pisma w języku urzędowym, Claude weryfikuje argumentację prawną, doradca koryguje. Czas pisma: z 110 min do 35 min. Akceptacja przez urząd: bez zmian (0 problemów).
Praktyczne wskazówki implementacji PLLuM
- Quantyzacja Q4_K_M dla deployment-u w prywatnej instancji — działa na 16GB VRAM.
- Tuning instrukcji obowiązkowy — bez tego model generuje czasem "ogólny ton".
- Few-shot z wzorcami pism z waszej kancelarii / firmy poprawia wyraźnie.
- Stop tokens jawne — model lubi "ciągnąć" pisma.
- Walidacja faktów — PLLuM zna procedury, ale halucynuje konkretne paragrafy.
Co dalej z PLLuM
Plan konsorcjum na 2026: większe wersje (12B+), vision, lepsze code-gen. Pełna otwartość przez Hugging Face. Komercyjne wdrożenia powinny być akceptowane. Polska Strategia AI 2030 zakłada PLLuM jako jeden z filarów cyfryzacji administracji.
Podsumowanie
PLLuM nie konkuruje z Claude czy GPT — uzupełnia stack tam, gdzie liczy się polski rejestr urzędowy i suwerenność. Dla większości polskich firm zostaje opcjonalny. Dla pracujących z administracją — wart implementacji w hybrid stack. Pokażemy wam hybrid PLLuM + Bielik + Claude w działaniu.
Chcesz przetestować, jak AI rozwiąże to u Ciebie?
30 minut rozmowy + pokaz działającego wdrożenia u klienta. Bez NDA.
Umów demo