Gemini 3 Pro — co się zmieniło w grudniowych update
Google w grudniu 2025 podbiło Gemini 3 Pro — context 2M, lepsze multimodal i polski model card. Sprawdziliśmy w 3 zadaniach, gdzie ma przewagę nad Sonnetem 4.5 i czy warto migrować pipeline'y, które już działają.
Google w grudniu 2025 odświeżyło Gemini 3 Pro — kontekst poszerzony do 2M tokenów, polepszone multimodal i pierwszy model card z opisem ograniczeń po polsku. Sprawdziliśmy w 3 zadaniach z naszych wdrożeń, gdzie ma przewagę nad Sonnetem 4.5 i czy warto migrować już działające pipeline'."'".'y.
Co dokładnie zmieniło się 11 grudnia
- Kontekst 2M tokenów na API (wcześniej 1M)
- Multimodal accuracy +12% (wewnętrzny benchmark Google)
- Polski model card — pierwszy raz po polsku
- Cena bez zmian: 1,25 USD / 1M input
- Batch API w GA (50% rabat)
Test 1: analiza 380 zdjęć ze stanu magazynowego
Klient: hurtownia narzędzi 80 osób. Zadanie: zinwentaryzować 380 zdjęć półek i wyodrębnić numery katalogowe. Gemini 3 Pro: 94% accuracy w 24 minuty. Sonnet 4.5: 91% accuracy w 31 minut. Koszt Gemini: 2,40 USD, Sonnet: 8,90 USD. Wygrywa Gemini.
Test 2: RAG na 1,8M tokenów dokumentacji technicznej
Klient: producent maszyn 140 osób. Zadanie: odpowiadać na pytania serwisantów na bazie całej dokumentacji w jednym kontekście (bez RAGa). Gemini 3 Pro 2M tokenów obsłużył w 14 sekund, Sonnet (przy 200k+RAG) w 18 sekund. Accuracy Gemini 87%, Sonnet 91% (RAG dał lepszy precyzyjny grounding). Tie.
Test 3: generacja raportu z 47 plików Excel
Klient: kancelaria audytorska. Zadanie: pobrać dane z 47 plików Excel (po 8-30 arkuszy) i wygenerować zbiorczy raport. Gemini 3 Pro: 12 minut, 96% poprawnych liczb. Sonnet 4.5: 17 minut, 94%. Wygrywa Gemini, głównie dzięki natywnemu spreadsheet handlingu.
Cena vs. jakość
| Model | Input / 1M | Output / 1M | Context |
|---|---|---|---|
| Gemini 3 Pro | 1,25 USD | 5,00 USD | 2M |
| Claude Sonnet 4.5 | 3,00 USD | 15,00 USD | 1M |
| GPT-5 | 2,50 USD | 10,00 USD | 400k |
Gdzie Gemini 3 Pro naprawdę wygrywa
- Multimodal w skali — zdjęcia, PDFy, screenshoty. 60-70% taniej.
- Bardzo długie konteksty — kiedy RAG to overkill (1-2M tokenów wystarczy).
- Spreadsheets — natywna obsługa formuł i odwołań między arkuszami.
- Polskie OCR — wyraźnie lepsze niż 6 miesięcy temu.
Gdzie nie warto migrować
Działający pipeline na Sonnecie 4.5 do code review, sub-agentów i pracy z narzędziami — zostawcie. Migracja kosztuje 2-3 tygodnie pracy, a wygranego niewiele.
Rekomendacja
Dla nowych projektów multimodal/long-context — Gemini 3 Pro jako domyślny wybór. Dla istniejących projektów na Claude — bez ruchu. Hybryda Sonnet+Gemini sprawdza się w 3 naszych nowych wdrożeniach od grudnia. Umówmy demo — pokażemy multimodal pipeline na waszych dokumentach.
Chcesz przetestować, jak AI rozwiąże to u Ciebie?
30 minut rozmowy + pokaz działającego wdrożenia u klienta. Bez NDA.
Umów demo