Modele

Gemini 3 Pro — co się zmieniło w grudniowych update

Google w grudniu 2025 podbiło Gemini 3 Pro — context 2M, lepsze multimodal i polski model card. Sprawdziliśmy w 3 zadaniach, gdzie ma przewagę nad Sonnetem 4.5 i czy warto migrować pipeline'y, które już działają.

⏱ 7 min czytania · 📅 17.12.2025 · 👁 3 747 wyświetleń

Google w grudniu 2025 odświeżyło Gemini 3 Pro — kontekst poszerzony do 2M tokenów, polepszone multimodal i pierwszy model card z opisem ograniczeń po polsku. Sprawdziliśmy w 3 zadaniach z naszych wdrożeń, gdzie ma przewagę nad Sonnetem 4.5 i czy warto migrować już działające pipeline'."'".'y.

Co dokładnie zmieniło się 11 grudnia

  • Kontekst 2M tokenów na API (wcześniej 1M)
  • Multimodal accuracy +12% (wewnętrzny benchmark Google)
  • Polski model card — pierwszy raz po polsku
  • Cena bez zmian: 1,25 USD / 1M input
  • Batch API w GA (50% rabat)

Test 1: analiza 380 zdjęć ze stanu magazynowego

Klient: hurtownia narzędzi 80 osób. Zadanie: zinwentaryzować 380 zdjęć półek i wyodrębnić numery katalogowe. Gemini 3 Pro: 94% accuracy w 24 minuty. Sonnet 4.5: 91% accuracy w 31 minut. Koszt Gemini: 2,40 USD, Sonnet: 8,90 USD. Wygrywa Gemini.

Test 2: RAG na 1,8M tokenów dokumentacji technicznej

Klient: producent maszyn 140 osób. Zadanie: odpowiadać na pytania serwisantów na bazie całej dokumentacji w jednym kontekście (bez RAGa). Gemini 3 Pro 2M tokenów obsłużył w 14 sekund, Sonnet (przy 200k+RAG) w 18 sekund. Accuracy Gemini 87%, Sonnet 91% (RAG dał lepszy precyzyjny grounding). Tie.

Test 3: generacja raportu z 47 plików Excel

Klient: kancelaria audytorska. Zadanie: pobrać dane z 47 plików Excel (po 8-30 arkuszy) i wygenerować zbiorczy raport. Gemini 3 Pro: 12 minut, 96% poprawnych liczb. Sonnet 4.5: 17 minut, 94%. Wygrywa Gemini, głównie dzięki natywnemu spreadsheet handlingu.

Cena vs. jakość

ModelInput / 1MOutput / 1MContext
Gemini 3 Pro1,25 USD5,00 USD2M
Claude Sonnet 4.53,00 USD15,00 USD1M
GPT-52,50 USD10,00 USD400k

Gdzie Gemini 3 Pro naprawdę wygrywa

  • Multimodal w skali — zdjęcia, PDFy, screenshoty. 60-70% taniej.
  • Bardzo długie konteksty — kiedy RAG to overkill (1-2M tokenów wystarczy).
  • Spreadsheets — natywna obsługa formuł i odwołań między arkuszami.
  • Polskie OCR — wyraźnie lepsze niż 6 miesięcy temu.

Gdzie nie warto migrować

Działający pipeline na Sonnecie 4.5 do code review, sub-agentów i pracy z narzędziami — zostawcie. Migracja kosztuje 2-3 tygodnie pracy, a wygranego niewiele.

Rekomendacja

Dla nowych projektów multimodal/long-context — Gemini 3 Pro jako domyślny wybór. Dla istniejących projektów na Claude — bez ruchu. Hybryda Sonnet+Gemini sprawdza się w 3 naszych nowych wdrożeniach od grudnia. Umówmy demo — pokażemy multimodal pipeline na waszych dokumentach.

Chcesz przetestować, jak AI rozwiąże to u Ciebie?

30 minut rozmowy + pokaz działającego wdrożenia u klienta. Bez NDA.

Umów demo

Może Cię też zainteresować

Newsletter redai

Dostawaj kolejne wpisy do skrzynki

Co dwa tygodnie: nowy case, nowe moduły AI, błędy klientów. Bez spamu.