Ini yang Buat Google Yakin Gemini 3 Lampaui GPT 5.1 dan AI Lain.
Google yakin Gemini 3 lampaui GPT 5.1 berkat dominasi di benchmark penalaran, kemampuan multimodalitas native, dan jendela konteks 1 juta token. Model ini diklaim setara penalaran PhD.
JAKARTA, JClarity – Google kembali mengguncang arena Kecerdasan Buatan (AI) global dengan peluncuran senyap model bahasa besar (LLM) terbarunya, Gemini 3 Pro, pada pertengahan November 2025. Model AI ini secara langsung menantang GPT-5.1 milik OpenAI yang baru saja debut beberapa hari sebelumnya, dengan klaim superioritas yang didukung oleh serangkaian hasil tolok ukur (benchmark) yang memecahkan rekor.
Keyakinan Google bahwa Gemini 3 melampaui GPT 5.1 dan model AI frontier lainnya berakar kuat pada lonjakan kinerja di metrik penalaran dan kemampuan multimodalitas yang mendalam. Salah satu faktor kunci adalah performa model dalam benchmark 'Humanity's Last Exam', yang dirancang untuk menguji pengetahuan dan penalaran pada batas pemahaman manusia. Gemini 3 Pro mencatat skor 37,2% (bahkan 41% dengan mode 'Deep Think'), melampaui skor GPT-5.1 yang berada di angka 26,5%.
Selain itu, kemampuan model dalam penalaran abstrak visual juga menunjukkan peningkatan dramatis. Pada tolok ukur ARC-AGI-2, Gemini 3 Pro meraih 31,1% (45,1% dengan Deep Think), hampir menggandakan skor GPT-5.1 yang sebesar 17,6%. Peningkatan ini mengindikasikan perbaikan fundamental dalam pemecahan masalah non-verbal. Dalam pengujian lain seperti GPQA Diamond untuk pertanyaan ilmiah tingkat PhD, Gemini 3 juga unggul dengan skor 93,8% (dengan Deep Think), dibandingkan 88,1% milik pesaingnya.
Faktor penentu lain adalah arsitektur 'natively multimodal' yang diusung Gemini 3. Sejak awal, model ini dirancang untuk memproses teks, gambar, audio, dan video secara simultan dan terintegrasi. Kemampuan ini terbukti unggul pada tolok ukur multimodal seperti MMMU-Pro (81%) dan ScreenSpot-Pro, yang menguji pemahaman layar secara mendalam, di mana Gemini 3 Pro mendominasi dengan 72,7% jauh di atas skor GPT-5.1 sebesar 3,5%.
Secara teknis, Google juga menonjolkan fitur jendela konteks (context window) yang sangat besar, mencapai 1 juta token. Jendela konteks raksasa ini memungkinkan Gemini 3 mencerna dokumen hukum yang sangat panjang, seluruh repositori kode, atau transkrip video berjam-jam dalam satu prompt, memberikan keunggulan signifikan dalam tugas analisis berskala besar dibandingkan batasan konteks yang dilaporkan pada GPT-5.1.
Model terbaru ini didukung oleh infrastruktur Sparse Mixture-of-Experts (MoE) dan dilatih menggunakan Unit Pemrosesan Tensor (TPU) generasi terbaru Google. Peluncuran ini, yang juga memperkenalkan platform pengembangan 'agentic' baru bernama Google Antigravity, menegaskan fokus Google pada pengembangan agen AI otonom yang mampu merencanakan dan menjalankan tugas kompleks, tidak sekadar merespons perintah teks.