Google ha presentado Gemini 2.5, su modelo de inteligencia artificial más potente hasta ahora. Con mejoras en razonamiento, codificación y comprensión multimodal, esta nueva versión se posiciona como líder en los principales benchmarks del sector. Si quieres saber qué hace tan especial a este modelo y cómo se compara con sus competidores, sigue leyendo.
¿Qué es Gemini 2.5 y qué lo diferencia con sus anteriores modelos?
Gemini 2.5 es la evolución de los modelos de IA desarrollados por Google DeepMind. A diferencia de versiones anteriores, Gemini 2.5 Pro Experimental se define como un thinking model, es decir, un modelo que razona antes de responder. Esto se traduce en respuestas más precisas, con mayor contexto y adecuadas para tareas más complejas.
Entre las novedades más relevantes está la mejora notable en razonamiento lógico, resolución de problemas científicos y matemáticos, y generación y edición de código. También destaca su ventana de contexto de hasta un millón de tokens, con capacidad para comprender entradas de texto, audio, imagen, vídeo o código de forma integrada.
Con estas mejoras, Gemini 2.5 no solo supera ampliamente a Gemini 2.0, sino que introduce una forma más estructurada y lógica de responder, especialmente útil en entornos técnicos o profesionales.
Gemini 2.5 vs otros modelos de la competencia
En benchmarks, Gemini 2.5 Pro ha superado a modelos líderes como GPT-4.5, Claude 3.7, Grok 3 y DeepSeek R1 en tareas clave de razonamiento, ciencia, matemáticas y programación.
En la evaluación GPQA, centrada en preguntas científicas, Gemini alcanzó un 84 %, mientras que GPT-4.5 obtuvo un 71,4 %, Claude 3.7 un 78,2 % y DeepSeek R1 un 71,5 %. En AIME 2025, una prueba exigente de matemáticas, Gemini logró un 86,7 %, superando con claridad a Claude (49,5 %), Grok (77,3 %) y DeepSeek (70 %).
En tareas de programación evaluadas con SWE-bench Verified, el modelo de Google consiguió un 63,8 %, por encima del 38 % de GPT-4.5 y del 49,2 % de DeepSeek. También destacó en contexto largo (MRC), con un resultado del 94,5 %, frente al 64 % de GPT-4.5 y al 61,4 % de Claude 3.7.
Otra métrica interesante es Aider Polyglot, que evalúa edición de código. Aquí, Gemini 2.5 Pro se situó en cabeza con un 74 %, mientras que GPT-4.5 alcanzó un 60,4 % y DeepSeek R1 un 56,9 %.
Estos resultados reflejan que Gemini no solo rinde bien en pruebas aisladas, sino que mantiene una consistencia alta en múltiples tareas exigentes.
¿Cuándo estará disponible?
Gemini 2.5 Pro ya está disponible para usuarios de Gemini Advanced, tanto en la app como en escritorio. También puede probarse desde Google AI Studio. En las próximas semanas, llegará a Vertex AI, pensado para integraciones en entornos empresariales.
¿Es gratis Gemini 2.5?
Actualmente, no. Para acceder a Gemini 2.5 Pro es necesario tener una suscripción activa a Gemini Advanced, incluida en el plan de Google One. Si bien se puede probar a través de AI Studio, el acceso ilimitado y con mayor capacidad estará reservado a quienes tengan el plan de pago.
¿Vale la pena Gemini 2.5?
Más allá del ruido habitual que suele acompañar cada lanzamiento, lo cierto es que Gemini 2.5 Pro ofrece mejoras concretas y verificables. No es un salto revolucionario, pero sí un avance importante. En comparación con sus rivales, según lo publicado en su blog, rinde mejor en casi todas las pruebas clave, sobre todo en tareas complejas como matemáticas, ciencia y programación.
Si usas modelos de lenguaje en tu día a día y buscas más precisión o capacidad de razonamiento, puede que haya llegado el momento de darle una oportunidad.