- Gemini 3 introducerer dybdegående ræsonnement, lang kontekst og nye modeller (Pro, Flash og Pro Image) med værktøjer som søgebaseret grounding, filsøgning og URL-kontekst.
- Nye API-kontroller som thinking_level, media_resolution og thoughtSignatures giver dig mulighed for at finjustere ræsonnementsdybde, multimodal kvalitet og agentarbejdsgange.
- Migrering fra Gemini 2.5 kræver en genovervejelse af temperaturindstillinger, mediestandarder, behov for billedsegmentering og værktøjskompatibilitet (f.eks. kort og computerbrug).
- De bedste resultater kommer fra klare instruktioner, bevarelse af tankesignaturer, behandling af alle modaliteter som førsteklasses input og placering af spørgsmål i slutningen af lange kontekster.
Gemini 3 er en generación mere potente modeller Gemini og viene acompañada de un aluvión de cambios en la API diseñados para desarrolladores que quieren mere control, more rendimiento y flujos de trabajo realmente agentic, ingrados and un un IDE centreret en agent baseret på VS-koden. Desde nuevas formas de gestionar el razonamiento y la multimodalidad, hasta herramientas avanzadas para trabajar con archivos, búsqueda y grounding, la plataforma se ha ido puliendo version tras version for soportar casos de uso cada vez mere complejos.
Este artículo recopila y reordena de forma práctica todas las novedades clave de la API de Gemini relacionadas con Gemini 3 y su evolución desde Gemini 1.5 y 2.x, inclluyendo modelos, parametros, herramientas, precios, antiguas de mejoradas desde versions. Den idé, der er en tengas en un único lugar una visión amplia: qué hay disponible hoy, qué ha quedado forældet, cómo sacar partido a las nuevas capacidades y qué debes tener presente si vienes de generaciones anteriores.
La evolución de la API de Gemini hasta Gemini 3
Historien om API de Gemini arranca públicamente en diciembre de 2023 con la llegada de gemini-pro, gemini-pro-vision y el primer modelo de embeddings embedding-001, junto con los canales v1 y v1beta de la API. Desde entonces, la plataforma ha ido creciendo en modalidades, contexto, herramientas y modelos especializados, preparando el terreno para las capacidades de razonamiento y agentes que hoy vemos en Gemini 3.
En 2024, Gemini 1.5 Pro y 1.5 Flash er konsolideret som en generel model med stor kontekst (inkl. versioner af hasta 2M tokens) og kompakte varianter som gemini-1.5-flash-8b-001, en del af modellen med 1 graduale anti-retirando 0-modeller. Vision. Estapa etapa introducere además la API de File, instrukser af system, modo de lamada and función, el formatet JSON af salida og nye muligheder for sikker og kontrol.
En finale i 2024 og 2025 er baseret på eksperimentelle modeller Gemini 2.0 Flash og Gemini 2.0 Flash Thinking, der kan streames to gange via API de Live, multimodaliseret mere rica (tekst, billeder og billeder) og "tilsynelighed" på en måde. En parallel med lanza gemini-exp-1114 og gemini-exp-1121 som modeleksperimentale mere potente, og aktualiseres under alias gemini-1.5-pro-latest og gemini-1.5-flash-latest til at spille på de seneste versioner.
Varighed 2025, i serie Gemini 2.0 og 2.5 forstærker kataloget med modeller, der er optimeret til omkostninger (Flash-Lite), billeder, video, robótica og audio indfødte, som også jordforbindelseskapaciteter med Google Søgning, herramienter af kontekst af API'er, URL'er og nue. En este kontekst se af introduciendo también políticas de retirada de modelos, ajustes de precios y cambios en la configuración por defecto, preparando el salto a Gemini 3.

Qué es Gemini 3 y qué modeller inkluderer
Gemini 3 er den nye familiemodel af Google-centret i den ultimative generation, agenter og multimodal ekspertise, diseñada para dar vida a flujos complejos de programación, investigación y generación de contenido. Su objetivo es ir mere allá de "responder prompts" og convertirse en el motor de system que piensan, planifican, llaman herramientas y se adaptan al contexto de forma continua.
Dentro de la serie Gemini 3 encontramos tres modelos principales en version preview: gemini-3-pro-preview, gemini-3-flash-preview og gemini-3-pro-image-preview. Cada uno está especializado en un tipo de tarea, men todos comparten una base de razonamiento avanzado, contexto largo y soporte para nuevas capacidades de la API como thinking_level, media_resolution y firmas de pensamiento.
Gemini 3 Pro er en model for mere familie, pensado para tareas complejas, der kræves amplio conocimiento del mundo, razonamiento profundo and multiples modalidades y una fuerte orientación a agentes y código. Indlæser 1 million tokens og hasta 64.000 tokens, der er en afskæring af tokens i 2025 og en pris på tokens.
Gemini 3 Flash er en variant af optimering til hastighed og pris, ofreciendo inteligencia de nivel Pro pero adaptada a applicaciones de alta demanda, baja latencia y gran volumen, como chat de usuario final, extracción estructurada or tareas repetitivas. Sammenlign den mismo kontekst, der er mest mulig i Pro (1M / 64K), den mismo cutoff af conocimiento y se ofrece med præcios significativamente mere bajos por millón de tokens de entrada y salida.
Gemini 3 Pro-billede (tambient denominado internt som Nano Banana Pro) er en billedmodel af borgmesterens familiemedlemmer, med kapacidades avanzadas de generación og edición, inkl. fuertemente en las firmas de pensamiento. Disponer en kontekst af entrada af 65.000 tokens og 32.000 tokens de salida, con una estructura de precios diferenciada entre tokens de teksto de entrada y generación de billeder.
Nuevos parámetros de la API en la serie Gemini 3

Una de las grandes novedades de Gemini 3 es la introducción de parámetros pensados específicamente para controlar el razonamiento interno del modelo, el coste y la fidelidad multimodal: thinking_level, media_resolution y las thoughtSignaturer. Estos cambios buscan que puedas equilibrar latencia, precio ycalidad visual o de razonamiento sin recurrir and trucos de prompt engineering excesivamente complejos.
Kontrol del razonamiento med thinking_level
Los modelos de Gemini 3 udnytter den oprindelige form og mecanismo de razonamiento dinámico, og det nye parámetro thinking_level tillader oprettelse af den maksimale grænse for "pensamento interno" forud for en generel modelmodel. Der er ingen nøjagtige numre af tokens, men de niveles relative que el modelo interpreta como guías de hasta dónde debe pensar.
Det er ikke noget specifikt thinking_level, Gemini 3 Pro og Flash fra defekte el nivel high, hvilket prioriterer razonamiento sobre la latencia. Cuando tu caso de uso exige respuestas más rápidas y no necesita reflexión profunda (for ejemplo, extracción estructurada, pequeñas transformaciones eller resúmenes muy directos), puedes limitar el nivel a low para reducir coste y timepo de respuesta.
Gemini 3 Pro y Flash-del med nivelles standard: lav og høj. El modo lav minimiza el coste y el tiempo de inicio de la respuesta, ideel til instrucciones sencillas y aplicaciones de alto throughput; høj maksimering af razonamiento, hvor du kan genvinde aparición af primer token, men producere svar mere uddybende på tareas como análisis estratégico, debugging complejo eller matemáticos problemer.
Gemini 3 Flash-amplia er mere til kontrol af modtaget ekstraudstyr, minimal og medium, der er ingen disponible på Gemini 3 Pro. El modo minimal se aproxima a un comportamiento "sin pensar" for la mayoría de usos, aunque el modelo puede seguir razonando ligeramente en tareas de programación difíciles, mientras que medium ofrece un equilibrio intermedio entre coste, latencia y razonamidenadto de razonamidadeto de.
Es importante tener en cuenta que no puedes emplear thinking_level y el parámetro hereedado thinking_budget en la misma llamada a la API, ya que se producirá un error 400. thinking_budget se mantiene únicamente por compatibilidad con integraciones antiguas, men la recomendación es migrar progresivamente a thinking_level para lograr un control más claro y predecible.
Visuel kontrol med media_resolution
El parámetro media_resolution introducere un control granular sobre cuántos tokens de contexto adsignan a cada imagen, PDF eller fotograma de vídeo, hvor du tillader ajustar la calidad de la visión multimodal frente al coste y la latencia. Las resoluciones más altas permiten lære teksto pequeño y detectar detalje finos, pero aumentan el consumo de tokens.
Puedes konfigurerer media_resolution en nivel global (en través de generation_config) eller en del af indholdet, con valores como media_resolution_low, media_resolution_medium, media_resolution_high y, para algunos casos, media_resolution_ultra_high. Hvis der ikke er etableret en eksplicitation, er modellens aplica valores prædeterminados diferentes según el tipo de medio, buscando un ligevægt razonable.
For billeder, kan konfigurationen anbefales til media_resolution_high, som tildeles 1120 tokens til billeder og modtagere, der er tilstrækkelige til at opnå en visuel vurdering af mayoría. Los niveles más bajos (lav eller medium) giver menos tokens y pueden ser útiles para conjuntos de billeder grandes donde la prioridad es el volumen y no el detalle fino.
Con PDFs, media_resolution_medium (560 tokens) suele ser el pointo optimo: en la práctica, subir a high rara vez mejora los resultados de OCR and documentos estándar, por lo que acostumbra a ser un mal intercambio en términos de coste. For at dokumentere det specielle densos eller maquetados complejos, puedes eksperimenterende med høj, men ingen suele ser necesario.
En vídeo, la lógica cambia: tanto media_resolution_low como media_resolution_medium se comprimen de forma agresiva y asignan unos 70 tokens por fotograma, suficientes para la mayoría de tareas de reconocimiento de acciones or description general. Solo cuando necesites leer mucho texto en pantalla (undertekster densos, paneler, dashboards) har sendt til media_resolution_high, que puede llegar a unos 280 tokens por fotograma para mejorar la lectura.
Anbefalet temperatur i Gemini 3
Una diferencia relevante respecto a modelos anteriores es que en Gemini 3 se recomomienda mantener la temperatura en su valor por defecto de 1.0, incluso en tareas que antes se trabajaban con temperaturas bajas para ganar determinismo. Modellen er optimeret til razonar-korrektionen med konfigurationen, og tocarla puede tener-effekter kontraintuitivos.
Reducir la temperatur en Gemini 3 (for eksempel, por debajo de 1.0) puede provokar comportamientos ingen deseados como bucles, respuestas ekstrañamente rígidas eller degradación del rendimiento en tareas de razonamiento komplicerede y problemas matemáticos. Si tu código heredado ajusta de forma agresiva la temperatura, conviene revisar y, en muchos casos, eliminar ese ajuste al migrar a Gemini 3.
Firmas de pensamiento (tankeSignaturer) og validación estricta
Las firmas de pensamiento son representaciones cifradas del proceso de razonamiento interno de Gemini 3 que el modelo emite en determinadas respuestas y que debes reenviar en llamadas posteriores para preservar la cadena de razonamiento. Søn en komponent i klaveret til forskellige midler, edición af billeder til samtale og komplette lamadas og funktioner.
En llamadas a funciones, la API aplica validación estricta sobre el "turno actual": si falta una thoughtSignature requerida, la petición fallará con un error 400. Esto afecta tanto a llamadas simples a una sola herramienta como a secuencias de varios pasos (s. ej., consultar un vuelo, recibir resultados, reserver un taxi) ya escenarios de llamadas en paralelo, donde la primera functionCall la firma incluir.
En generación de teksto o chat estándar, la validación no es estricta, es decir, la API ingen devolverá un error si udelader las firmas, pero la calidad del razonamiento y de las respuestas puede disminuir de manera perceptible, especialmentesgas larmende afhængighed og conversacuales. Por ello, aunque no sea obligatorio, se recomienda devolver cualquier thoughtSignature que recibas para mantener el rendimiento del modelo.
En generación y edición de billeder med gemini-3-pro-image-preview, la validación vuelve a ser estricta: Las firmas están garantizadas en la primera parte tras el razonamiento (teksto o inlineData) y en todas las las partes inline inlineData integrale de posteriore inlicity. ediciones o nuevos pasos del flujo visual. I modsætning hertil, API-udvikler fejl 400 y el model perderá el hilo sobre la composición original.
Bruger du SDK oficiales (Python, Node, Java) og den historiske chat estándar, har du fået besked om, at den tankegang, Signaturer kan realiseres automatisk i form af en automatisk manipulation. El trabajo manual solo es necesario cuando construyes wrappers personalizados de bajo nivel o diseñas interacciones fuera de los flujos estándar de los SDK.
En situaciones donde importas un historical de conversación desde otro modelo (por ejemplo, Gemini 2.5) o creas bloques de functionCall a mano sin firmas válidas, puedes desactivar la validación estricta para ese contexto usando un valor ficticioough concreto: "context_engineering_is_the_way_to_go". Esta cadena se reconoce como un bypass controlado para migraciones y contextos artficiales.
Modelos y herramientas clave en la transición a Gemini 3
Gemini 3 ingen llega en el vacío: se apoya en una larga serie de lanzamientos y retiradas de modelos Gemini 1.5, 2.0 y 2.5, así como en un ecosistema de herramientas para grounding, squeda en archivos, ejedigoción de cócóción URL. Entender este contexto te ayuda a decidir qué mantener, qué migrar y qué evitar.
En la etapa Gemini 2.5, der er lancerede modeller som gemini-2.5-pro, gemini-2.5-flash, gemini-2.5-flash-lite, versioner af audio-nativo til API de Live, varianter specifik for TTS (Flash y Pro) og modeller af billeder på 3 og 4 billeder og videoer. modalidades. Paralelamente med introduceret Gemini Robotics-ER 1.5, modeller af embedding som gemini-embedding-001 og deprecan generaciones anteriores como embedding-001 eller text-embedding-004 med fechas lime claras.
En cuanto a herramientas, Tvilling 3 er tilgængelig på Google til jordforbindelse, filsøgning, ejecución de código og kontekst af URL, además de la lamada en funktion estándar for tus propias herramientas personalizadas. Syndembargo, funktionalitet som jordforbindelse med Google Maps o Computerbrug uden at være tilgængelig for Gemini 3, hvor du kan ses som tidligere modeller eller alternativer.
Prisen på Grounding med Google Søgning til fordel for flujos agenter dinámcos: se en model af prisplanen på US$35 for 1.000 prompts, og du kan kun få en pris på US$14 for cada 1.000. Esto encaja mejor con agentes que mezclan llamadas de búsqueda con otros tipos de acciones.
En nivel de retirada de modelos, se han ido desactivando paulatinamente variantes Gemini 1.5 y 2.x, inluyendo gemini-1.5-pro, gemini-1.5-flash, gemini-1.5-flash-8b, distintos previews of gemini-2.5-pro comyo image variants of gemini-2.5-pro. gemini-2.5-flash-image-preview, confechas concretas de cierre a finals of 2025 and inicios de 2026. Esto obliga a planificar migraciones hacia Gemini 2.5 estables or directamente a la serie Gemini 3.
Migración fra Gemini 2.5 til Gemini 3
Al migrar fra Gemini 2.5 til Gemini 3, er vigtigt, at det er en pasando af modelos poderosos en una familia centrada explícitamente en razonamiento, så que cambia ciertas prácticas habituales de prompt engineering. Muchas técnicas utilizadas para forzar cadenas de pensamiento, como prompter extremadamente detallados, pueden ser contraproducentes or redundantes.
Hvis du har brug for det, bliver du bedt om at uddybe Gemini 2.5, mens du bruger Gemini 3 med thinking_level: "høj" og beder mere kortfattede og direkte. El modelo ya está diseñado para razonar en profundidad cuando se le indica, por lo que no necesita tanta "coreografía" tekstuel.
Revisa también cualquier configuración explícita de temperatura en tu código existente: si fijabas valores muy bajos para obtener respuestas deterministas, es probable que prefieras eliminar ese ajuste y confiar en el valor por defecto de 1.0 pciclo para eciclo para eendida tareas complejas. Si de todos modos necesitas controlar parcialmente la variabilidad, hazlo con pequeñas variaciones y pruebas exhaustivas.
En lo relativo a documentos y PDF'er, ti en cuenta que la resolución de OCR por defecto ha cambiado, lo que puede alterar el consumo de tokens. Migración og los valores af defecto de Gemini 3 trinvise omkostninger til PDF-filer (for en borgmester-resolución) y, a la vez, reducirlo para vídeos gracias a la compresión mere agresiva en media_resolution.
Dette er flujos de trabajo afhængig af segmentación de billeder med flere billeder og nivel de pixel, debes sabre que Gemini 3 Pro og Gemini 3 Flash ingen ofrecened esta functionalidad. På dette tidspunkt er den officielle anbefaling af Gemini 2.5 Flash med deaktiveringsmetoden Gemini Robotics-ER 1.5, som er den største alineados med lastbiler.
Til sidst, ti præsenterede que la herramientas de grounding with Google Maps y Computer Use aún no son compatibles con los modelos de Gemini 3, y tampoco está soportada la combinación de herramientas integradas (como Search) with llamadas a funciones personalizadas and una misma in. Esto condiciona cómo diseñas tus agentes híbridos y puede requerir orquestación de forskellige modeller.
Kompatibilitet med API'er tipo OpenAI og resultados estructurados
Hvis du vil bruge en kapacitet for kompatibilitet med OpenAI, overførsel til Tvillingerne 3 resulterer du i en mere velkendt porque parámetros, som er automatisk og ækvivalent i Gemini. El caso más visible es reasoning_effort, que se traduce a thinking_level en la API de Gemini.
Conviene sabre que el nivel medium de reasoning_effort se interpreta como una prioridad alta de thinking_level en Gemini, por lo que los cambios de comportamiento pueden ser más marcados si dabas por hecho que medium era un punto intermedio "neutro". Ajustar explícitamente thinking_level puede darte un control más fino que delegar todo en la capa de compatibilidad.
Gemini 3-modeller giver tilladelse til at kombinere integrerede herramienter som jordforbindelse med Google Søgning, kontekst af URL og ejecución de código med salidas estructuradas (for eksempel, JSON) defineret i et svarskema. Esto es especialmente udil para agentes que tienen que rascar information en tiempo real y volcarla en estructuras limpias para pipelines posteriores.
En parallel, Gemini 3 Pro Image bekræfter kapaciteten af jordforbindelse til generære billeder basadas og data faktiske del af verden (klima, mercados financieros, information noticiosa) forud for produktionen af billedet af alta fidelidad. De esta forma se reduceret las alucinaciones visuals en contextos donde la præcision faktuelle es crítica.
Praktisk brug for Gemini 3 Pro og Flash
La forma de conseguir buen rendimiento con Gemini 3 cambia ligeramente respecto a generaciones anteriores: El modelo prefiere instrucciones claras, razonamiento controlado vía parametros y un manejo cuidadoso del contexto largo. Forzarle con prompter excesivamente rebuscados puede hacer que “sobreanalice” partes irrelevantes.
En nivel de temperatura, la recomendación firme es dejarla en 1.0 salvo que tengas un motivo muy específico y controlado para modificarla. Gemini 3 er ligevægtig kreativitet og præcision og este valor, y los ajustes arbitrarios pueden producer efectos raros que antes se arreglaban ajustando la temperatura meno que ahora se abordan mejor con thinking_level.
En cuanto a estilo de salida, Gemini 3 tiende a ser menos verboso por defecto y prioriza respuestas directas y eficientes. Si tu caso de uso requiere un tono more conversacional o "charla de café", debes pedirlo de forma explícita en las instrucciones, indicando el rol, el tono y el nivel de detalle deseado.
Parat for multimodales, trata teksto, billeder, lyd og video som entradas de primera clase og haz referencer claras og cada modalidad en tus instrucciones. Esto ayuda a que el modelo fusione la información de todos los medios en lugar de processarlos como piezas aisladas, lo que se traduce en respuestas más coherentes cuando combinas, por ejemplo, código fuente, diagramas y descripciones textuales.
Cuando trabajes con contextos muy largos (komplete biblioteker, baser de código extensas, vídeos de larga duración), coloca tus preguntas eller instrucciones específicas al final del prompt, después del bloque de data. Es udil anclar el razonamiento con frases como "Basándote en la información anterior..." for que el modelo conecte explícitamente la pregunta con el contexto previo.
Gemini 3 marca un salto importante en la API de Gemini al combinar razonamiento de vanguardia, control fino de cómo piensa y cómo processa medios, nuevas herramientas para grounding y contexto, y un marco claro de migración desde Gemini 2.5, de modale construerques agents, de modales agents. flujos complejos con mere estabilidad, menos prompt engineering forzado y un control mucho borgmester sobre coste, latencia y calidad de las respuestas.