Google ha presentado Gemini 2.5 Flash, una versión optimizada de su modelo de inteligencia artificial que introduce una innovadora función de «presupuesto de pensamiento». Esta característica permite a los desarrolladores ajustar la cantidad de razonamiento que la IA aplica a cada tarea, equilibrando calidad, costo y velocidad de respuesta.
Tulsee Doshi, directora de gestión de productos de Gemini, explicó que esta herramienta ofrece un control detallado sobre el número de tokens que el modelo genera durante su operación. Esto significa que los desarrolladores pueden decidir cuánto «piensa» la IA antes de responder, adaptándose a las necesidades específicas de cada aplicación.
Modelo más eficiente
La introducción de Gemini 2.5 Flash responde a la creciente demanda de modelos de IA más eficientes. Al permitir limitar o desactivar el razonamiento en tareas que no lo requieren, se reducen significativamente los tiempos de espera y el consumo de recursos computacionales. Esta flexibilidad es especialmente útil en aplicaciones donde la velocidad es crucial, como servicios en tiempo real o dispositivos con recursos limitados.
El modelo Gemini 2.5 Flash ya está disponible en versión preliminar a través de la aplicación Gemini. Google continúa su compromiso de ofrecer herramientas de IA avanzadas que se adapten a las diversas necesidades de los desarrolladores y usuarios.
Fuente: Arstechnica