Gemini 1.5 Flash-8B El precio más bajo de la familia Gemini ya está disponible

Gemini 1.5 Flash-8B, el último modelo de la familia Gemini de inteligencia artificial (IA), ya está disponible de forma generalizada para uso en producción. El jueves, Google anunció la disponibilidad general del modelo, destacando que se trataba de una versión más pequeña y más rápida del Gemini 1.5 Flash presentado en Google I/O. Debido a la velocidad, tiene una baja latencia de inferencia y una salida más eficiente. Más importante aún, el gigante tecnológico dijo que el modelo de IA Flash-8B es la “inteligencia de menor costo de cualquier modelo Gemini”.

Gemini 1.5 Flash-8B ya está disponible de forma generalizada

al creador publicación de blogLa empresa tecnológica con sede en Mountain View ha definido un nuevo tipo de IA. El Gemini 1.5 Flash-8B fue perfeccionado a partir del Gemini 1.5 Flash AI original, que se centró en un rendimiento más rápido y una mejor productividad. Ahora la compañía dice que Google DeepMind ha desarrollado esta versión pequeña y rápida de IA en los últimos meses.

Aunque es un modelo más pequeño, el gigante tecnológico dice que el rendimiento es “casi idéntico” al de la versión 1.5 Flash en la mayoría de los casos. Algunos de ellos incluyen conversación, texto y traducción de discursos largos.

Otra gran ventaja del modelo de IA es su rentabilidad. Google dijo que el Gemini 1.5 Flash-8B ofrecerá los precios más bajos de la familia Gemini. Los productores tendrán que pagar 0,15 dólares (aproximadamente 12,5 rupias) por millón de tokens producidos, 0,0375 dólares (aproximadamente 3 rupias) por millón de tokens agregados y 0,01 dólares (aproximadamente 0,8 rupias) por millón de tokens por mensaje guardado.

Además, Google duplica el límite de velocidad de la versión 1.5 Flash-8B AI. Ahora, los desarrolladores pueden enviar hasta 4000 solicitudes por minuto (RPM) mientras usan esta versión. Al explicar la decisión, el gigante tecnológico afirmó que el modelo es adecuado para tareas sencillas y de alto rendimiento. Los desarrolladores que deseen probar el modelo pueden hacerlo con Google AI Studio y la API Gemini de forma gratuita.

Fuente