Home Estilo de Vida ¿Qué es un Géminis? Todo lo que debes saber sobre la herramienta...

Estilo de Vida

¿Qué es un Géminis? Todo lo que debes saber sobre la herramienta de IA de Google

September 27, 2024

Desde que ChatGPT causó sensación, las empresas de tecnología han estado compitiendo para superar a sus rivales de IA, y Google ha mejorado su juego de IA con Gemini.

Lanzado en diciembre de 2023 por Google DeepMind, este modelo de próxima generación se ha integrado en una gama de productos de Google, incluidos Google Search y Workspace e incluso teléfonos Pixel, lo que hace que las herramientas sean más inteligentes, con mayor capacidad de respuesta e intuitivas.

Entonces, ¿qué es un Géminis? Es un modelo de lenguaje grande desarrollado para comprender y generar texto muy similar a lo que podría escribir un humano. Fue diseñado para integrar IA avanzada en las interacciones cotidianas de los usuarios y en soluciones empresariales complejas, y puede interactuar con LLM Google a través del chatbot Gemini en la web o mediante una aplicación móvil.

Gemini tiene cuatro modelos: Ultra, Pro, Flash y Nano, cada uno diseñado para diferentes casos de uso. Una nueva característica destacada es su ventana de contexto de token ampliada, que permite respuestas más amplias y significativas. Gemini 1.5 Flash ahora ofrece una ventana de 1 millón de marcas, mientras que el modelo 1.5 Pro la lleva a la friolera de 2 millones. Por el contrario, ChatGPT limita 32.000 caracteres en la versión extendida.

Si aún no ha desarrollado una debilidad por todo lo relacionado con la IA y todo esto le suena confuso, siga leyendo.

Terminología general de IA: LLM, IA generativa, chatbots, indicadores

A medida que la tecnología se desarrolla, también lo hace la nueva terminología de inteligencia artificial. Antes de profundizar más, analicemos rápidamente algunos de los términos clave mencionados anteriormente.

La IA generativa (o IA gen) se refiere a sistemas de IA que pueden crear contenido (piense en texto, imágenes o incluso música) en función de los datos con los que ha sido entrenado. Los LLM como Gemini son una forma de IA generativa. Aprenden de grandes bases de datos de texto y código y luego utilizan ese conocimiento para comprender y generar texto similar al humano.

Es probable que haya interactuado con LLM antes, ya sea a través de un chatbot de servicio al cliente en línea o incluso ChatGPT.

Estos chatbots utilizan LLM para entablar conversaciones en tiempo real, brindarle información y resolver problemas, aunque a veces fallan y dan respuestas incómodas. Eso se llama alucinaciones de IA. Y Google tuvo una buena cantidad de problemas con ellos. Pero hablaremos más de esto más adelante.

Los tokens son los componentes básicos del texto que los modelos de IA utilizan para procesar el lenguaje. Cuando la IA lee y genera texto, lo divide todo en pequeños fragmentos llamados tokens. Pueden ser palabras completas, partes de palabras o incluso puntuación. Por ejemplo, en la frase “¡Hola mundo!” la IA podría tratar “Hola” y “,” como señales separadas.

Entonces, cuando hablamos de límites de tokens (por ejemplo, la ventana de contexto de un millón de tokens antes mencionada de Gemini), estamos hablando de lo que la IA puede “recordar” de la conversación para mantener las cosas coherentes y relevantes.

Una cosa a tener en cuenta: como ocurre con cualquier tecnología nueva, Gemini aún se está desarrollando y la inteligencia artificial continúa mejorando casi todos los días.

Géminis en teléfonos Pixel y la Búsqueda de Google

Pliegue del Pixel 9 Pro — El pliegue del Pixel 9 Pro

James Martín/CNET

Entonces, ¿cómo influye Géminis en las herramientas que utilizas todos los días? Para empezar, está integrado en los teléfonos Pixel de Google, incluidas muchas de las funciones de inteligencia artificial de los teléfonos.

Es posible que haya utilizado su Pixel para transcribir un mensaje de voz o generar una respuesta rápida por correo electrónico. Ese es Géminis haciendo su magia al fondo. Básicamente, ayuda a Pixel a hacer las cosas de forma más rápida e intuitiva.

Gemini también juega un papel importante en las descripciones generales de IA en la Búsqueda de Google. Si ha notado que aparecen respuestas más detalladas y contextualmente ricas en la parte superior de sus búsquedas, es gracias a esta integración. Gemini ayuda a dividir temas complejos en explicaciones breves en los resultados de búsqueda.

Google fue criticado por algunos consejos que AI Overviews brindó a los usuarios en su lanzamiento, incluidas cosas como comer piedras todos los días y pegar recetas de pizza. Google respondió rápidamente y desde entonces ha sintonizado su dispositivo.

Todos los usuarios estadounidenses mayores de 13 años que administren sus propias cuentas de Google pueden acceder a AI Overviews. En otros países, como Reino Unido, India, México, Brasil, Indonesia y Japón, los usuarios mayores de 18 años también pueden acceder a esta función. Google planea seguir expandiéndose a nivel global, con el objetivo de llegar a más de mil millones de usuarios para finales de 2024.

Ahora bien, a algunas personas no les gusta esta función y la desventaja es que no se puede desactivar la IA. Sin embargo, hemos cubierto una serie de técnicas que pueden ayudar con eso.

Arreglando el infame fiasco de generación de imágenes con nuevos lanzamientos

El teléfono móvil Pixel 9 de Google — James Martín/CNET

Cuando Gemini se lanzó por primera vez, las cosas no tardaron en torcerse. Google enfrentó críticas por algunas alucinaciones y cómo mostraba personajes históricos y diferentes razas. Llegó a los titulares por representar a soldados nazis negros y asiáticos, lo cual, como puedes imaginar, no fue bien recibido. Los críticos acusaron a Google de esforzarse demasiado en mostrar diversidad, pero en lugar de eso, empeoró las cosas. Google frenó la generación de imágenes Gemini y prometió limpiar el desorden.

El 28 de agosto, después de actualizar la tecnología, Google anunció la última versión de su herramienta de conversión de texto a imagen, Imagen 3, que pronto estará disponible para los suscriptores de Gemini Advanced, Business y Enterprise. Sin embargo, la capacidad de generar imágenes de personas todavía está en suspenso ya que esta vez Google va a lo seguro.

Anteriormente, el 13 de agosto, Google lanzó Gemini Live para suscriptores avanzados en dispositivos Android, con planes de expandirse a iOS pronto. Gemini Live ofrece conversaciones con manos libres en tiempo real con 10 nuevas opciones de voz, incluso cuando la aplicación está en segundo plano o cuando el teléfono está bloqueado. También puedes pausar y reanudar conversaciones cuando quieras, lo cual es una característica interesante.

Precios y disponibilidad

Gemini es gratuito como asistente personal de IA y ofrece acceso al módulo Flash 1.5 con una ventana contextual de 32.000 tokens, perfecta para largas conversaciones de ida y vuelta. Pero para funciones más avanzadas, Gemini tiene algunos planes de suscripción:

Gemini avanzado con modelo 1.5 Pro: $20 por mes.
Negocio Géminis: $20 por usuario por mes en un plan anual o $24 si se paga mensualmente.
Empresa Géminis: $30 por usuario por mes en un plan anual, con precio estándar a través del equipo de ventas de Google.

Para desarrolladores y empresas, Google ha establecido una estructura de precios escalonada para sus módulos API Gemini, como Flash y Pro. Los desarrolladores pueden acceder a ellos a través de los servicios API de Google Cloud e integrar capacidades de IA directamente en las aplicaciones.

Ambos modelos ofrecen uso de IA escalable, con diferencias de precio y límites según la serie y la longitud del token. Puede consultar las tarifas de precios detalladas en sitio web oficial de google. También hay un nivel gratuito, que te ofrece una prueba de uso limitado, ideal para probar las aguas antes de sumergirte.

Continúe leyendo para ver la revisión completa de Gemini de CNET.

Fuente