La inteligencia artificial (IA) se ha posicionado firmemente en nuestra vida diaria con asistentes virtuales como Siri y Alexa que entienden el lenguaje natural hablado y responden preguntas relativas al entorno que nos rodea o ayudan a controlar dispositivos conectados, interactuando también con el usuario por medio de la voz.
Sin embargo, la IA tiene muchas más capacidades utilizables por el usuario común y corriente, como la generación de nueva información en formato de texto a partir de instrucciones textuales, función que por lo general la realiza un chatbot conversacional basado en modelos de lenguaje de gran tamaño y cuyo mejor representante es ChatGPT.
Pero ChatGPT no es el único. Día a día van apareciendo proyectos similares como Claude.AI, Pi.AI o Bard de Google. Precisamente esta compañía ha dado un paso adelante en este sector con el lanzamiento de Gemini.
Gemini o Google Gemini es la nueva solución de inteligencia artificial generativa de Google. Pero a diferencia de Bard, se trata de un sistema multimodal. Esto quiere decir que Gemini tiene la capacidad de aceptar entradas y salidas de información en múltiples formatos. De hecho, puede procesar lenguaje natural combinado con elementos visuales, elementos sonoros y código informático, que desde luego le permiten tener una visión más amplia de conceptos y situaciones complejas.
Cuántas versiones de Google Gemini existen
Google Gemini es un proyecto de IA muy ambicioso que viene en tres versiones diferentes: Gemini Ultra, Gemino Pro y Gemini Nano. La primera de ellas es la más avanzada y está destinada a las plataformas en la nube y centros de datos, en tanto que Gemini Pro, mucho más flexible que la anterior, ya está siendo incorporada a Google Bard, aunque de momento solo en idioma inglés y limitada a las instrucciones de texto. En cuanto a Gemini Nano, se trata de una solución que será implementada en teléfonos inteligentes Android y dispositivos de consumo como computadoras, televisores y artefactos electrónicos.