Innovación
IA
Google
Tecnología

Gemini, de Google, a la conquista de las últimas capacidades de IA generativa

Tras la presentación formal de Gemini, Thomas Kurian, CEO de Google Cloud, ha anunciado en un reducido encuentro con la prensa nuevas innovaciones destinadas a desarrolladores y empresas. Así ha transcurrido la cita.

Google Cloud

Google estrenaba el mes de diciembre con la presentación en sociedad de Gemini, su modelo de software de inteligencia artificial (IA) generativa más potente y capaz de los últimos tiempos. Una apuesta en forma de gran modelo de lenguaje (LLM, por sus siglas en inglés) que representaba, en palabras de Sundar Pichai, CEO de la tecnológica, “uno de los mayores esfuerzos de ciencia e ingeniería que hemos emprendido como empresa". Una innovación que servía como razón de ser al encuentro que la multinacional originaria de Mountain View  ha tenido  con un reducido grupo de periodistas entre los que ha estado presente ComputerWorld. “Hoy presentamos una serie de nuevas e importantes funciones de IA que sirven de base a Gemini, nuestro modelo más potente y general hasta la fecha”, ha asegurado Thomas Kurian, CEO de Google Cloud.

Gemini ha sido concebido desde el origen para ser multimodal, lo que implica que “puede generalizar y comprender, operar y combinar a la perfección distintos tipos de información como texto, código de programación, audio, imagen y vídeo, del mismo modo que los seres humanos ven, oyen, leen, escuchan y hablan simultáneamente”. Según han avanzado, el nuevo modelo patentado por Google forma parte de una pila tecnológica de IA verticalmente integrada y optimizada que consta de varias piezas clave diseñadas para operar juntas.

Como parte del citado engranaje destacan una infraestructura de IA superescalable; modelos de primera clase; una plataforma de IA empresarial líder para desarrolladores bautizada como Vertex AI, y agentes asistenciales de IA para Workspace y Google Cloud bajo el paraguas de Duet AI. Teniendo esto en consideración, insistía el portavoz, “nos complace anunciar una serie de anuncios en diversas áreas”. A continuación, las claves.

 

Refuerzo de infraestructuras de primer nivel

A medida que los modelos de IA han ido creciendo en tamaño y complejidad, también lo han hecho sus requisitos de entrenamiento, ajuste e inferencia. Como resultado, la demanda de infraestructuras de IA de alto rendimiento, altamente escalables y rentables para entrenar y alimentar modelos está aumentando exponencialmente. Una tendencia que no solo se da con los clientes de la tecnológica, sino con la propia Google. Por este motivo anunciaron recientemente Cloud TPU v5p, un acelerador de IA más potente, escalable y flexible. Y es que los números no mienten, TPU v5p es cuatro veces más escalable que TPU v4 en términos de FLOP disponibles en total por pod. Es nuestra TPU con mayor eficacia de costes hasta la fecha, con una mejora de 2,7 en su rendimiento de inferencia por dólar con respecto a la generación anterior.

En lo relativo a infraestructuras, lanzaron también AI Hypercomputer, una revolucionaria arquitectura de superordenador que emplea un sistema integrado de hardware de rendimiento optimizado, software abierto, marcos de machine learning (ML) imbatibles y modelos de consumo flexibles. AI Hypercomputer cuenta con una amplia gama de opciones de aceleradores, incluidas varias clases de TPU de quinta generación y una GPU con sello Nvidia.

 

Perfilando modelos más avanzados

Siguiendo la misma tónica, Gemini representa de igual modo su modelo más flexible hasta la fecha, capaz de funcionar eficazmente en todas partes, lo mismo en un centro de datos que en dispositivos móviles. En concreto, Gemini Ultra es el modelo más potente y de mayor tamaño para tareas muy complejas; mientras que Gemini Pro es el mejor modelo para escalar una amplia gama de tareas; Gemini Nano, por su parte, es la mejor versión para tareas en el dispositivo. “Sus avanzadas funciones mejorarán significativamente la forma en la que los desarrolladores y las empresas crean aplicaciones con IA y les dan escala”, advierten desde la compañía.

Sin embargo, ahí no queda todo, ya que durante el encuentro han avanzado una versión mejorada del modelo de generación de texto Imagen 2. Esta última versión ofrece funciones mejoradas de fotorrealismo, renderizado de texto y generación de logotipos. A pesar de ello, insistían, tampoco han descuidado el trabajo vinculado a modelos para campos específicos como Med-PaLM. Aprovechaban el altavoz de la cita con medios para anunciar la disponibilidad general de MedLM, el paquete de modelos y API adaptados a aplicaciones médicas, en Vertex AI.

 

Una ventana a una nueva dimensión

Por el momento, Gemini está disponible en su versión preliminar en Vertex AI. De esta forma permite a los desarrolladores crear agentes nuevos y diferenciados capaces de procesar información suministrada a través de texto, código de programación, imágenes y vídeo. La plataforma sirve de ayuda para desplegar y gestionar agentes en producción, evaluar automáticamente la calidad y fiabilidad de las respuestas de los agentes, así como a monitorizarlos y gestionarlos. En este sentido, han apuntado, Vertex AI ofrece un soporte integral para Gemini, con la posibilidad de descubrir, personalizar, aumentar, gestionar y desplegar agentes creados con su propia API.

No obstante, más allá del soporte de Gemini en Vertex AI, la compañía ha hecho otra serie de avances. Por un lado han anunciado Automatic Side by Side (Auto SxS), una herramienta automatizada para comparar modelos. Auto SxS es más rápida y rentable que la evaluación manual de modelos. Además, se puede personalizar en función de las especificaciones de las tareas para gestionar nuevos casos de uso de IA generativa. Por otro, la incorporación de Mistral, ImageBind y DITO a Model Garden de Vertex AI, manteniendo el compromiso de un ecosistema de modelos abierto. Siguiendo esta misma línea también han confirmado que a finales de este mes Gemini también estará disponible en Vertex AI Search and Conversation para ayudar a los desarrolladores a crear rápidamente aplicaciones a nivel de producción.

 

Más funciones para Duet AI

Con Duet AI, explican, han dado respuesta al compromiso de ayudar a sus clientes a aumentar la productividad, obtener ventajas competitivas y, en última instancia, mejorar sus resultados. Desde hoy, Duet AI for Developers y Duet AI in Chronicle Security Operations están disponibles de forma generalizada y, en las próximas semanas, incorporarán Gemini en toda su cartera de Duet AI. Además, han anunciado que más de 25 socios de bases de conocimientos y herramientas de asistencia para programadores aportarán conjuntos de datos específicos para sus plataformas, de modo que los usuarios de Duet AI for Developers puedan recibir asistencia de IA basada en los modelos de datos y de programación, la documentación de productos, las mejores prácticas y otros recursos empresariales de los socios.

El lanzamiento de Gemini, junto con el refuerzo de su cartera de infraestructuras de IA superescalable —Vertex AI y Duet AI—, ofrece una nube completa y potente para desarrolladores y clientes. Con estas innovaciones, “Google Cloud está impulsando la próxima generación de agentes asistidos por IA en todos los sectores, lo que permite a las organizaciones crear, utilizar y adoptar con éxito la IA generativa para potenciar su transformación digital”.



Contenido Patrocinado

Forma parte de nuestra comunidad

 

¿Te interesan nuestras conferencias?

 

 
Cobertura de nuestros encuentros
 
 
 
 
Lee aquí nuestra revista de canal

DealerWorld Digital