Infografía: Familia de Modelos Google Gemini

FAMILIA DE MODELOS GEMINI

Una mirada profunda a la arquitectura, rendimiento y capacidades de la IA multimodal de Google.

Descripción General: El Cerebro Multimodal Nativo

A diferencia de modelos que unen componentes, Gemini fue diseñado desde cero para comprender y razonar fluidamente a través de diversas modalidades de información de forma simultánea. Es una única IA cohesiva, no una colección de partes.

📝

Texto

🖼️

Imágenes

🔊

Audio

🎬

Video

💻

Código

Hitos Clave

La evolución de Gemini ha sido rápida, introduciendo mejoras significativas en arquitectura y capacidad en un corto período.

Diciembre 2023

Lanzamiento de Gemini 1.0 (Pro, Ultra, Nano).

Febrero 2024

Lanzamiento de Gemini 1.5 Pro con arquitectura MoE.

Rendimiento de Vanguardia: Superando Límites

Gemini 1.0 Ultra estableció un nuevo estándar en la comprensión masiva de lenguajes multitarea (MMLU), una métrica clave que evalúa el conocimiento y la capacidad de resolución de problemas.

90.0%

Puntuación en MMLU

Primer modelo en superar el rendimiento a nivel de experto humano.

El Salto Cuántico en la Ventana de Contexto

La ventana de contexto define cuánta información puede procesar un modelo en una sola consulta. Gemini 1.5 Pro, con su arquitectura de Mezcla de Expertos (MoE), representa un avance monumental, permitiendo el análisis de bases de código completas, libros enteros o largas grabaciones de video de una sola vez.

Dominio en Benchmarks

El modelo ha demostrado un rendimiento de vanguardia (State-of-the-Art) en la gran mayoría de los benchmarks académicos más utilizados para evaluar LLMs.

Arquitectura y Eficiencia

  • ⚙️
    Base Transformer: Optimizada para la máxima escalabilidad y eficiencia.
  • ⚡️
    Infraestructura TPU: Co-diseñado para ejecutarse en los Tensor Processing Units (TPUs) de Google, logrando mayor velocidad y menor coste.
  • 🌍
    Huella de Carbono Reducida: Entrenado en centros de datos que operan con un alto porcentaje de energía libre de carbono.

Seguridad y Ética

  • 🛡️
    Evaluaciones Exhaustivas: Pruebas adversarias ("red teaming") para identificar y mitigar riesgos de sesgos y toxicidad.
  • 🚫
    Clasificadores de Seguridad: Filtros activos para prevenir la generación de contenido que viole las políticas de uso.
  • 💧
    SynthID Watermarking: Incrusta una marca de agua digital imperceptible en imágenes generadas para identificarlas como creadas por IA.

Infografía generada a partir de la ficha técnica del modelo Google Gemini. Visualizaciones creadas con Chart.js y Tailwind CSS.