Este vídeo está disponible únicamente para usuarios de Cloud Champion. Por favor, inicia sesión o regístrate para continuar.

Detalles de la sesión

Históricamente, los modelos de lenguaje se han visto limitados al procesar una sola modalidad de entrada: texto. Pero ahora, estamos en un punto de cambio.

En este webinar veremos cómo este modelo no solo procesa y comprende el texto, sino que también interpreta y analiza contenido visual, estableciendo un nuevo estándar en la interacción inteligente entre humanos y máquinas. Realizaremos varias demos en vivo para mostrar todo el potencial de GPT-4 Turbo con Visión y exploraremos cómo podemos implementar RAG con imágenes para enriquecer aún más la experiencia multimodal.

Presentadores

  • Sara Lammini Rodríguez

    Sara Lammini Rodríguez

    Cloud Solution Architect
    Microsoft

  • Nacho Sanchez Gines

    Nacho Sanchez Gines

    Sr Cloud Solution Architect
    Microsoft

Etiquetas