Viernes 11 de Julio de  2025
AUTOMOVILISMO

Google y Fórmula E crean podcast para personas ciegas impulsado por IA

Presentado por Jeff Dodds, CEO de Formula E, durante el Google Cloud Summit en Londres, este proyecto utiliza tecnología generativa de IA de Google Cloud

Escrito en INTERNACIONAL el

Formula E y su socio oficial en la nube, Google Cloud, anunciaron hoy una nueva iniciativa para hacer el automovilismo más accesible a personas ciegas o con discapacidad visual, mediante un innovador resumen de carrera en formato de audio impulsado por inteligencia artificial.

Presentado por Jeff Dodds, CEO de Formula E, durante el Google Cloud Summit en Londres, este proyecto utiliza tecnología generativa de IA de Google Cloud para crear resúmenes de audio ricos en descripción de cada carrera del E-Prix.

Estos reportes ofrecerán a los aficionados un recuento dinámico que captura la emoción y los momentos clave de cada competencia, disponible bajo demanda poco después de que ondee la bandera a cuadros.

La iniciativa surgió a partir de un hackathon organizado por Google Cloud durante el London E-Prix 2024. Se está desarrollando en estrecha colaboración con el Royal National Institute of Blind People (RNIB), con el fin de asegurar que el producto final cumpla con las necesidades de personas con discapacidad visual.

Formula E y Google Cloud trabajarán con RNIB para realizar grupos focales y pruebas de usuario durante los fines de semana de carrera en Berlín y Londres, con el objetivo de hacer un lanzamiento completo para la Temporada 12.

¿Cómo funciona la tecnología?

El resumen en audio se crea mediante un proceso de múltiples etapas impulsado por la plataforma de IA de Google Cloud, Vertex AI:

  • Transcripción

El modelo Chirp de Google transcribe con precisión los comentarios en vivo de la carrera.

  • Análisis y generación

Los modelos Gemini de Google analizan esa transcripción junto con los datos de cronometraje en vivo y otra información oficial de la carrera.

El sistema identifica eventos clave –como rebases, incidentes o paradas en pits estratégicas– y genera un resumen basado en hechos y con un estilo atractivo.

  • Producción de audio

Finalmente, el texto se convierte en voz natural y expresiva utilizando tecnología avanzada de texto a voz, generando un reporte de audio pulido y listo para su distribución.

Todo este proceso se completa en cuestión de minutos tras el final de la carrera. Los reportes estarán disponibles a nivel mundial en Spotify y otras plataformas de audio populares, en más de 15 idiomas, incluidos inglés, español, francés, alemán, mandarín y árabe.