La startup británica Synthesia ha lanzado Synthesia 3.0, introduciendo lo que llaman Video Agents: avatares digitales capaces de interactuar en tiempo real con los usuarios, no solo reproducir contenido prefabricado.
¿Qué hacen los Video Agents?
-
Transforman videos pasivos en experiencias conversacionales: el avatar escucha lo que dices, responde, hace preguntas y reacciona contigo.
-
Utilizan avatares de estilo realista capaces de parpadear, mover la cabeza y sincronizar labios con voz.
-
Pueden personalizarse para que imiten el tono, acento o estilo de voz del modelo humano elegido.
-
Pueden integrarse en procesos empresariales repetitivos: selección de personal, formación, tutoriales, soporte al cliente, etc.
Implicaciones y retos
Oportunidades
-
Democratiza la interacción audiovisual: en vez de consumir pasivamente, puedes tener “conversaciones” con contenido visual.
-
Aumenta la eficiencia en empresas al automatizar tareas que requieren presentación, atención o explicación.
-
Mejora la personalización: adaptarse al usuario en tiempo real (preguntas, aclaraciones, seguimiento).
Desafíos
-
La IA debe ser muy precisa para evitar respuestas erróneas o poco naturales.
-
Riesgo de desinformación: si el agente responde incorrectamente, puede transmitir datos falsos con apariencia confiable.
-
Ética y consentimiento: recrear voces o rostros reales debe hacerse con permiso y salvaguardas.
-
Barreras tecnológicas: sincronía, latencia, capacidad de procesar lenguaje complejo en tiempo real.


