Lectora de labios precisa y rápida
🕔 07 de Enero de 2017Científicos de Oxford desarrollaron tecnología que pueden leer sus labios
- Una lectora de labios nueva IA ha sido construida para procesar frases enteras a la vez, permitiendo que la AI para enseñar a sí mismo qué letra corresponde a cada movimiento de la boca ligera.
- LipNet era 1,78 veces más preciso que los lectores de labios humanos en la traducción de las mismas frases.
"EL LABIOLECTURA MODELO DE PRIMER NIVEL DE LA ORACIÓN"
La lectura de labios es una forma de entender el habla mediante la interpretación de movimiento de los labios de una persona. Sin embargo, el lenguaje humano es muy complejo y matizado, en donde un movimiento de labios podría corresponder a diferentes fonemas o unidades básicas de sonido . Por lo tanto, la práctica es propenso a errores, que a veces puede conducir a resultados humorísticos .
Científicos de la Universidad de Oxford han descrito un sistema de inteligencia artificial , llamado LipNet, que se puede leer con precisión los labios. El sistema emplea un aprendizaje profundo para capacitar a sí mismo utilizando 29.000 vídeos de tres segundos de duración etiquetados con subtítulos.
Un sistema anterior leer los labios en forma de palabra a palabra, donde se enseñó a asociar un fonema con un cierto movimiento de los labios. Se consigue una precisión de 79,6 por ciento. LipNet por otra parte, funciona en frases enteras a la vez, el logro de una precisión de 93,4 por ciento. Cuando se compara con los lectores de labios humanos que obtuvieron una precisión del 52,3 por ciento, LipNet era 1,78 veces más preciso que en la traducción de las mismas frases.
MÁS HERRAMIENTAS PARA PERSONAS CON DISCAPACIDAD AUDITIVA
Mientras que la precisión del sistema es impresionante, todavía no es perfecto. Los videos alimentados a ella tenían la iluminación ideal y el altavoz frontal frente a la cámara. Los resultados pueden variar cuando se hace con un vídeo de menos ideal, lo que resulta en un cierto escepticismo sobre los resultados de la investigación.
Sin embargo, la tecnología hace prometedores, y los científicos están buscando aplicaciones de esta tecnología. Por ejemplo, podría ser utilizado como una herramienta para personas con discapacidad auditiva. Otras tecnologías de resolver este problema de diferentes maneras como tomar ventaja de sustitución sensorial .
De acuerdo con la OpenAI Jack Clark, conseguir que esto funcione en el mundo real tendrá tres mejoras principales: una gran cantidad de vídeo de personas que hablan en situaciones del mundo real, para obtener el AI para ser capaz de leer los labios de varios ángulos, y variando la tipos de frases que la IA puede predecir.
Fuente: www.futurism.com