martes, marzo 13, 2012
|
Hoy quiero compartir con ustedes el resultado de un extraordinario trabajo que sale de los laboratorios de Investigación y Desarrollo de Microsoft, en forma de una demostración que llaman el "Microsoft Vocal Translator" (El Traductor de Voz de Microsoft).
Si tan solo ven el video, sin la explicación que ofrezco a continuación, es posible que no noten la importancia de este adelanto. En esencia, el video combina varias tecnologías para crear un traductor de voz representado por un avatar (es decir, por una figura que se parece a ti, y te representaría en entornos virtuales o físicos en el futuro). Es importante notar que esto no es un traductor de idiomas (aunque ciertamente esa es una de sus posibles futuras aplicaciones), sino que un traductor de voz. En otras palabras, esto toma tu imagen y voz y la replica. El software que hace esta magia toma un simple video en 2D de tu persona de unos 20 minutos de duración, y con la información que deduce de este puede reconstruir una réplica digital de tu cara, y del sonido de tu voz, de modo que el sintetizador de voz emitirá palabras que parecen haber sido pronunciadas por ti. Esto creo que nos acerca rápidamente a un escenario que por años he mencionado en eliax: El momento en donde será imposible, o al menos bastante difícil, identificarte remotamente ante otras personas. Es importante destacar también que aunque este video funciona por el momento en un ambiente controlado, que nada evitaría por ejemplo que te filmen con una cámara escondida en la calle para obtener no solo los datos necesarios para reproducir la imagen de tu cara, sino que obviamente también para reproducir tu voz. Pero, ¿y cuál es el problema? Pues un rápido ejemplo me viene a la mente: ¿Qué sucedería si un banco dentro de unos años acepta video-conferencias como una manera de ponerte en contacto con ellos y realizar transacciones? Es posible que puedes utilizar "ingeniería social" para engañar con una imagen de otra persona renderizada de forma foto-realista a otra persona en el banco con la cual ya existe cierto grado de confianza. En esencia, engañarías a esa otra persona para que crea que el actor digital es la persona a la cual quieres robarle su dinero. Noten que en el video podrá apreciar cerca del final que el actor digital en pantalla incluso mueve la cabeza y los músculos de su cara (fíjense en las cejas) en respuesta a la persona que presenta el video, en esencia copiando sus movimientos, lo que haría a estas representaciones digitales bastante convincentes. Noten además que el software puede generar los movimientos de labios necesarios para que estos compaginen con las palabras sintéticas del software. Entonces, ¿qué significa esto? Pues que cuando esta tecnología se perfeccione y sea difícil discernir una persona de su avatar, tendremos que recurrir a otros niveles de seguridad (como claves y/o certificados digitales) para nosotros poder probar que somos nosotros. Y eso, si lo piensan bien, significa que empezaremos a incorporar en nuestro lenguaje, y en el ADN de nuestra sociedad, protocolos de comunicación bastante similares a los protocolos de comunicación de computadoras hoy día. O en otras palabras, esto en realidad apunta a una necesidad que tendremos en el futuro de fusionarnos cada vez más con máquinas de nuestra creación para poder hacer que la sociedad continúe funcionando. Video a continuación (enlace YouTube)... autor: josé elías |
20 comentarios |
Opinión / Análisis , Predicciones , Psicología , Software , Tecno-Seguridad , Tecnología Visual , Videos , Windows / Microsoft |
Comentarios
Añadir Comentario |
"Wow... Google , es una máquina de dinero... ya veo como hacen tanto dinero
Google , dominará al Mundo... ya verás"
Google , dominará al Mundo... ya verás"
en camino a la singularidad...
©2005-2024 josé c. elías
todos los derechos reservados
como compartir los artículos de eliax
Seguir a @eliax
I.M.P.R.E.S.I.O.N.A.N.T.E.