Tendencias 21
   




Crean un robot que aprende un idioma como lo hace un niño

Relaciona imágenes de video con subtítulos y mediante algoritmos entiende significados


Investigadores del MIT han desarrollado un sistema que permite a un robot aprender un idioma tal como lo hace un niño: es capaz de relacionar imágenes de video con subtítulos descriptivos y mediante algoritmos “entender” significados, incluso del lenguaje coloquial.


Redacción T21
08/11/2018

Imagen: MIT News.
Imagen: MIT News.
Investigadores del Instituto Tecnológico de Massachusetts han desarrollado un analizador semántico que aprende el lenguaje de la misma forma que lo hacen los niños, lo que permitirá a un robot aprender a hablar de forma más rápida y natural.

Se trata de toda una proeza tecnológica, ya que hasta ahora los analizadores semánticos utilizados en computación basan su aprendizaje en oraciones creadas por seres humanos que describen la estructura y significado que ocultan las palabras. Con este sistema tradicional se han creado por ejemplo sistemas de reconocimiento de voz, como los de Alexa (el servicio de voz ubicado en la nube de Amazon) o Siri, el asistente inteligente de Apple.

En un artículo presentado en la conferencia Empirical Methods in Natural Language Processing celebrada en Bélgica, los investigadores del MIT describen un analizador que aprende a través de la observación para imitar más estrechamente el proceso de adquisición del lenguaje de un niño, toda una revolución en el campo del aprendizaje automático.

Para aprender la estructura del lenguaje, este analizador observa videos subtitulados, sin otra información, y asocia las palabras de los subtítulos con los objetos y acciones grabadas. De esta forma, puede usar lo que aprendió sobre la estructura del lenguaje para predecir con precisión el significado de una oración, en algún momento incluso sin necesidad de apoyarse en  el video.

Imitando a los niños

Este sistema imita la forma en la que los niños aprenden un idioma: lo hacen observando su entorno, escuchando a las personas que los rodean y conectando lo que ven con lo que escuchan. De manera similar, el nuevo sistema también observa el entorno, establece relaciones y aprende el idioma.

Gracias a este sistema, un robot dotado con este analizador puede adaptarse a situaciones domésticas especiales: por ejemplo, al lenguaje coloquial que empleamos en familia. Es capaz de observar nuestras expresiones, aunque no estén totalmente ajustadas a la gramática, de aprender lo que significan y de entender una orden que podamos darle, según explica uno de los artífices de este descubrimiento, Andrei Barbu, en un comunicado del MIT.

El analizador también ayudará a comprender mejor cómo aprenden el lenguaje los niños pequeños. "Un niño tiene acceso a información redundante y complementaria de diferentes fuentes, como padres o hermanos que hablan, así como información táctil e información visual que le ayuda a entender el mundo", añade el también coautor Boris Katz.  “Procesar toda esta información sensorial es un rompecabezas increíble. Nuestro trabajo ayudará a entender mejor cómo ocurre este tipo de aprendizaje en el mundo cotidiano".

Aprendizaje visual

Para conseguir este resultado, los investigadores combinaron un analizador semántico con un componente de visión artificial entrenado en reconocimiento de objetos, humanos y actividades en video.

El analizador aprendió analizando 400 videos que muestran a personas realizando una serie de acciones, entre ellas recoger un objeto o dejarlo, o caminar hacia un objeto. Todas las secuencias van acompañadas de un total de 1.200 subtítulos en los que se describen esas acciones.

Al final del aprendizaje, los investigadores comprobaron su eficacia: el sistema fue capaz de reconocer la validez de una oración según la imagen del video: la mujer está recogiendo una manzana.

Un algoritmo de visión computarizada examina cada secuencia del video para rastrear cómo se transforman los objetos y las personas con el tiempo, y determina si las acciones del vídeo se están ejecutando tal como se describe en el subtítulo. De esta manera, determina si el significado del subtítulo se corresponde con la escena del vídeo.

El entrenamiento produce una gramática sintáctica y semántica para las palabras que se aprenden. Dada una nueva oración, el analizador ya no requiere videos, sino que aprovecha su gramática y léxico para determinar la estructura y el significado de la oración.

En última instancia, este proceso significa que el analizador aprende "como si fuera un niño", concluye Barbu. “Ve el mundo a su alrededor y escucha a las personas hablar para aprender el significado. Un día, puedo darle una oración y preguntar qué significa e, incluso sin una imagen, sabe el significado".

Referencia

Grounding language acquisition by training semantic parsers using captioned videos. Ross, C, Barbu, A, Berzak, Y, Myanganbayar, B, Katz, B. Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing.



Artículo leído 3069 veces





Comente este artículo

1.Publicado por Rafergon el 11/11/2018 17:15
Que pasada!!!

2.Publicado por vanessa michelle demtrio aviles el 12/11/2018 21:29
Para mi todo esto se trata de un gran avance tecnológico ,ya que ahora los analizadores utilizados en la computación basan todo su aprendizaje en oraciones que fueron creadas por el ser humano que describen toda su estructura y significado ,y con esto se han creado varios sistemas de reconocimiento de voz .
estos investigadores de este proyecto describen a un analizador que aprende cuando observa lo cual es muy importante .para poder imitar mas estrechamente este proceso del lenguaje de un niño tiene que observar lo que hay en su entorno ,todo un gran descubrimiento en el campo del aprendizaje tecnológico ya que con lo aprendido te puede dar un significado concreto de alguna oración.

Y gracias a este sistema imita la forma en la que los niños y todo esto lo hacen observando o escuchando a las personas que lo rodean y de una manera muy similar y también el robot con este analizador puede adaptarse a las situaciones domesticas ,como el lenguaje que empleamos en la familia ,llegando a la conclusión de que este proyecto tecnológico es muy importante para la sociedad ya que ayudaría mucho ya que podría aprender muchas cosas que para algún proyecto seria muy importante

para este robot repita todo necesita observar los vídeos subtitulados y asocia la palabra de los subtitulo con los objetos y oraciones que se realizan ,esto sirve para que se pueda usar lo aprendido y así predecir con precios ion del significado de las oraciones

Nuevo comentario:
Twitter

Los comentarios tienen la finalidad de difundir las opiniones que le merecen a nuestros lectores los contenidos que publicamos. Sin embargo, no está permitido verter comentarios contrarios a las leyes españolas o internacionales, así como tampoco insultos y descalificaciones de otras opiniones. Tendencias21 se reserva el derecho a eliminar los comentarios que considere no se ajustan al tema de cada artículo o que no respeten las normas de uso. Los comentarios a los artículos publicados son responsabilidad exclusiva de sus autores. Tendencias21 no asume ninguna responsabilidad sobre ellos. Los comentarios no se publican inmediatamente, sino que son editados por nuestra Redacción. Tendencias21 podrá hacer uso de los comentarios vertidos por sus lectores para ampliar debates en otros foros de discusión y otras publicaciones.