Tendencias 21
   




Wikipedia puede otorgar un cierto sentido común a los ordenadores

Un nuevo programa les dota de conocimientos enciclopédicos para comprender y relacionar textos


Un programa informático capaz de dotar a los ordenadores de amplios conocimientos a partir de la popular enciclopedia online Wikipedia, ha sido desarrollado por ingenieros israelíes. Usando los conocimientos de esta enciclopedia, los ordenadores pueden relacionar palabras y adquirir un cierto “sentido común”. El programa tendrá aplicaciones a la hora de filtrar correo electrónico “basura” o para hacer búsquedas en Internet más precisas. Por Raúl Morales.


Raul Morales
26/01/2007

Evgenly Gabrilovich
Evgenly Gabrilovich
Profesores del Departamento de Informática del Technion-Israel Institute of Technology han creado un programa informático capaz de dotar a los ordenadores de amplios conocimientos a partir de la popular enciclopedia online Wikipedia.

Mediante este método, los ordenadores son más inteligentes, según sus creadores, ya que pueden relacionar palabras y diferentes temas con sentido común, tal y como hace el cerebro humano. Tiene aplicaciones a la hora de filtrar correo electrónico “basura” o para hacer búsquedas en Internet más precisas.

El nuevo programa, diseñado por los profesores Evgenly Gabrilovich y Saul Markovitch, dota a los ordenadores de una base de conocimientos, como puede ser nuestra cultura general, y les ayuda a filtrar spam (mensajes de correo electrónico no solicitado), a hacer búsquedas en la web o a conducir inteligencia electrónica a un nivel mucho más elevado que los programas usados actualmente.

Tal como explican los autores en este artículo, su método ayuda a los ordenadores a trazar un mapa de palabras o de fragmentos de un texto a través de una base de datos de conceptos creados a partir de la enciclopedia online Wikipedia. Estos conceptos basados en la enciclopedia actúan como una “base de conocimiento” para ayudar a los ordenadores a hacerse una idea más precisa del significado de un texto introducido, por ejemplo, en un buscador.

Tecnología colaborativa

Wikipedia es una enciclopedia plurilingüe basada en la tecnología wiki. Wikipedia se escribe de forma colaborativa por voluntarios. La tecnología wiki es un sitio web colaborativo que puede ser editado por varios usuarios. Los usuarios de una wiki pueden así crear, editar, borrar o modificar el contenido de una página web, de una forma interactiva, fácil y rápida.

Dotar a los ordenadores de un conocimiento más profundo es un problema que viene de lejos en inteligencia artificial. “Los seres humanos utilizamos una gran cantidad de conocimientos de base para comprender un texto, pero no sabíamos cómo hacer para que los ordenadores también pudieran acceder a ese tipo de conocimientos”, afirma Markovitch en una nota de prensa difundida por el American Technion Society, la división americana del Technion-Israel Institute of Technology.

Comprender textos

Los buscadores de Internet y los filtros de correo electrónico que usamos en la actualidad únicamente calculan la periodicidad con la que aparece cierta palabra en dos textos diferentes. Sin embargo, son incapaces de comprender, ya que tratan un texto cómo si fuera una colección de palabras, sin entender lo que significan juntas.

Como explica el profesor Markovitch, este conocimiento superficial de las palabras es lo que hace que, por ejemplo, un filtro de correo electrónico bloquee todos los mensajes que contengan la palabra “vitamina” y que no bloquee aquellos mensajes que contengan la palabra “B12”. “Si el programa nunca ha visto la palabra “B12” para él es una palabra sin sentido, pero para nosotros “B12” es un tipo de vitamina.”

“Con este software el ordenador usará sus conocimientos adquiridos a través de Wikipedia y será capaz de asociar la palabra “B12” a la palabra “vitamina” e identificará como correo basura también los mensajes que contengan la primera palabra.”, concluye.

Sentido común

Este método acerca los ordenadores a lo que en los seres humanos llamamos “sentido común”. Así, les permitirá comprender términos ambiguos, decidiendo, por ejemplo, cuando la palabra “ratón” se refiere al animal o al dispositivo informático.

En el futuro, sus creadores esperan mejorar su método añadiendo información de las páginas web enlazadas desde los artículos de Wikipedia. En este momento están patentando su trabajo, que sin duda será de gran interés para empresas que desarrollan buscadores, como Google o Microsoft.

El proyecto tiene algunos antecedentes. Uno de ellos es el conocido bajo las siglas Cyc, un proyecto de inteligencia artificial que ensambla una ontología comprensiva y una base datos del conocimiento general con el fin de permitir a las aplicaciones de inteligencia artificial realizar razonamientos del tipo humano.

Tal como explicamos en un anterior artículo, representar el conocimiento de sentido común en ordenadores es un desafío aún no superado por la Inteligencia Artificial, por lo que el programa desarrollado por ingenieros israelíes debe considerarse como un paso más en la conquista de esa pretendida proeza tecnológica.



Artículo leído 12503 veces