INTELIGENCIA ARTIFICIAL: J. Cardeñosa

Un proyecto de la UE integró en una misma plataforma sofisticados sistemas de soporte a la gestión de grandes organizaciones. Les contamos como nos fuimos metiendo en el campo de la Ingeniería Lingüística.


Esta semana pasada he estado en Lisboa. El motivo era académico. Pertenezco a una de las comisiones evaluadoras de la agencia de acreditación de Portugal de títulos universitarios de Informática.  Pude sacar tiempo para conversar con mi colega Palmira Marrafa (ya referenciada en el artículo de este blog como directora de Sara Mendes cuando leyó su tesis doctoral) y nos hemos asegurado la cooperación en la exploración de usos de las aplicaciones de esa empresa que subyace a lo que les voy contando últimamente. Lo que si vamos a hacer de inmediato es la adaptación de las aplicaciones que desarrollemos a la lengua portuguesa.

No pude sin embargo ver a un viejo colega y que viene a colación de lo que les voy contando. Este colega portugués fue el coordinador del Proyecto ORCHESTRA que ya les había mencionado. Y del que les contaré algo hoy. Este macro proyecto de la UE y de casi 10 socios de varios países trató de desarrollar desde una plataforma UNIX pero "bonita" y fácil de usar por sus administradores que se llamó ELENIX, a una serie de aplicaciones empresariales entre las que les comentaré algo más de dos de ellas, pues fueron las que participamos nosotros.

Uno de esos sistemas fue un sistema de negociación, de soporte a las negociaciones y de ayuda a la toma de decisiones. Lo que hicimos fue tomar varios modelos de liderazgo y toma de decisiones colectivas e integrarlos. Y después implementar un sistema computacional con dichos modelos. Este trabajo nos produjo varias publicaciones científicas de calidad (aún citadas hoy en día). Podrán ver esas publicaciones si tienen interés en la producción científica de nuestro grupo de investigación entre los años 1995 y 1998 (más o menos). La integración de los tres modelos fue exitosa al convertir los modelos en reglas (típicas de los sistemas expertos) y unificar el motor de inferencia para el tratamiento de las mismas. Esa tecnología que en el fondo es sencilla, permite integrar problemas aparentemente dispares. Sin embargo y a pesar de que dichos modelos eran novedosos para ser automatizados, ya por aquella época había algunos otros sistemas de ayuda a la toma de decisiones bajo negociación.

Pero quizás el sistema que más satisfacción intelectual nos dio fue el llamado sistema de clasificación y distribución de documentos.  Este sistema pretendía que cualquier correo electrónico o fax en formato electrónico que se enviase a una organización genérica (por ejemplo zzz@zzz.com) llegase al destinatario correcto, es decir  a una persona encargada del tema que se tratase. Ya entonces se sabía de la enorme pérdida de tiempo que se originaba en muchos asuntos de grandes organizaciones cuando una comunicación que venía desde fuera era enviada por personas a personas inadecuadas y entonces o se perdía la comunicación misma o en el mejor de los casos se perdía mucho tiempo.

Así que se ideó un sistema que tenía que ser un registro automático de cada comunicación entrante. Una vez registrada había que clasificarla es decir atribuirle una clase a la que pertenecía y tras eso un segundo filtro que determinaba exactamente a la persona a la que debía ir. Este sistema fue complejo, hubo que idearlo completamente pues no había nada parecido. Una de las ideas que aporté fue la de lo que entonces llamamos "contextos genéricos" que eran una especie de clases que determinaban con mucha precisión  a cuál de ellas pertenecía un documento entrante. Estos contextos genéricos se basaban en una idea sencilla de entender y que se basaba en el examen del vocabulario de dichos documentos y hasta qué punto coincidía con los patrones (también formados por vocabulario) definidos a partir de los distintos departamentos o personas de dicha organización. La idea es tan sencilla como darse cuenta que si decimos dos listas de dos términos (cangrejo, felicidad) o (cangrejo, comida) es darnos cuenta que la segunda tiene más sentido que la primera (una cangrejo puede ser comida o puede comer, pero salvo en una historieta, el concepto de felicidad tiene poco que ver con un cangrejo).

Los contextos genéricos eran pues grupos de palabras que tenían relación entre si dentro de un dominio determinado. Estas palabras  había que determinarlas manualmente o casi. Nuestra capacidad de cómputo en aquel momento era limitada (los ordenadores potentes de entonces eran menos que un teléfono móvil actual). El concepto sigue vivo pero hoy podemos utilizar nuestras propias herramientas (la primera que comercializamos es un potentísimo extractor terminológico) y la idea es que lo hemos necesitado a lo largo de los años en muchas ocasiones. De hecho hemos hecho a lo largo de los últimos 15 años no menos de otros 15 extractores terminológicos lo cual nos ha permitido idearlos, optimizarlos y sobretodo hacerlos manejables por casi cualquiera. Ya llegaremos a él y se lo contare más despacio. En aquella ocasión quizás fue la primera vez que tuvimos esa necesidad de extraer términos de textos de referencia.

El proyecto ORCHESTRA llego a terminarse y era potente y sofisticado. El dia de la entrega final al representante de la UE todos estábamos nerviosos, alguien iba a enviar un fax desde Oporto a Lisboa a una organización y ese fax tenía que llegar exactamente a una persona. El fax se envió y llegó a quien tenía que llegar. En conjunto fue un éxito y como ingenieros que éramos todos nos invadió una gran satisfacción. Pero ahí aprendimos algo duro de tragar. El representante de la UE nos comentó sus impresiones y decía estar satisfechísimo con el trabajo hecho dijo la frase fatídica "este sistema nunca verá la luz". La cara de estupefacción que pusimos todos es difícil de describir. Y siguió explicándonos el "por qué" que estábamos esperando "el sistema es tan sofisticado y tan potente que las organizaciones no están preparadas para trabajar con un sistema así, y cuando lo estén, el sistema estará anticuado".

Hay que decir, que hoy más de 15 años después efectivamente el sistema no se ha utilizado más que en la empresa industrial que participó como usuaria en aquel proyecto. Aún las empresas están lejanas a tener un sistema así, y en ocasiones las cosas han cambiado tanto (en aquella época un tfno. móvil pesaba casi un kilogramo). Que se ganó entonces? Bueno, los equipos que participamos  ya sabíamos hacer esos tipos de sistemas. Se gano el "know-how". Eso sí.

Y como ven, el origen de estas cosas que les voy contando que es el "inventario" de aplicaciones y de conocimientos de a lo largo de los años, se va configurando. Llevamos de momento el analizador morfosintáctico que permite acceder en lenguaje natural a una base de datos y el sistema de clasificación y distribución de documentos. De ahí si que sacamos los conocimientos para tratar con contenidos documentales. Ahí quiero hacer una precisión, Tratar con contenidos no quiere decir "espiar" contenidos. Los documentos se pueden clasificar con mayor o menor precisión, pero leer y entender lo que dice un documento está lejos aún…una de las ramas de la Ingeniería Lingüística es el llamado "natural language understanding" es decir, comprensión del lenguaje, pero entre nosotros hay que matizar que comprensión sería eso que hemos dicho antes, saber de qué va, pero no exactamente lo que dice. No sé si me explico.

El inventario como ven se va formando con cosas que tenemos y con cosas que sabemos. Seguimos otro día con más cosas. Aun estamos en la década de los 90…[

Jesús Cardeñosa
Comentarios Martes, 9 de Julio 2013


Facebook Twitter LinkedIn Google Meneame Viadeo Pinterest

Nuevo comentario:



Editado por
Jesús Cardeñosa
Eduardo Martínez de la Fe
El Profesor Jesús Cardeñosa es Ingeniero Aeronáutico por la Universidad Politécnica de Madrid, así como Master de Ingeniería del Conocimiento. Desde 1988 desarrolla su trabajo en el Departamento de Inteligencia Artificial de la Facultad de Informática de la Universidad Politécnica de Madrid, de la que en la actualidad es profesor titular y Director del Grupo de Validación y Aplicaciones Industriales. Desde1996 representa a la lengua española en el proyecto de la Universidad de las Naciones Unidas UNL (Universal Networking Language) para crear sistemas de soporte al multilingüismo en Internet. Miembro del Consejo Editorial de Tendencias21 desde sus orígenes, Jesús Cardeñosa forma en la actualidad un consorcio internacional con varios países de Latinoamérica para generar textos escolares en lenguas indígenas. Aparte de diversos proyectos nacionales e internacionales, su dedicación actual es impulsar la catedra UNESCO para utilizar tecnologias avanzadas en la generación de contenidos multilingües destinados a la educacion de comunidades indigenas.




Archivo


Comparta nuestros titulares
RSS ATOM RSS comment PODCAST Mobile