Revista de Divulgación Científico-Tecnológica del Gobierno del Estado de Morelos

El lenguaje entre las computadoras y los humanos

Lenguaje Computadores
MC Norma J. Ontiveros Hernández / Esta dirección de correo electrónico está protegida contra spambots. Usted necesita tener Javascript activado para poder verla.
Instituto Tecnológico de Zacatepec
Dr. Miguel Pérez Ramírez / Esta dirección de correo electrónico está protegida contra spambots. Usted necesita tener Javascript activado para poder verla.
Instituto de Investigaciones Eléctricas
Archivo: Inteligencia Artificial

Procesamiento de Lenguaje Natural (PLN) es una de las ramas de la inteligencia artificial y de la lingüística, cuyo objetivo es lograr que las computadoras entiendan y sean capaces de generar el lenguaje natural. Un Lenguaje Natural (LN) es el que las personas usan para comunicarse, ya sea en forma escrita o hablada como es el caso del español, el inglés, el japonés o el francés, por mencionar algunos ejemplos.
Aunque se mencionan diferentes aplicaciones prácticas del PLN, uno de los principales objetivos o quizá sueños de los científicos de la computación en esta área, es lograr la comunicación entre humanos y computadoras. Este objetivo se plasmó incluso en obras de ciencia ficción como es el caso de la obra de Arthur C. Clarke, 2001: Odisea del espacio (Clarke, 1968), donde aparece HAL (nombre formado con las letras que preceden a cada sigla de IBM), una computadora que no solo es capaz de entender y hablar inglés, sino que incluso puede leer los labios.
Sin embargo, hay instituciones alrededor del mundo que trabajan en esta área, que persiguen objetivos y metas con alcances parecidos a los de la ficción. Por ejemplo, el grupo de PLN de Microsoft.

Aplicaciones del lenguaje natural
          Hay avance en diferentes áreas que se visualizan en diferentes tipos de aplicaciones. Algunos ejemplos son:
Recuperación de información. Donde aún sin darnos cuenta ya empezamos a utilizar cotidianamente algunas aplicaciones que involucran el uso de técnicas de PLN. Al navegar en Internet frecuentemente buscamos información, para lo cual utilizamos motores de búsqueda como Google, Yahoo u otros, éstos utilizan técnicas de PLN para buscar la información solicitada.
Corrección automática de textos. Esto es familiar en procesadores de texto, tales como MS Word, que nos señala cuando detecta faltas de ortografía, palabras repetidas, errores de puntuación, etc.
Interfaces humano computadora. Probablemente son estas interfaces las que materializarían los sueños de los investigadores del PLN. Una de las características deseables de estas interfaces, sería que pudieran reconocer y generar el lenguaje hablado, lo cual también implica un alto grado de dificultad. Existen productos que operan mediante la voz del usuario, como es el caso de Dragon Naturally Speaking (Nuance, 2011). Existen otras aplicaciones que reconocen, interpretan y ejecutan comandos de sistema operativo. (Del Rosario, et al, 2007).
Existen otras aplicaciones tales como traducción de textos (ej. Babylon, “WordMagic”, Eurotraductor, etc.), sistemas inteligentes para la Educación y el Entrenamiento, aplicaciones de síntesis de voz, para agregar voz a un texto, etc.

Enfoques para el PLN
          La meta de lograr que las computadoras sean capaces de entender y generar un lenguaje natural, ha probado ser difícil de alcanzar. Hasta la fecha no existe un sistema que sin lugar a dudar lleve a cabo un análisis del lenguaje, con resultados idénticos a los del ser humano y que interactué con las personas como si estuvieran hablando con otras personas. Pero hay aproximaciones con diferentes niveles de avance, logradas principalmente dentro de dos enfoques de análisis: el enfoque estadístico y el enfoque lingüístico del análisis del lenguaje.

Análisis estadístico del lenguaje
          En este enfoque los sistemas de recuperación de información son típicos y operan de la siguiente manera (Camejo, 2011). Primero deben contar con el índice de un conjunto de documentos, el cual es creado mediante la descripción de los documentos. La descripción de un documento es un conjunto de palabras que mejor representan su contenido. Al hacer una consulta, la sentencia dada por el usuario, al igual que los documentos es procesada, de tal modo que se también se obtiene una descripción de dicha consulta. Después se comparan las descripciones de los documentos, con la descripción de la consulta del usuario. Como resultado se listan los documentos ordenados de mayor a menor parecido entre sus descripciones y la descripción de la consulta del usuario.

Análisis lingüístico del lenguaje
          En este enfoque, a fin de eficientar el procesamiento del lenguaje, el análisis es usualmente dividido en al menos los siguientes cinco niveles: Fonología: La fonología estudia como los sonidos son utilizados en el lenguaje hablado. Morfología: analiza la manera en la que las palabras están compuestas por partes más pequeñas como en el caso de una derivación, por ejemplo a partir del sustantivo nación podemos derivar el adjetivo nacional. Sintaxis o parsing: Analiza cómo las palabras de una oración se relacionan y cuál es la función que cada palabra realiza en esa oración (sujeto, predicado, sustantivo verbo, etc.). Semántica: Su propósito es “entender” la frase. Los significados de las palabras son utilizados para dar significado literal a las oraciones. Pragmática: Analiza cómo el contexto (información ambiental), influencia el significado de las oraciones. Por ejemplo, si María le dice a Juan, La puerta esta abierta, es necesario saber a que puerta se refiere María (podría haber varias puertas, pero ella se refiere a alguna en específico), pero también se necesita saber la intensión de María y puede haber varias posibilidades: podría ser una simple afirmación haciendo ver a Juan que la puerta está abierta, podría ser una explicación de cómo el gato entró a la casa, podría ser una requerimiento a Juan para que cierre la puerta, etc.

Análisis del discurso
         Cuando nos comunicarnos, usamos un conjunto de oraciones que están relacionadas, al cual se le llama discurso (Jurafsky y Martin, 2011). El estudio del discurso analiza la manera en la que las oraciones se conectan para transmitir alguna información (Covington, 1994). Por ejemplo en el minidiscurso: Ayer Lalo vio un auto en venta. Le gustó el color, pero sobre todo su precio, “Le” se refiere a Lalo y “su” se refiere a su del auto, de este modo se relacionan las dos oraciones.

Discusión
         La problemática asociada a la comprensión y reconocimiento del lenguaje natural, es debida a la complejidad, irregularidad y diversidad del lenguaje humano. Uno de los problemas del enfoque estadístico, es que se trabaja con la frecuencia de ocurrencias de palabras más que con significados. Por otro lado, el enfoque lingüístico enfrenta diversos problemas, entre ellos, el manejo del dinamismo de la información contextual, la ambigüedad, que surge cuando una expresión en Lenguaje Natural puede tener más de una interpretación y que es considerada uno de los problemas más importantes a resolver durante el PLN.
Conclusiones
         El PLN es una área fascinante que nos enfrenta con nosotros mismos, es decir, nos enfrenta con la necesidad de comprender cómo operamos cuando usamos el lenguaje. Para lograr que una computadora use el lenguaje como lo hacemos nosotros, necesitamos saber primero como es que nosotros podemos utilizar un lenguaje, como es que nuestro cerebro integra toda la información que recibe y como selecciona la que debe utilizar durante el uso del lenguaje. Si logramos esta comprensión de nosotros mismos, podríamos también ordenar nuestros esfuerzos para poder lograr las metas del PLN.

Lenguaje Computadoras
Referencias

(Camejo, 2011)
Yordan Camejo Sequeira. Procesamiento del lenguaje natural para recuperar información. http://www.monografias.com/trabajos81/procesamiento-lenguaje-natural-recuperar-informacion/procesamiento-lenguaje-natural-recuperar-informacion2.shtml. Disponible en Septiembre de 2011.
(Chakraborty, 2010)
Chakraborty RC. AI Course Lecture 41, notes slides. http://www.myreaders.info/10_Natural_Language_Processing.pdf. Disponible en Agosto de 2011.
(Clarke, 1968)
Arthur C. Clarke. 2001: Odisea del espacio.
(Covington, 1994)
Michael A. Covington 1994. Natural language processing for prolog programmers. Prentice Hall. Inc. 1994.
(Del Rosario, et al, 2007)
R. D. Del Rosario-Montes, P. Hernández-Martínez, y M. Pérez-Ramírez. Reconocedor de comandos en español. ciindet 2004. Cuernavaca Mor. México.
(Jurafsky y Martin, 2011)
D. Jurafsky and J.H. Martin. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Chapter 18, SPEECH and LANGUAGE PROCESSING. http://www-cs.ccny.cuny.edu/~esther/SNLP/presentations/Discourse_Presentation_By_Sumon_Azhar.pdf. Disponible en Sep de 2011.
(Nuance, 2011)
Dragon NaturallySpeaking Solutions. 2002-2011 Nuance Communications, Inc. All rights reserved. http://nuance.com/for-individuals/by-product/dragon-for-pc/index.htm. Disponible en Septiembre de 2011.

 


Semblanza


Norma Josefina Ontiveros Hernández es maestra en Ciencias de la Computación por el Centro Nacional de Investigación y Desarrollo Tecnológico (CENIDET), desde 1995. Ha fungido como Catedrática del Sistema de Institutos Tecnológicos desde 1986. Ha fungido como Jefa de Proyecto de Vinculación del Departamento de Sistemas y Computación del Instituto Tecnológico de Zacatepec. Ha publicado diferentes artículos en congresos nacionales e internacionales.

 


Semblanza


Miguel Pérez Ramírez es doctor en Ciencia de la Computación por la Universidad de Essex UK (2003). Investigador del instituto de Investigaciones Eléctricas (IIE) desde 1992. Ha fungido como líder del Grupo de Realidad Virtual del IIE, desde su fundación en el año 2003. Ha publicado diferentes artículos en congresos nacionales e internacionales, en temas tales como diseño de bases de datos, procesamiento de lenguaje natural, herramientas de aprendizaje y realidad virtual. Ha impartido clases a nivel Ingeniería y maestría en el ITESM Campus Cuernavaca y Morelia.