Resumen:
Este artículo presenta el diseño e implementación de un analizador semántico que identifica la cercanía semántica entre las palabras de una oración usando una ontología. Una definición común de ontología es una especificación explícita y formal de una conceptualización compartida. Esta ontología puede ser una herramienta importante al representar un texto descriptivo y analizar textos en español. El analizador semántico extrae datos de una ontología de conocimiento común que consta de relaciones, conceptos y valores almacenados con base en su significado. La ontología básica comienza con datos cualitativos alimentados manualmente por un usuario. El analizador responde "verdadero" si una oración está semánticamente relacionada o "falso" si no lo es. Su utilidad radica en hacer preguntas en lenguaje natural a una biblioteca digital y para que los robots de servicios entiendan el significado de la acción a realizar. Se ha probado su eficiencia usando el corpus CONLL v.2009 obteniéndose una buena precisión en sus resultados.
Descripción:
Analizar un texto de algún tema particular en lenguaje natural y convertirlo a una estructura entendible por las computadoras, no es tarea trivial. En parte porque en el proceso de conversión se debe comprobar la gramática, semántica, y la pragmática, al menos. Éste es uno de los retos de este proyecto. Con el abaratamiento de las computadoras y el acceso a una gran cantidad de documentos (por ejemplo, en Internet), resulta posible (y deseable) utilizar una computadora para analizar información relevante en documentos que están escritos en lenguaje natural, específicamente en Español. Los analizadores actuales utilizan principalmente la sintaxis, por ejemplo., atienden a las reglas gramaticales del lenguaje en español, pero no toman en cuenta su semántica. Por esta razón, nos hemos dado a la tarea de construir analizadores que usen tanto la información gramatical como la información semántica. Otro reto es la extracción automática de conocimiento en textos. Las herramientas necesarias para esta conversión son etiquetadores, analizadores sintácticos, morfológicos y semánticos. El lenguaje natural tiene como característica inherente la ambigüedad, que en los humanos se resuelve usando el sentido común; sin embargo, estás no son parte de las computadoras. Por ejemplo, “la puerta es amarilla”, en este caso “puerta” se puede referir a la puerta de un carro o a la puerta de una casa, pero ¿cómo puede saber esto la computadora? En este artículo se muestra una herramienta de análisis semántico que permite a la computadora resolver estos problemas.