Resumen:
Hoy en día, la cantidad de información electrónica en forma de texto ha aumentado considerablemente por lo que una búsqueda de información puede traer consigo varios documentos recuperados. Posteriormente, los documentos recuperados se tienen que revisar para saber si contienen lo que realmente se busca. Una manera de simplificar una búsqueda es el empleo de palabras o frases clave ya que actúan como filtro en un campo de búsqueda. Las palabras o frases clave se utilizan en muchas áreas, por ejemplo, la mercadotecnia y publicidad, en donde el objetivo es capturar la atención del público. De igual forma, en todo aquello que se quiere dar a conocer hacia el público en general. Ya sean documentos de textos impresos o electrónicos, las frases clave ayudan al lector mostrándole las ideas principales del texto. En esta tesis, se comparan los sistemas de extracción automática de frases clave sobre un conjunto de artículos científicos utilizados en la tarea 5 del SemEval-2010, con el objetivo de conocer qué sistemas pueden encontrar las frases clave que fueron propuestas por un ser humano. En la experimentación se presentan los resultados de la comparación entre los sistemas instalables y en línea. Por último, los resultados de la evaluación se comparan con los de la tarea 5 del SemEval-2010.
Descripción:
El manejo de información en la actualidad es un factor de gran importancia dentro de los
sectores públicos y privados. Con el crecimiento constante de los volúmenes de información
electrónica, ésta requiere ser organizada para su uso. Con la tecnología que se cuenta hoy
en día, el manejo de la información se ha facilitado. Dentro del área de Procesamiento de
Lenguaje Natural una de las disciplinas que la integran es la Recuperación de Información (RI).
La RI es el proceso de encontrar en un repositorio grande de datos, material (usualmente
documentos) de naturaleza no estructurada (usualmente texto) o semiestructurada (páginas
Web) que satisfaga una necesidad de información [Manning 09]. Para lograr la RI, existen
varios sistemas, estos reciben el nombre de sistemas de recuperación de información. Un
Sistema de Recuperación de Información (SRI) consiste básicamente de un conjunto de
procesos interrelacionados que permiten obtener información de interés, a partir de una
determinada consulta [Jiménez 03].
Un ejemplo de un SRI es un buscador Web, ya que se ingresa una búsqueda y este devuelve
los resultados que han coincidido con el texto de entrada.