Mostrar el registro sencillo del objeto digital
dc.contributor | Nikolaevna Ledeneva, Yulia | |
dc.contributor.author | García Martínez, Detzani | |
dc.date.accessioned | 2017-09-26T16:15:16Z | |
dc.date.available | 2017-09-26T16:15:16Z | |
dc.date.issued | 2017-06 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11799/67394 | |
dc.description.abstract | Hoy en día, la mayoría de personas tiene la necesidad de usar internet para mantenerse actualizados teniendo acceso ilimitado a la información, entre ellos se encuentra la necesidad de utilizar las redes sociales para comunicarse con familiares o amigos y compartir intereses en común sin importar la distancia (Echeverría, 2013). Existe una gran cantidad de medios sociales ofrecidos por internet como Twitter que es una red social de servicios web de micro-blogs muy populares, fue fundada en 2006 y en tan solo 10 años se ha convertido en una de las redes sociales más populares del internet, con más de 600 millones de usuarios. Según la estadística de Miniwatts Marketing Group (MMG, 2017), en abril del presente año existían 3,739,698,500 usuarios en internet, lo que significa que más de 16.5% de personas usan Twitter como medio de comunicación. La Fundación Española de la Ciencia y la Tecnología (FECYT, 2017) en abril del presente año, presento los resultados de la VIII Encuesta de la Percepción Social de la Ciencia, menciona que las redes sociales se sitúan como la fuente preferida de los ciudadanos para informarse sobre temas científicos, en un porcentaje de un 43,6%. Twitter permite a los usuarios de la red enviar mensajes cortos de hasta 140 caracteres de texto, llamados “tweets”, compartiendo información de cualquier actividad diaria que expresa intereses en tiempo real. Debido a la gran cantidad de texto generada por cada usuario, se convierte en una mina de datos por explorar, conocer y abundar de manera más profunda o analítica, para ello es necesario obtener información de los tweets que resulten relevantes a una temática en específico. En los miles de millones de tweets que circulan en la red diariamente se pueden encontrar diversos temas de interés para fines diversos como tendencias, preferencias, aptitudes, experiencia, marketing, entre otros a través de palabras clave. Las palabras clave son palabras que capturan los temas principales de un documento y benefician tareas de procesamiento del lenguaje natural como: resúmenes, recuperación de información y respuesta a preguntas (Kim et al., 2010). En esta tesis, para la tarea de extracción de palabras clave se identifica un conjunto de características en común que hay dentro de un texto, las cuales trabajan a nivel léxico, denominado, patrones léxicos. Los patrones léxicos son secuencias de caracteres generadas a través de reglas (definidas por el lenguaje), las cuales representan palabras candidatas a ser palabras clave (Hernández, 2016), (Gallegos, 2016). Pueden ser obtenidas a partir de secuencias con un número de repeticiones llamadas secuencias frecuencias maximales (García, 2004), (García, 2006), (Camacho, 2015). En el presente trabajo, se extraen palabras clave a partir de patrones léxicos en Twitter, se realizaron experimentos con el corpus “Opinosis” que está constituido por 51 archivos que cuentan con tweets, se crearon dos gold standard: el primero está conformado por palabras clave como frases nominales (Bellaachia et al., 2014) y el segundo se conforma por palabras clave donde cada archivo cuenta con palabras clave asignadas manualmente. Los resultados obtenidos en esta tesis se comparan con los métodos del estado del arte: TF-IDF (Hasan & Ng, 2010). y TextRank (Hasan & Ng, 2010), que son considerados métodos no supervisados para la extracción de palabras clave. | es |
dc.language.iso | spa | es |
dc.publisher | Universidad Autónoma del Estado de México | es |
dc.rights | openAccess | es |
dc.rights | openAccess | es |
dc.subject | Palabras clave | es |
dc.subject | Procesamiento de lenguaje Natural | es |
dc.subject | Patrones léxicos | es |
dc.subject | Redes sociales | es |
dc.subject | Opinosis | es |
dc.title | Extracción de palabras en twitter utilizando patrones léxicos | es |
dc.type | Tesis de Licenciatura | es |
dc.provenance | Académica | es |
dc.road | Dorada | es |
dc.ambito | Local | es |