Resumen:
Los nombres de medicamentos que se parecen, por como se ven o como suenan, son la causa principal de los errores de medicación por confusión. Por esta razón, la Administración de Alimentos y Medicamentos en Estados Unidos ha implementado estrategias para revisar el nombre propuesto de un nuevo medicamento. El objetivo es evitar que se formen pares confusos a partir del nombre propuesto con los que existen en el mercado. Las herramientas utilizadas para identificar pares confusos calculan un valor de similitud entre el nombre propuesto y una base de datos de los nombres de medicamentos previamente registrados. El valor de similitud obtenido es utilizado para identificar nombres potencialmente confusos. En específico, algoritmos de similitud léxica se implementan en esta tesis de manera individual o en combinación para predecir el grado de confusión de dos nombres de medicamentos por su parecido en medios de comunicación escritos o verbales. La presente investigación se enfoca en medir el parecido ortográfico y fonético entre dos nombres a evaluar, a partir de las características presentes en los nombres de medicamentos indicados en los reportes de errores de medicación, con la finalidad de mejorar el proceso de identificación de pares confusos por su parecido ortográfico y fonético. En esta tesis se realiza una revisión de las medidas individuales que consideran los aspectos ortográficos y fonéticos. Además, se estudian las medidas combinadas que consideran simultáneamente ambos aspectos, con el fin de detectar la potencial confusión entre nombres de medicamentos. Asimismo, también se muestra una discusión de los problemas presentes en cada una de las soluciones del estado del arte. En los resultados de esta investigación se presenta un modelo que combina de manera eficaz las características ortográficas y fonéticas que están presentes en los nombres confusos de medicamentos. Para este objetivo, se utilizó un método de regresión logística con un proceso de entrenamiento evolutivo que supera los resultados obtenidos del método tradicional de entrenamiento. Este modelo se ha publicado en una revista especializa arbitrada e indexada de reconocimiento internacional. Del mismo modo, se presenta bajo el mismo principio un modelo que considera al características ortográficas y fonéticas presentes en los pares confusos. Una nueva medida individual de similitud ortográfica para la identificación de pares confusos. También, este resultado ha sido publicado en una revista especializada arbitrada e indexada de reconocimiento internacional. Los resultados publicados en ambos artículos prueban que el modelo de las características extraídas de los pares confusos permite ajustar o diseñar medidas eficaces para el problema de identificación de pares potenciales. El modelado ha sido obtenido de manera automática y adaptado mediante un enfoque evolutivo o con uso de técnicas de aprendizaje automático.