Por favor, use este identificador para citar o enlazar este ítem: http://dspace.utpl.edu.ec/jspui/handle/20.500.11962/26279
Título : Desarrollo de una aplicación web que permita identificar automáticamente los principales tópicos en documentos médicos digitales /
Autor : Mena Chamba, Andrea Estefanía
metadata.dc.contributor.advisor: Reátegui Rojas, Ruth María
Palabras clave : Aplicación web.-
Competencias digitales.-
Ingeniero en sistemas informáticos y computación.-
metadata.dc.date.available: 2020-07-29T13:29:14Z
Fecha de publicación : 2020
Citación : Mena Chamba, Andrea Estefanía. (2020). Desarrollo de una aplicación web que permita identificar automáticamente los principales tópicos en documentos médicos digitales /. (Trabajo de Titulación de Ingeniero en Sistemas Informático y Computación ). UTPL, Loja.
Descripción : Resumen: Topic Modeling o Modelado de temas es una técnica no supervisada del aprendizaje de máquina que permite extraer tópicos o temas desde ciertos documentos y de esta manera poder clasificarlos. Para el presente trabajo de titulación se desarrolló una aplicación web que, con base en el modelo Latent Dirichlet Allocation (LDA) extrae tópicos de documentos con información médica. Se trabajó con un total de 220 documentos digitales que tratan de casos de pacientes con diversas condiciones de salud. Se realizó un pre-procesamiento, lo cual implica una limpieza y refinamiento de los datos para poder definir los datos o términos médicos que puedan representar a los documentos. Posteriormente, se realizó una representación de los documentos a través de una matriz documento-término. LDA se usa con esta matriz y se obtiene las matrices de documento-tópico y tópico-término. Una característica muy importante que se agregó a la aplicación es dar opciones para elegir el número de tópicos. Para esto se utilizó 4 métricas que en base gráficas permiten la selección del número de tópicos. Además, el empleo de terminología especializada en medicina resultó ser una mejor opción al momento de seleccionar el tipo de vocabulario que describa a los documentos. Los resultados se pueden evidenciar mediante mapa de calor, nubes de palabras y una herramienta interactiva llamada PyLDAvis.
metadata.dc.identifier.other: 1344822
URI : http://dspace.utpl.edu.ec/handle/20.500.11962/26279
metadata.dc.type: bachelorThesis
Aparece en las colecciones: Ingeniero en Sistemas Informáticos y Computación

Ficheros en este ítem:


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.