Please use this identifier to cite or link to this item: http://dspace.utpl.edu.ec/jspui/handle/20.500.11962/26279
Title: Desarrollo de una aplicación web que permita identificar automáticamente los principales tópicos en documentos médicos digitales /
Authors: Mena Chamba, Andrea Estefanía
metadata.dc.contributor.advisor: Reátegui Rojas, Ruth María
Keywords: Aplicación web.-
Competencias digitales.-
Ingeniero en sistemas informáticos y computación.-
metadata.dc.date.available: 2020-07-29T13:29:14Z
Issue Date: 2020
Citation: Mena Chamba, Andrea Estefanía. (2020). Desarrollo de una aplicación web que permita identificar automáticamente los principales tópicos en documentos médicos digitales /. (Trabajo de Titulación de Ingeniero en Sistemas Informático y Computación ). UTPL, Loja.
Description: Resumen: Topic Modeling o Modelado de temas es una técnica no supervisada del aprendizaje de máquina que permite extraer tópicos o temas desde ciertos documentos y de esta manera poder clasificarlos. Para el presente trabajo de titulación se desarrolló una aplicación web que, con base en el modelo Latent Dirichlet Allocation (LDA) extrae tópicos de documentos con información médica. Se trabajó con un total de 220 documentos digitales que tratan de casos de pacientes con diversas condiciones de salud. Se realizó un pre-procesamiento, lo cual implica una limpieza y refinamiento de los datos para poder definir los datos o términos médicos que puedan representar a los documentos. Posteriormente, se realizó una representación de los documentos a través de una matriz documento-término. LDA se usa con esta matriz y se obtiene las matrices de documento-tópico y tópico-término. Una característica muy importante que se agregó a la aplicación es dar opciones para elegir el número de tópicos. Para esto se utilizó 4 métricas que en base gráficas permiten la selección del número de tópicos. Además, el empleo de terminología especializada en medicina resultó ser una mejor opción al momento de seleccionar el tipo de vocabulario que describa a los documentos. Los resultados se pueden evidenciar mediante mapa de calor, nubes de palabras y una herramienta interactiva llamada PyLDAvis.
metadata.dc.identifier.other: 1344822
URI: http://dspace.utpl.edu.ec/handle/20.500.11962/26279
metadata.dc.type: bachelorThesis
Appears in Collections:Ingeniero en Sistemas Informáticos y Computación



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.