Please use this identifier to cite or link to this item:
http://dspace.utpl.edu.ec/handle/20.500.11962/27475
Title: | Desarrollo de una aplicación web que permita identificar automáticamente los principales tópicos o temas de periódicos digitales / |
Authors: | Pacheco Guevara, Lizbeth Carolina |
Keywords: | Aplicación web.- Competencias digitales. Ingeniero en sistemas informáticos y computación.- |
Issue Date: | 2021 |
Citation: | N/D. (2021). Desarrollo de una aplicación web que permita identificar automáticamente los principales tópicos o temas de periódicos digitales /. (Trabajo de Titulación de Ingeniero en Sistemas Informáticos y Computación ). UTPL, Loja. |
Description: | Resumen: Actualmente existe gran cantidad de información de documentos en formato digital (periódicos, revistas, documentos médicos) de los cuales una tarea importante es identificar los principales tópicos automáticamente. LDA, es una técnica no supervisada que crea automáticamente tópicos basados en patrones de aparición de palabras en los documentos que se analizan. El objetivo del presente Trabajo de Titulación fue desarrollar una aplicación web en donde se aplica LDA para el análisis y extracción de temas automáticamente. Se trabajó con un total de 198 documentos de noticias digitales obtenidas del blog de noticias de la Universidad Técnica Particular de Loja, se aplica pre-procesamiento de datos y representación en espacios vectoriales, tarea importante a priori para optimizar el rendimiento del algoritmo. La aplicación está desarrollada en Django. Permite cargar una cantidad de documentos, elegir el número de tópicos para luego crear el modelo LDA en base a una referencia dada por la métrica Coherence Model. Finalmente,descargar y analizar los resultados obtenidos mediante la representación de nube de palabras, documento-tópico y tópico-términoypyLDAvis. |
URI: | http://dspace.utpl.edu.ec/handle/20.500.11962/27475 |
Appears in Collections: | Ingeniero en Sistemas Informáticos y Computación |
Files in This Item:
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.