Please use this identifier to cite or link to this item:
http://dspace.utpl.edu.ec/handle/123456789/69755
Title: | Aplicación de algoritmos de aprendizaje automático para extracción de temas en recursos educativos abiertos (OER) |
Authors: | Romero Peláez, Audrey Elizabeth Ludeña Rosales, René Javier |
Keywords: | Ecuador. Tesis digital. |
Issue Date: | 2024 |
Citation: | Ludeña Rosales, R. J. Romero Peláez, A. E. (2024) Aplicación de algoritmos de aprendizaje automático para extracción de temas en recursos educativos abiertos (OER) [Tesis de Grado, Universidad Técnica Particular de Loja]. Repositorio Institucional. https://dspace.utpl.edu.ec/handle/123456789/69755 |
Abstract: | Abstract: The present degree work addresses the application of topic modeling for the extraction of topics from a set of open educational resources, specifically in engineering training scenarios. The corpus used was generated from the repository of SkillsCommons initially comprised of more than 8,800 resources, and a set of 80 resources that in turn contain 103 relevant documents. The extraction of topics was carried out using the Latent Dirichlet Allocation (LDA) algorithm, a model that assumes that a document is a combination of latent themes. Likewise, the C_V coherence metric to measure the semantic coherence of topics and for this purpose Different experiments were carried out to correctly define hyperparameters and obtain the best values. Finally, several themes were identified that reflect different engineering scenarios, which were visualized using the PyLDAvis tool, thus providing an interactive representation that facilitates the understanding of the relationships between topics and associated terms. |
Description: | Resumen:El presente trabajo de titulación aborda la aplicación del modelado de tópicos para la extracción de temas de un conjunto de recursos educativos abiertos, específicamente en escenarios de formación en ingeniería. El corpus utilizado se generó a partir del repositorio de SkillsCommons inicialmente compuesto por más de 8800 recursos, y se seleccionó un conjunto de 80 recursos que a su vez contienen 103 documentos relevantes. La extracción de tópicos se realizó mediante el algoritmo Latent Dirichlet Allocation (LDA), un modelo que asume que un documento es una combinación de temas latentes. Así también, se utilizó la métrica coherencia C_V para medir la coherencia semántica de los temas y con este propósito se realizaron diferentes experimentos para definir correctamente hiperpárametros y obtener los mejores valores. Finalmente, se identificaron varios temas que reflejan distintos escenarios de ingeniería, los que se visualizaron utilizando la herramienta PyLDAvis, proporcionando de esta manera una representación interactiva que facilita la comprensión de las relaciones entre los tópicos y los términos asociados. |
URI: | https://bibliotecautpl.utpl.edu.ec/cgi-bin/abnetclwo?ACC=DOSEARCH&xsqf99=142816.TITN. |
Appears in Collections: | Titulación de Sistemas Informáticos y Computación |
Files in This Item:
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.