Bitte benutzen Sie diese Kennung, um auf die Ressource zu verweisen:
http://dspace.utpl.edu.ec/handle/20.500.11962/28220| Titel: | Minería de texto y modelamiento de tópicos en artículos científicos digitales |
| Autor(en): | Briceño Martínez, Ximena Mercedes |
| Director: | Reátegui Rojas, Ruth María |
| Stichwörter: | Ecuador. Tesis digital. |
| Erscheinungsdatum: | 2021 |
| Zitierform: | Briceño Martínez, X. M. Reátegui Rojas, R. M. (2021) Minería de texto y modelamiento de tópicos en artículos científicos digitales [Tesis de Grado, Universidad Técnica Particular de Loja]. Repositorio Institucional. https://dspace.utpl.edu.ec/handle/20.500.11962/28220 |
| Zusammenfassung: | Abstract:The degree work presentsthe application oftopic modeling,to identify barriers for women in STEM (Science, Technology, Engineer, Mathematics); topic modeling is a technique that extracts a specified number of topics from an input data set. The corpus used was generated from a search in the Scopus database, from 2000 to 2020; in addition, the use of keywords(STEM, women STEM, STEM barriers, gender barriers, gender disparities)and logical connectors; a total of 141 abstracts of digital articles were worked on. Topics were extracted using the LDA (Latent DirichletAllocation) algorithm, which assumes that a document is a random mix of latent topics; furthermore, with the use of thematic coherence in severalexperiments, it was possible to define the optimal number of topics (coherence graph).As a result, gender bias, lack of motivation, stereotypes and the lack of insertion programs for STEM women were obtained; as the most representative topics, which refer to some of the barriers of women in STEM.A visualization of the resulting topics is provided, through several graphs such as: PyLDAvis, word cloud, frequency diagram, heat map, histogram, TreeMap, bar diagram about the importance of each topic, among others. |
| Beschreibung: | Resumen:El trabajo de titulación presenta la aplicación del modelado de tópicos,para identificar las barreras de las mujeres en STEM (Science,Tecnology, Engineer, Mathematics). El corpus utilizado se generó a partir de los resultados de una búsqueda en la base de datos Scopus,desde el año 2000 al 2020; además, se usaron palabras claves(STEM, women STEM, STEM barriers, gender barriers, gender disparities)y conectores lógicos; se trabajó con un total de 141 resúmenes de artículos digitales. La extracción de los tópicos se realizó mediante el algoritmo LDA(Latent Dirichlet Allocation)que asume que un documento es una mezcla aleatoria sobre temas latentes;además con el uso de la coherencia temática en varios experimentos se pudo definir el número óptimo de tópicos(gráfica de coherencia).Como resultado se obtuvieron los prejuicios de género, falta de motivación, estereotipos y la falta de programas de inserción de mujeres STEM; como tópicos más representativos,los cuales hacen referencia a algunas de las barreras de las mujeres en STEM. Se brinda una visualización de los tópicos resultantes, mediante varias gráficas como: PyLDAvis, nube de palabras, diagrama de frecuencia, mapa de calor, histograma, TreeMap, diagrama de barras de la importancia de cada tópico, entre otros. |
| Identifier : | Cobarc: 1348567 |
| URI: | https://bibliotecautpl.utpl.edu.ec/cgi-bin/abnetclwo?ACC=DOSEARCH&xsqf99=126603.TITN. |
| Type: | bachelorThesis |
| Enthalten in den Sammlungen: | Ingeniero en Sistemas Informáticos y Computación |
Dateien zu dieser Ressource:
Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.
