Please use this identifier to cite or link to this item: http://dspace.utpl.edu.ec/jspui/handle/20.500.11962/29493
Title: Word Embedding en documentos médicos através dela aplicación de Word2Vec y Doc2Vec
Authors: Jaramillo Uday, Luis Alfredo
metadata.dc.contributor.advisor: Reátegui Rojas, Ruth María
Keywords: Inteligencia artificial
Algoritmos
Ingeniero en sistemas informáticos y computación
Tesis y disertaciones académicas
metadata.dc.date.available: 2022-01-11T13:05:01Z
Issue Date: 2022
Citation: Jaramillo Uday, Luis Alfredo. Reátegui Rojas, Ruth María.(2022). Word Embedding en documentos médicos através dela aplicación de Word2Vec y Doc2Vec . Universidad Técnica Particular de Loja
Description: Resumen: El uso de incrustación de palabras (Word Embedding) en el análisis de documentos desde hace unos años ha sido ampliamente utilizado, promoviendo el uso en diferentes documentos, como documentos médicos, con el fin de obtener una mejor información y utilidad de estos. La presente investigación consideró la aplicación de incrustación de palabras utilizando dos de sus algoritmos, el modelo Word2Vec que es usado para similitud de palabras y el modelo Doc2Vec para comparación de textos, ambos serán usados en el análisis de dataset médicos, un datas et en inglés sobre obesidad y diabetes y otro en español que contiene diferentes reportes médicos. Como resultado se obtuvo que el modelo Word2Vec usado en el conjunto de datos en inglés tuvo un resultado de similitud de 0,99. El mismo modelo utilizado en el conjunto de datos español obtuvo resultados de similitud de 0,25, esto se debe a que los documentos de este conjunto de datos tienen contenido de diferentes enfermedades. El modelo Doc2Vec reflejó un buen resultado tanto en el conjunto de datos en español como en el conjunto de datos en inglés.
metadata.dc.identifier.other: 1351067
URI: http://dspace.utpl.edu.ec/handle/20.500.11962/29493
metadata.dc.type: bachelorThesis
Appears in Collections:Ingeniero en Sistemas Informáticos y Computación



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.