Bitte benutzen Sie diese Kennung, um auf die Ressource zu verweisen:
http://dspace.utpl.edu.ec/handle/20.500.11962/23406| Titel: | Clasificación de documentos científicos mediante técnicas de procesamiento de lenguaje natural y minería de texto |
| Autor(en): | Ortiz Serrano, Yesenia Andreina |
| Director: | Segarra Faggioni, Verónica Alexandra |
| Stichwörter: | Ecuador. Tesis digital. |
| Erscheinungsdatum: | 2018 |
| Zitierform: | Ortiz Serrano, Y. A. Segarra Faggioni, V. A. (2018) Clasificación de documentos científicos mediante técnicas de procesamiento de lenguaje natural y minería de texto [Tesis de Grado, Universidad Técnica Particular de Loja]. Repositorio Institucional. https://dspace.utpl.edu.ec/handle/20.500.11962/23406 |
| Zusammenfassung: | Abstract:The Universidad Técnica Particular de Loja, , with the aim of promoting scientific research, creates groups of research lines to create, socialize research and disseminate in several scientific databases. The articles that are included in the different lines. This degree work aims to determine the relationships between the research lines and the terms of the articles uploaded to SCOPUS from 2003 to 2017; through the collection of information, elaboration of vocabulary, supervised classification, preprocessing and data training. The methodology is the "metametodología", composed of four principles that allow to obtain the result of the proposed research: obtain the result of 623 documents in plain text; Information on the abstract, the author and the keywords of each article was compiled, and a new classification was made due to inconsistencies in the classification. The application of the nearest k algorithms (KNN) and linear discriminant analysis (LDA) shows the accuracy of the classification of the articles, as well as the relationship that exists between them. |
| Beschreibung: | Resumen:La Universidad Técnica Particular de Loja, con el objetivo de incentivar la investigación científica ha creado grupos de líneas de investigación para crear, socializar investigaciones y difundirlas en varias bases de datos científicas. Los artículos desarrollados en las diferentes líneas no poseen una clasificación que permitan extraer información de términos. Este trabajo de titulación pretende determinar las relaciones entre las líneas de investigación y términos comunes de los artículos subidos a SCOPUS desde el 2003 al 2017; mediante la recolección información, elaboración de vocabulario, clasificación supervisada, preprocesamiento y entrenamiento de datos. Se utilizó como Metodología la metametodologia , compuesta de cuatro principios que permite obtener el resultado de la investigación propuesta: obteniendo el resultado de 623 documentos en texto plano; se consideró recolectar información del resumen, autor y palabras claves por cada artículo, además se realizó una re clasificación debido a inconsistencias en la clasificación. La aplicación de los algoritmos k vecinos más cercanos (KNN) y análisis discriminante lineal (LDA) muestran la precisión de la clasificación de artículos, como también la relación que existe entre los mismos. |
| Identifier : | Cobarc: 1285071 |
| URI: | https://bibliotecautpl.utpl.edu.ec/cgi-bin/abnetclwo?ACC=DOSEARCH&xsqf99=119953.TITN. |
| Type: | bachelorThesis |
| Enthalten in den Sammlungen: | Ingeniero en Sistemas Informáticos y Computación |
Dateien zu dieser Ressource:
Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.
