Please use this identifier to cite or link to this item: http://dspace.utpl.edu.ec/handle/123456789/33074
Title: Prototipo para Procesamiento de Lenguaje Natural de documentos en español de diversas fuentes
Authors: González Eras, Alexandra Cristina
Montoya Parra, Alexis Fabián
Keywords: Ecuador.
Tesis digital.
Issue Date: 2022
Citation: Montoya Parra, A. F. González Eras, A. C. (2022) Prototipo para Procesamiento de Lenguaje Natural de documentos en español de diversas fuentes [Tesis de Grado, Universidad Técnica Particular de Loja]. Repositorio Institucional. https://dspace.utpl.edu.ec/handle/123456789/33074
Abstract: Abstract: Natural Language Processing investigates communication between machines and people in their context and language.The technological progress of the Cloud platforms to carry out PLN tasks has allowed the development of different solutions, although limitations are seen in terms of the analysis of languages other than English and text processing of different formats,which prevents the Cloud platforms from being able to comply with the expectations of analysis of documents in Spanish.The purpose of this paper is to establish the facilities provided by Cloud platforms, in particular for documents of various formats inSpanish. Some of the cloud platforms have been investigated, and among them the Google Cloud and Amazon Comprehend architectures have been chosen, to perform entity recognition and topic modeling tests, using format documents. In addition, other tests were carried out with improved architectures, including Python and NLTK libraries, to help with the preprocessing of the corpus and, in the case of Google, to display the results.
Description: Resumen: El Procesamiento de Lenguaje Natural investiga la comunicación entre las maquinas con las personas en su contexto y lenguaje. El avance tecnológico de las plataformas Cloud para realizar tareas de PLN ha permitido el desarrollo de diferentes soluciones, aunque se ven limitaciones en cuanto al análisis de idiomas diferentes del inglés y procesamiento de texto de diferentes formatos, lo cual impide que las plataformas Cloud puedan cumplir con las expectativas de análisis de documentos en español. El presente trabajo, tiene como propósito establecer las facilidades que proporcionan las plataformas Cloud, en particular para documentos de diversos formatos en español. Se han investigado algunas de las plataformas de la nube, y entre ellas se ha escogido las arquitecturas de Google Cloud y Amazon Comprehend, para realizar pruebas de reconocimiento de entidades y modelado de tópicos, utilizando documentos de formatos. Además, se realizó otras pruebas con una mejora de las arquitecturas, incluyendo librerías Python y NLTK, para ayudar con el preprocesamiento del corpus y en el caso de Google para realizar la visualización de los resultados.
URI: https://bibliotecautpl.utpl.edu.ec/cgi-bin/abnetclwo?ACC=DOSEARCH&xsqf99=132114.TITN.
Appears in Collections:Titulación de Sistemas Informáticos y Computación



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.