Please use this identifier to cite or link to this item:
http://dspace.utpl.edu.ec/handle/123456789/13558
Title: | Adaptación de una herramienta de procesamiento de lenguaje natural para el etiquetado de sentimientos y el análisis de lenguaje en español. (Trabajo de Titulación de Ingeniero en Sistemas Informáticos y Computación ). UTPL, Loja |
Authors: | Valdiviezo Díaz, Prisila Marisela Correa Cordero, Mario Francisco |
Keywords: | Lenguaje de programación OpenNLP Java – Desarrollo Tokenizador – Herramienta Ingeniero en sistemas informáticos y computación – Tesis y disertaciones académicas |
Issue Date: | 2015 |
Citation: | Correa Cordero, Mario Francisco. (2015). Adaptación de una herramienta de procesamiento de lenguaje natural para el etiquetado de sentimientos y el análisis de lenguaje en español |
Abstract: | The objective of this work was to adapt degree of tool Natural Language Processing and Labelling of Feelings in Spanish, based on the systematic and linguistic analysis of text. At present there are several programs that help with natural language processing (NLP), however in this work OpenNLP used due to the advantages of as: Consume fewer resources and performs processing in less time. OpenNLP a collection of projects released under open source license, developed in Java, which provides the following tools: tokenizer, detection prayers, recognizer of the entity and part-of-speech tagging. To obtain the data, first he split the text into sentences. Each sentence was split into tokens to assign a grammatical label. This grammatical label was proposed by the EAGLES group for European languages, including Spanish. In addition, the token was assigned labeling emotions as boredom, anxiety, anxiety or worry, confusion, frustration and sympathy. Finally, many of the tools that are available in Spanish are limited, therefore it wanted to implement a tool with enhanced functionality to the benefit of new research |
Description: | El objetivo de este trabajo de titulación fue realizar la adaptación de una herramienta de Procesamiento de Lenguaje Natural y el Etiquetado de Sentimientos en Español, basados en el análisis sistemático y lingüístico de texto. En la actualidad existen varios programas que ayudan a realizar un procesamiento de lenguaje natural (PLN), sin embargo en este trabajo se utiliza OpenNLP debido a las ventajas que presenta como: Consume una menor cantidad de recursos y realiza el procesamiento en menor tiempo. OpenNLP una colección de proyectos distribuidos bajo licencia de código abierto, desarrollado en Java, que ofrece las siguientes herramientas: Tokenizador, detección de oraciones, reconocedor de la entidad y etiquetado gramatical. Para la obtención de los datos, primero se separó el texto en oraciones. Cada frase fue dividida en tokens para asignarle una etiqueta gramatical. Ésta etiqueta gramatical fue la propuesta por el grupo EAGLES para los idiomas europeos, que incluye el idioma español. Además, al token se le asignó un etiquetado de emociones como: aburrimiento, angustia, ansiedad o preocupación, confusión, frustración y simpatía. Finalmente, muchas de las herramientas que están disponibles en español son limitadas, por lo tanto se creyó conveniente implementar un instrumento con mayores funcionalidades para el beneficio de nuevas investigaciones. |
URI: | http://dspace.utpl.edu.ec/handle/123456789/13558 |
Appears in Collections: | Ingeniero en Sistemas Informáticos y Computación |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Correa_Cordero_Mario_Francisco1.pdf | 2.47 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.