Please use this identifier to cite or link to this item: http://dspace.utpl.edu.ec/handle/123456789/12553
Title: Esquema de clasificación de información universitaria basado en NERC: caso noticias UTPL
Authors: González Eras, Alexandra Cristina
Bermeo Cano, Mary Eugenia
Cueva Enriquez, María Alexandra
Keywords: Aprendizaje automático
Procesamiento de lenguaje natural
NERC
PLM – Metodología
Ingeniero en sistemas informáticos y computación – Tesis y disertaciones académicas
Issue Date: 2015
Citation: Bermeo Cano, Mary Eugenia . Cueva Enriquez, María Alexandra. (2015). Esquema de clasificación de información universitaria basado en NERC: caso noticias UTPL. (Trabajo de Fin de Titulación de Ingeniero en Sistemas Informáticos y Computación). UTPL, Loja.
Abstract: This research proposes the development of a classification scheme of college information. Natural Language Processing (NLP) and Machine Learning (AA): two methodologies for development based on the recognition and classification techniques Named Entity (NERC), called apply. NERC allow harness the wealth of the context in which the named entities such as are presented: people, organizations, locations, dates, and titles of person. As first phase of the creation of a corpus of two hundred news, labeling manually, the same as used for the analysis and pattern making. In second phase is PLN methodology, where the GATE (General Architecture for Text Engineering) tool is used, is an open-source Java-based infrastructure serves to develop and reuse software components to solve the problem of classification, and The last phase is the methodology of machine learning, where the SVM algorithm and Support Vector Machines classification, for which the results are presented through a demo applies.
Description: La presente investigación propone el desarrollo de un esquema de clasificación de información universitaria. Para su desarrollo se aplican dos metodologías basadas en las técnicas de Reconocimiento y Clasificación de Entidades Nombradas (NERC), denominadas: Procesamiento de Lenguaje Natural (PLN) y Aprendizaje Automático (AA). NERC permiten aprovechar la riqueza del contexto en el cual se presentan las entidades nombradas, tales como: personas, organizaciones, locaciones, fechas, y títulos de persona. Como primera fase se tiene la creación de un corpus de doscientas noticias, etiquetado manualmente, el mismo que sirve para el análisis y creación de patrones. En segunda fase está la metodología de PLN, en donde se utiliza la herramienta GATE (General Architecture for Text Engineering), es una infraestructura open-source basada en Java, sirve para desarrollar y reutilizar componentes de software para resolver el problema de clasificación, y la última fase es la metodología de Aprendizaje Automático, en donde se aplica el algoritmo de clasificación SVM o Maquinas de Vectores de Soporte, para lo cual se presentan los resultados mediante un demo.
URI: http://dspace.utpl.edu.ec/handle/123456789/12553
Appears in Collections:Ingeniero en Sistemas Informáticos y Computación

Files in This Item:
File Description SizeFormat 
Bermeo Cano, Mary Eugenia y Cueva Enriquez, Maria Alexandra.pdf4.58 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.