Por favor, use este identificador para citar o enlazar este ítem: http://dspace.utpl.edu.ec/jspui/handle/123456789/12553
Título : Esquema de clasificación de información universitaria basado en NERC: caso noticias UTPL
Autor : Bermeo Cano, Mary Eugenia
Cueva Enriquez, María Alexandra
metadata.dc.contributor.advisor: González Eras, Alexandra Cristina
Palabras clave : Aprendizaje automático
Procesamiento de lenguaje natural
NERC
PLM – Metodología
Ingeniero en sistemas informáticos y computación – Tesis y disertaciones académicas
metadata.dc.date.available: 2015-06-12
Fecha de publicación : 2015
Citación : Bermeo Cano, Mary Eugenia . Cueva Enriquez, María Alexandra. (2015). Esquema de clasificación de información universitaria basado en NERC: caso noticias UTPL. (Trabajo de Fin de Titulación de Ingeniero en Sistemas Informáticos y Computación). UTPL, Loja.
Resumen : This research proposes the development of a classification scheme of college information. Natural Language Processing (NLP) and Machine Learning (AA): two methodologies for development based on the recognition and classification techniques Named Entity (NERC), called apply. NERC allow harness the wealth of the context in which the named entities such as are presented: people, organizations, locations, dates, and titles of person. As first phase of the creation of a corpus of two hundred news, labeling manually, the same as used for the analysis and pattern making. In second phase is PLN methodology, where the GATE (General Architecture for Text Engineering) tool is used, is an open-source Java-based infrastructure serves to develop and reuse software components to solve the problem of classification, and The last phase is the methodology of machine learning, where the SVM algorithm and Support Vector Machines classification, for which the results are presented through a demo applies.
Descripción : La presente investigación propone el desarrollo de un esquema de clasificación de información universitaria. Para su desarrollo se aplican dos metodologías basadas en las técnicas de Reconocimiento y Clasificación de Entidades Nombradas (NERC), denominadas: Procesamiento de Lenguaje Natural (PLN) y Aprendizaje Automático (AA). NERC permiten aprovechar la riqueza del contexto en el cual se presentan las entidades nombradas, tales como: personas, organizaciones, locaciones, fechas, y títulos de persona. Como primera fase se tiene la creación de un corpus de doscientas noticias, etiquetado manualmente, el mismo que sirve para el análisis y creación de patrones. En segunda fase está la metodología de PLN, en donde se utiliza la herramienta GATE (General Architecture for Text Engineering), es una infraestructura open-source basada en Java, sirve para desarrollar y reutilizar componentes de software para resolver el problema de clasificación, y la última fase es la metodología de Aprendizaje Automático, en donde se aplica el algoritmo de clasificación SVM o Maquinas de Vectores de Soporte, para lo cual se presentan los resultados mediante un demo.
metadata.dc.identifier.other: 1159328
URI : http://dspace.utpl.edu.ec/handle/123456789/12553
metadata.dc.language: spa
metadata.dc.type: bachelorThesis
Aparece en las colecciones: Ingeniero en Sistemas Informáticos y Computación

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
Bermeo Cano, Mary Eugenia y Cueva Enriquez, Maria Alexandra.pdf4.58 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.