Por favor, use este identificador para citar o enlazar este ítem:
http://dspace.utpl.edu.ec/handle/123456789/12553
Título : | Esquema de clasificación de información universitaria basado en NERC: caso noticias UTPL |
Autor : | González Eras, Alexandra Cristina Bermeo Cano, Mary Eugenia Cueva Enriquez, María Alexandra |
Palabras clave : | Aprendizaje automático Procesamiento de lenguaje natural NERC PLM – Metodología Ingeniero en sistemas informáticos y computación – Tesis y disertaciones académicas |
Fecha de publicación : | 2015 |
Citación : | Bermeo Cano, Mary Eugenia . Cueva Enriquez, María Alexandra. (2015). Esquema de clasificación de información universitaria basado en NERC: caso noticias UTPL. (Trabajo de Fin de Titulación de Ingeniero en Sistemas Informáticos y Computación). UTPL, Loja. |
Resumen : | This research proposes the development of a classification scheme of college information. Natural Language Processing (NLP) and Machine Learning (AA): two methodologies for development based on the recognition and classification techniques Named Entity (NERC), called apply. NERC allow harness the wealth of the context in which the named entities such as are presented: people, organizations, locations, dates, and titles of person. As first phase of the creation of a corpus of two hundred news, labeling manually, the same as used for the analysis and pattern making. In second phase is PLN methodology, where the GATE (General Architecture for Text Engineering) tool is used, is an open-source Java-based infrastructure serves to develop and reuse software components to solve the problem of classification, and The last phase is the methodology of machine learning, where the SVM algorithm and Support Vector Machines classification, for which the results are presented through a demo applies. |
Descripción : | La presente investigación propone el desarrollo de un esquema de clasificación de información universitaria. Para su desarrollo se aplican dos metodologías basadas en las técnicas de Reconocimiento y Clasificación de Entidades Nombradas (NERC), denominadas: Procesamiento de Lenguaje Natural (PLN) y Aprendizaje Automático (AA). NERC permiten aprovechar la riqueza del contexto en el cual se presentan las entidades nombradas, tales como: personas, organizaciones, locaciones, fechas, y títulos de persona. Como primera fase se tiene la creación de un corpus de doscientas noticias, etiquetado manualmente, el mismo que sirve para el análisis y creación de patrones. En segunda fase está la metodología de PLN, en donde se utiliza la herramienta GATE (General Architecture for Text Engineering), es una infraestructura open-source basada en Java, sirve para desarrollar y reutilizar componentes de software para resolver el problema de clasificación, y la última fase es la metodología de Aprendizaje Automático, en donde se aplica el algoritmo de clasificación SVM o Maquinas de Vectores de Soporte, para lo cual se presentan los resultados mediante un demo. |
URI : | http://dspace.utpl.edu.ec/handle/123456789/12553 |
Aparece en las colecciones: | Ingeniero en Sistemas Informáticos y Computación |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
Bermeo Cano, Mary Eugenia y Cueva Enriquez, Maria Alexandra.pdf | 4.58 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.