Aplicación de técnicas de procesamiento de Lenguaje Natural y Minería de Texto para la clasificación de preguntas dentro de un cuestionario digital.

Ortega Capa, Walter Rodrigo

Please use this identifier to cite or link to this item: http://dspace.utpl.edu.ec/jspui/handle/123456789/11679

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	Reátegui Rojas, Ruth María	-
dc.contributor.author	Ortega Capa, Walter Rodrigo	-
dc.date.accessioned	2015-03-13T22:39:56Z	-
dc.date.available	2015-03-13	-
dc.date.issued	2015	-
dc.identifier.citation	Ortega Capa, Walter Rodrigo. (2015). Aplicación de técnicas de procesamiento de Lenguaje Natural y Minería de Texto para la clasificación de preguntas dentro de un cuestionario digital. (Trabajo de fin de titulación de Ingeniero en Sistemas Informáticos y Computación). UTPL. Loja. 90pp.	es_ES
dc.identifier.other	1156528	-
dc.identifier.uri	http://dspace.utpl.edu.ec/handle/123456789/11679	-
dc.description	Along with the increasing number of digital documents that are generated daily in companies, organizations and institutions, arises the necessity to analyze and extract relevant information. This process leads to better management and organization of these data. Therefore this work is focused on establishing a reference guide for the automatic classification of digital questionnaires concerning Discrete Mathematics First Bimestre of the Open Method of the Universidad Técnica Particular de Loja. For the development of this project is the use the CRISP-DM methodology (acronym in English, Cross Industry Standard Process for Data Mining) using text mining techniques (Text Mining) and Natural Language Processing (Natural Language Processing) . The representation of the data is performed by the TDM (Matrix -Term Document) method. Among the best text classification algorithms in Weka, we can mention the DMNtext-I1 and NavieBayesMultinominalUpdateable as between the results of these two algorithms have similarities in their final values Accuracy 0.847, 0.824 and 0.436 Recall of accuary, so both have a 0177 error. These values are the product of the Percentage Split configuration of 66%, 66 training data and 34 test data.	es_ES
dc.description	Junto con el creciente número de documentos digitales que se generan día a día en las empresas, organizaciones e instituciones surge la necesidad de analizarlos y de extraer información relevante. Este proceso conlleva a una mejor gestión y organización de estos datos. Por tal motivo este trabajo está enfocado en establecer una guía de referencia para la clasificación automática de cuestionarios digitales de la materia de Matemáticas Discretas del Primer Bimestre de la Modalidad Abierta de la Universidad Técnica Particular de Loja. Para el desarrollo de este proyecto se ha utilizado la metodología CRISP-MD (Siglas en inglés, Cross Industry Standard Process for Data Mining) haciendo uso de técnicas de Minería de Texto y de Procesamiento de Lenguaje Natural (PLN). La representación de los datos se realizó mediante los métodos TDM (Matrix -Term Document). Dentro de los mejores algoritmos de clasificación de texto en Weka, se puede mencionar el DMNtext-I1 and NavieBayesMultinominalUpdateable, ya que entre los resultados obtenidos estos dos algoritmos presentan similitudes en sus valores finales Precisión de 0.847, Recall 0.824 y 0.436 de Accuary, por lo tanto se tiene un Error de 0.177. Estos valores son producto de la configuración Porcentaje Split de 66%, datos de entrenamiento 66 y 34 datos de prueba.	es_ES
dc.language	spa	es_ES
dc.subject	Cuestionarios digitales	es_ES
dc.subject	Lenguaje natural – Procesamiento	es_ES
dc.subject	Minería de texto	es_ES
dc.subject	CRISP-MD – Metodología	es_ES
dc.subject	Ingeniero de sistemas informáticos y computación – Tesis y disertaciones académicas	es_ES
dc.title	Aplicación de técnicas de procesamiento de Lenguaje Natural y Minería de Texto para la clasificación de preguntas dentro de un cuestionario digital.	es_ES
dc.type	bachelorThesis	es_ES
Appears in Collections:	Ingeniero en Sistemas Informáticos y Computación

Files in This Item:

File	Description	Size	Format
Ortega Capa Walter Rodrigo.pdf	Trabajo de fin de titulación PDF	1.21 MB	Adobe PDF	View/Open

Show simple item record