Aplicación de técnicas de procesamiento de Lenguaje Natural y Minería de Texto para la clasificación de preguntas dentro de un cuestionario digital

Ortega Capa, Walter Rodrigo

Please use this identifier to cite or link to this item: http://dspace.utpl.edu.ec/handle/123456789/11679

Title:	Aplicación de técnicas de procesamiento de Lenguaje Natural y Minería de Texto para la clasificación de preguntas dentro de un cuestionario digital
Authors:	Ortega Capa, Walter Rodrigo
Director:	Reátegui Rojas, Ruth María
Keywords:	Ecuador. Tesis digital.
Issue Date:	201503
Citation:	Ortega Capa, W. R. Reátegui Rojas, R. M. (201503 ;) Aplicación de técnicas de procesamiento de Lenguaje Natural y Minería de Texto para la clasificación de preguntas dentro de un cuestionario digital [Tesis de Grado, Universidad Técnica Particular de Loja]. Repositorio Institucional. https://dspace.utpl.edu.ec/handle/123456789/11679
Abstract:	N/D
Description:	Resumen: Junto con el creciente número de documentos digitales que se generan día a día en las empresas, organizaciones e instituciones surge la necesidad de analizarlos y de extraer información relevante. Este proceso conlleva a una mejor gestión y organización de estos datos. Por tal motivo este trabajo está enfocado en establecer una guía de referencia para la clasificación automática de cuestionarios digitales de la materia de Matemáticas Discretas del Primer Bimestre de la Modalidad Abierta de la Universidad Técnica Particular de Loja. Para el desarrollo de este proyecto se ha utilizado la metodología CRISP-MD (Siglas en inglés, Cross Industry Standard Process for Data Mining) haciendo uso de técnicas de Minería de Texto y de Procesamiento de Lenguaje Natural (PLN). La representación de los datos se realizó mediante los métodos TDM (Matrix -Term Document). Dentro de los mejores algoritmos de clasificación de texto en Weka, se puede mencionar el DMNtext-I1 and NavieBayesMultinominalUpdateable, ya que entre los resultados obtenidos estos dos algoritmos presentan similitudes en sus valores finales Precisión de 0.847, Recall 0.824 y 0.436 de Accuary, por lo tanto se tiene un Error de 0.177. Estos valores son producto de la configuración Porcentaje Split de 66%, datos de entrenamiento 66 y 34 datos de prueba.
Identifier :	Cobarc: 1156528
URI:	https://bibliotecautpl.utpl.edu.ec/cgi-bin/abnetclwo?ACC=DOSEARCH&xsqf99=82532.TITN.
metadata.dc.language:	spa
Type:	bachelorThesis
Appears in Collections:	Ingeniero en Sistemas Informáticos y Computación

Files in This Item:

File	Description	Size	Format
Ortega Capa Walter Rodrigo.pdf	Trabajo de fin de titulación PDF	1.21 MB	Adobe PDF	View/Open

Show full item record