Please use this identifier to cite or link to this item: http://dspace.utpl.edu.ec/handle/29.500.19856/75721
Title: Agentes conversacionales basados en LLMs para dispositivos móviles: construcción de un piloto para los estudiantes de tecnologías de la información
Authors: Chicaiza Espinosa, Janneth Alexandra
Largo Largo, Carlos Daniel
Keywords: Ecuador.
Tesis digital.
Issue Date: 2025
Citation: Largo Largo, C. D. Chicaiza Espinosa, J. A. (2025) Agentes conversacionales basados en LLMs para dispositivos móviles: construcción de un piloto para los estudiantes de tecnologías de la información [Tesis de Grado, Universidad Técnica Particular de Loja]. Repositorio Institucional. https://dspace.utpl.edu.ec/handle/29.500.19856/75721
Abstract: Abstract: This project addresses the development of a conversational agent based on state-of-the-art language models. To achieve this, a complete workflow was designed, beginning with the collection and preprocessing of data related to academic processes within a university program. The data were then transformed into semantic vectors, enabling effective information retrieval in conversational contexts. The system s primary objective is not only to provide answers but to do so in a coherent, relevant, and contextualized manner, thereby ensuring its usefulness for the end user.To meet this goal, various tools were employed, with the RAG (Retrieval-Augmented Generation) architecture guiding the language model in generating context-based responses. Among the most notable tools used were Haystack, a framework for building modular pipelines; PyPDF, for extracting content from PDF files; and Trafilatura, for cleaning and structuring information from HTML pages by removing noise. Additionally, embeddings were applied through Sentence Transformers, converting text into numerical representations of semantic meaning. This approach allows for more intelligent searches, based not only on keywords but also on the meaning of phrases.The Mistral model was incorporated through an API to generate natural language responses from retrieved contexts. After implementation and a series of tests, results showed that the system can accurately retrieve information and produce clear, coherent, and contextually relevant answers in educational settings. In this way, students can resolve academic inquiries and receive timely and direct support. Finally, the study acknowledges its limitations, particularly the relatively small dataset used. Future work should therefore expand the information corpus, train new language models, and test the system with real users to maximize its impact and usability.
Description: Resumen:El presente proyecto aborda la creación de un agente conversacional basado en modelos de lenguaje de última generación. Para ello, se crea un flujo de trabajo completo que inicia con la recolección y el preprocesamiento de datos relacionados con procesos académicos de una carrera universitaria, para luego representarlos en vectores semánticos que permitan la recuperación de información en contextos conversacionales. El objetivo del sistema es que no sólo responda, sino que lo haga de manera coherente, relevante y contextualizada, para que sea útil al usuario final. Para cumplir este objetivo se utilizaron diferentes herramientas y se usó la arquitectura RAG (Retrieval-Augmented Generation) para guiar al modelo de lenguaje en la generación de respuestas, a partir de un contexto. Entre las herramientas más relevantes que se usaron se destacan Haystack, framework el cual permite construir pipelines modularizados; PyPDF, para extraer contenido del mismo formato; y Trafilatura, que permitió limpiar y estructurar la información de páginas HTML, eliminando ruido. Además, se aplicaron métodos de embeddings a través de Sentence Transformers, convirtiendo así cada texto en números que representan su significado semántico. Esto permite hacer búsquedas más inteligentes, no solo por palabras clave, sino por el significado de las frases. Finalmente, se incorporó el modelo Mistral, al que se llamó a través de API para que generara respuestas en lenguaje natural a partir del contexto recuperado. Luego de la implementación y de una serie de pruebas realizadas, se comprobó que el sistema es capaz de encontrar información de manera precisa y generar respuestas claras, coherentes y pertinentes en un contexto educativo. De esta manera, los estudiantes podrán resolver sus inquietudes relacionadas con procesos académicos y obtener atención directa y oportuna. De la misma manera, se reconocen las limitaciones del estudio, como el tamaño del conjunto de datos utilizado por lo que a futuro se requiere ampliar el corpus de información, entrenar nuevos modelos de lenguaje y poner a prueba el sistema con usuarios reales para maximizar su impacto y uso.
URI: https://bibliotecautpl.utpl.edu.ec/cgi-bin/abnetclwo?ACC=DOSEARCH&xsqf99=149072.TITN.
Appears in Collections:Titulación de Sistemas Informáticos y Computación



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.