Por favor, use este identificador para citar o enlazar este ítem:
http://dspace.utpl.edu.ec/handle/123456789/52938
Título : | Implementación de un sistema de preguntasrespuestas usando representaciones vectoriales densas y modelos de lenguaje pre-entrenados. Caso de aplicación en un dominio cerrado |
Autor : | Chicaiza Espinosa, Janneth Alexandra Soto Jiménez, Fabian Antonio |
Palabras clave : | Ecuador. Tesis digital. |
Fecha de publicación : | 2024 |
Citación : | Soto Jiménez, F. A. Chicaiza Espinosa, J. A. (2024) Implementación de un sistema de preguntasrespuestas usando representaciones vectoriales densas y modelos de lenguaje pre-entrenados. Caso de aplicación en un dominio cerrado [Tesis de Grado, Universidad Técnica Particular de Loja]. Repositorio Institucional. https://dspace.utpl.edu.ec/handle/123456789/52938 |
Resumen : | Abstract: In the current scenario, Question-answering (Q&A) systems have established themselves as essential tools in various aspects of contemporary society. This project has been oriented towards the design and development of a QA system specialized in the contamination domain. The solution stands out for its unique ability to be adapted to different user-determined domains. Using an iterative approach, the project has been developed over three iterations, successfully addressing, and overcoming key challenges and achieving remarkable advances in terms of operational efficiency and quality of responses. The implementation of specialized technologies has been a crucial component for the success of the project: 1) The Haystack framework was used for effective text segmentation, i.e. for partitioning Wikipedia content without compromising its semantic coherence. 2) Milvus, as a vector database, has proven its efficiency in managing large volumes of vector data, contributing significantly to the optimization of response times. 3) In the area of pre-trained model loading, the use of Hugging Face has been essential; this platform has facilitated the agile integration of language models, enriching the system's ability to understand and generate natural language responses. The successful deployment of the system has culminated in the delivery of accurate and relevant responses in the specific domain defined by the user. Overall, this project not only highlights the importance of domain customization in QA systems, but also underscores the need for strategic integration of specialized tools. The ability to adapt to specific domains and the careful selection of technologies have been key elements in achieving a system that is agile, efficient, and capable of providing relevant answers in the desired context. |
Descripción : | Resumen: En el panorama actual, los sistemas de preguntas y respuestas (QA) se han consolidado como herramientas esenciales en diversos aspectos de la sociedad contemporánea. Este proyecto se ha orientado hacia el diseño y desarrollo de un sistema QA especializado en el dominio de contaminación. La solución se destaca por su capacidad única para ser adaptada a diferentes dominios determinados por el usuario. Con un enfoque iterativo, el proyecto se ha desarrollado a lo largo de tres iteraciones, enfrentando y superando con éxito desafíos clave y logrando avances notables en términos de eficiencia operativa y calidad de respuestas. La implementación de tecnologías especializadas ha sido un componente crucial para el éxito del proyecto: 1) El framewok Haystack se utilizó para la segmentación efectiva del texto, es decir, para la partición del contenido de la Wikipedia sin comprometer su coherencia semántica. 2) Milvus, como base de datos vectorial, ha demostrado su eficacia en la gestión de grandes volúmenes de datos vectoriales, contribuyendo significativamente a la optimización de los tiempos de respuesta. 3) En el ámbito de la carga de modelos preentrenados, la utilización de Hugging Face ha sido esencial; esta plataforma ha facilitado la integración ágil de modelos de lenguaje, enriqueciendo la capacidad del sistema para comprender y generar respuestas en lenguaje natural. El despliegue exitoso del sistema ha culminado con la entrega de respuestas precisas y relevantes en el dominio específico definido por el usuario. En conjunto, este proyecto no solo resalta la importancia de la personalización del dominio en los sistemas QA, sino que también subraya la necesidad de una integración estratégica de herramientas especializadas. La capacidad de adaptarse a dominios específicos y la selección cuidadosa de tecnologías han sido elementos clave para lograr un sistema ágil, eficiente y capaz de ofrecer respuestas relevantes en el contexto deseado. |
URI : | https://bibliotecautpl.utpl.edu.ec/cgi-bin/abnetclwo?ACC=DOSEARCH&xsqf99=143902.TITN. |
Aparece en las colecciones: | Titulación de Sistemas Informáticos y Computación |
Ficheros en este ítem:
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.