Please use this identifier to cite or link to this item:
http://dspace.utpl.edu.ec/handle/29.500.19856/70876
Title: | Uso de modelos generativos para apoyar la creación y optimización de flujos de trabajo de ciencia de datos |
Authors: | Chicaiza Espinosa, Janneth Alexandra Pardo Correa, Ángel David |
Keywords: | Ecuador. Tesis digital. |
Issue Date: | 2025 |
Citation: | Pardo Correa, Á. D. Chicaiza Espinosa, J. A. (2025) Uso de modelos generativos para apoyar la creación y optimización de flujos de trabajo de ciencia de datos [Tesis de Grado, Universidad Técnica Particular de Loja]. Repositorio Institucional. https://dspace.utpl.edu.ec/handle/29.500.19856/70876 |
Abstract: | Abstract: Generative models, such as large-scale language models (LLMs), offer new insights for streamlining the creation and optimization of data science workflows. This project aims to leverage these capabilities to generate specific recommendations and facilitate the creation and analysis of data sets. Specifically, LLMs have been used to implement three specific data science tasks: 1) synthetic dataset generation, 2) exploratory data analysis, and 3) code analysis, debugging, and explanation with AI. To interact with the language models, the APIs they provide have been used, and different prompts have been designed for each task. In each case, a feature and web interface were implemented to facilitate communication between the generative model and the user, thus supporting the creation of more agile workflows. The end result is a prototype that integrates these features to help analysts process data sets and create workflows more efficiently, potentially transforming the practice of data science. |
Description: | Resumen:Los modelos generativos, como los modelos de lenguaje de gran escala (LLM), ofrecen nuevas perspectivas para agilizar la creación y optimización de flujos de trabajo en ciencia de datos. Este proyecto tiene como objetivo aprovechar estas capacidades para generar recomendaciones específicas y facilitar la creación y análisis de conjuntos datos. De forma concreta, se han usado los LLMs para implementar tres tareas concretas de ciencia de datos como, 1) la generación de datasets sintéticos, 2) análisis exploratorio de datos, y 3) análisis, depuración y explicación de código con IA. Para interactuar con los modelos de lenguaje se han usado las APIs que proveen y se han diseñado diferentes prompts para cada tarea. En cada caso se implementó una funcionalidad e interfaz web que facilita la comunicación entre el modelo generativo y el usuario, y así apoyar la creación de flujos más ágiles. El resultado final es un prototipo que integra estas funciones para ayudar a los analistas a procesar conjuntos de datos y crear flujos de trabajo de manera más eficiente, potencialmente transformando la práctica de la ciencia de datos. |
URI: | https://bibliotecautpl.utpl.edu.ec/cgi-bin/abnetclwo?ACC=DOSEARCH&xsqf99=145329.TITN. |
Appears in Collections: | Titulación de Sistemas Informáticos y Computación |
Files in This Item:
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.