Sistema de control de un brazo robótico industrial basado en Reinforcement Learning aplicado a manipulación de objetos.

Loor Bermúdez, Jelko Joseph

Please use this identifier to cite or link to this item: http://dspace.utpl.edu.ec/handle/29.500.19856/71737

Title:	Sistema de control de un brazo robótico industrial basado en Reinforcement Learning aplicado a manipulación de objetos.
Authors:	Calderón Córdova, Carlos Alberto Loor Bermúdez, Jelko Joseph
Keywords:	Ecuador. Tesis digital.
Issue Date:	2025
Citation:	Loor Bermúdez, J. J. Calderón Córdova, C. A. (2025) Sistema de control de un brazo robótico industrial basado en Reinforcement Learning aplicado a manipulación de objetos. [Tesis de Posgrado, Universidad Técnica Particular de Loja]. Repositorio Institucional. https://dspace.utpl.edu.ec/handle/29.500.19856/71737
Abstract:	Abstract: This Master's thesis analyzes technological improvements in the industrial sector through the use of robotic arms to optimize efficiency and safety in production lines. The main objective was to develop a control system for a robotic arm based on Reinforcement Learning, applied to object manipulation in the CoppeliaSim simulation environment. To achieve this, tools such as GYM and Stable-Baselines3 were implemented, using the Proximal Policy Optimization (PPO) algorithm to enable the robotic arm to interact and learn autonomously, optimizing the execution of pick and place tasks in dynamic environments with changing objects. The results indicate that the model improved its performance over 49 iterations, successfully stabilizing its learning policy. Metrics such as total loss and KL divergence showed consistent progress, demonstrating that the system optimized decision-making and reduced uncertainty in reward prediction. This approach contributes to the improvement of industrial robot control, minimizing the need for manual reprogramming and increasing autonomy in production environments.
Description:	Resumen: El presente trabajo de Fin de Máster analiza las mejoras tecnológicas en el sector industrial mediante el uso de brazos robóticos para optimizar la eficiencia y seguridad en las líneas de producción. El objetivo principal fue desarrollar un sistema de control de un brazo robótico basado en Reinforcement Learning aplicado a la maniuplación de objetos en el entorno de simulación CoppeliaSim. Para ello, se implementaron herramientas como GYM y Stable-Baselines3, utilizando el algoritmo Proximal Policy Optimization (PPO) para permitir que el brazo robótico interactuara y aprendiera de manera autónoma, optimizando la ejecución de tareas de pick and place en entornos dinámicos con objetos cambiantes. Los resultados indican que el modelo mejoró su rendimiento en 49 iteraciones, logrando estabilizar su política de aprendizaje. Métricas como la pérdida total y la divergencia KL mostraron un progreso constante, lo que demuestra que el sistema optimizó la toma de decisiones y redujo la incertidumbre en la predicción de recompensas. Este enfoque contribuye a la mejora del control de robots industriales, minimizando la necesidad de reprogramación manual y aumentando la autonomía en entornos productivos.
URI:	https://bibliotecautpl.utpl.edu.ec/cgi-bin/abnetclwo?ACC=DOSEARCH&xsqf99=146068.TITN.
Appears in Collections:	Maestría en Inteligencia Artificial Aplicada

Files in This Item:

8028938f-4039-41fd-bf1c-6de497631700

Show full item record