Por favor, use este identificador para citar o enlazar este ítem:
http://dspace.utpl.edu.ec/handle/29.500.19856/71737
Título : | Sistema de control de un brazo robótico industrial basado en Reinforcement Learning aplicado a manipulación de objetos. |
Autor : | Calderón Córdova, Carlos Alberto Loor Bermúdez, Jelko Joseph |
Palabras clave : | Ecuador. Tesis digital. |
Fecha de publicación : | 2025 |
Citación : | Loor Bermúdez, J. J. Calderón Córdova, C. A. (2025) Sistema de control de un brazo robótico industrial basado en Reinforcement Learning aplicado a manipulación de objetos. [Tesis de Posgrado, Universidad Técnica Particular de Loja]. Repositorio Institucional. https://dspace.utpl.edu.ec/handle/29.500.19856/71737 |
Resumen : | Abstract: This Master's thesis analyzes technological improvements in the industrial sector through the use of robotic arms to optimize efficiency and safety in production lines. The main objective was to develop a control system for a robotic arm based on Reinforcement Learning, applied to object manipulation in the CoppeliaSim simulation environment. To achieve this, tools such as GYM and Stable-Baselines3 were implemented, using the Proximal Policy Optimization (PPO) algorithm to enable the robotic arm to interact and learn autonomously, optimizing the execution of pick and place tasks in dynamic environments with changing objects. The results indicate that the model improved its performance over 49 iterations, successfully stabilizing its learning policy. Metrics such as total loss and KL divergence showed consistent progress, demonstrating that the system optimized decision-making and reduced uncertainty in reward prediction. This approach contributes to the improvement of industrial robot control, minimizing the need for manual reprogramming and increasing autonomy in production environments. |
Descripción : | Resumen: El presente trabajo de Fin de Máster analiza las mejoras tecnológicas en el sector industrial mediante el uso de brazos robóticos para optimizar la eficiencia y seguridad en las líneas de producción. El objetivo principal fue desarrollar un sistema de control de un brazo robótico basado en Reinforcement Learning aplicado a la maniuplación de objetos en el entorno de simulación CoppeliaSim. Para ello, se implementaron herramientas como GYM y Stable-Baselines3, utilizando el algoritmo Proximal Policy Optimization (PPO) para permitir que el brazo robótico interactuara y aprendiera de manera autónoma, optimizando la ejecución de tareas de pick and place en entornos dinámicos con objetos cambiantes. Los resultados indican que el modelo mejoró su rendimiento en 49 iteraciones, logrando estabilizar su política de aprendizaje. Métricas como la pérdida total y la divergencia KL mostraron un progreso constante, lo que demuestra que el sistema optimizó la toma de decisiones y redujo la incertidumbre en la predicción de recompensas. Este enfoque contribuye a la mejora del control de robots industriales, minimizando la necesidad de reprogramación manual y aumentando la autonomía en entornos productivos. |
URI : | https://bibliotecautpl.utpl.edu.ec/cgi-bin/abnetclwo?ACC=DOSEARCH&xsqf99=146068.TITN. |
Aparece en las colecciones: | Maestría en Inteligencia Artificial Aplicada |
Ficheros en este ítem:
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.