Aplicação de aprendizado por reforço em um sistema de automação industrial.

Campos, Yasmin Adriane de Paula

Por favor, use este identificador para citar o enlazar este ítem: http://www.monografias.ufop.br/handle/35400000/8926

Título :	Aplicação de aprendizado por reforço em um sistema de automação industrial.
Autor :	Campos, Yasmin Adriane de Paula
metadata.dc.contributor.advisor:	Reys, Lucas Andery Reis, Agnaldo José da Rocha
metadata.dc.contributor.referee:	Tonidandel, Danny Augusto Vieira Pinto, Thomas Vargas Barsante e Reys, Lucas Andery Reis, Agnaldo José da Rocha
Palabras clave :	Aprendizado de máquina Aprendizado por reforço Q-learning Controladores lógicos programáveis Texto estruturado Automação industrial Mineração 4.0
Fecha de publicación :	2026
Citación :	CAMPOS, Yasmin Adriane de Paula. Aplicação de aprendizado por reforço em um sistema de automação industrial. 2026. 46 f. Monografia (Graduação em Engenharia de Controle e Automação) - Escola de Minas, Universidade Federal de Ouro Preto, Ouro Preto, 2026.
Resumen :	O avanço da Indústria 4.0 tem ampliado o interesse pela aplicação de algoritmos avançados de controle e aprendizado de máquina em sistemas de automação industrial. Nesse contexto, métodos baseados em Aprendizado por Reforço (Reinforcement Learning - RL) destacam-se pelo potencial de adaptação a processos dinâmicos e incertos, operando sem a necessidade de modelos matemáticos explícitos do processo. Entretanto, a aplicação prática desses algoritmos no chão de fábrica ainda é limitada, restringida pela arquitetura de hardware dos Controladores Lógicos Programáveis (CLP) e pelas exigências de determinismo e alocação estática de memória. Objetiva-se desenvolver um framework para a transpilação automática de políticas de aprendizado por reforço, treinadas em ambiente Python, para a linguagem Texto Estruturado (ST), em conformidade com a norma IEC 61131-3. A metodologia consiste no treinamento offline de um agente Q-learning em ambiente simulado, seguido da transpilação da matriz de conhecimento e do código de controle a ser inserido no CLP. Como estudo de caso, considerou-se o controle de um sistema dinâmico de primeira ordem, utilizando um controlador Proporcional-Integral (PI) como baseline de desempenho. A política convertida é executada e validada em ambiente de automação industrial simulado utilizando o software de programação EcoStruxure Control Expert. Os resultados demonstraram viabilidade técnica da conversão, preservando a integridade da lógica de decisão do agente. Na análise comparativa de desempenho, o controlador baseado em RL superou um controlador PI clássico sintonizado analiticamente, apresentando uma redução de 16,8% na Integral do Erro Absoluto (IAE). A solução proposta oferece uma alternativa robusta escalável para a modernização de malhas de controle em setores críticos, como a mineração, viabilizando a adoção de estratégias adaptativas em plataformas de automação consolidadas.
metadata.dc.description.abstracten:	The advancement of Industry 4.0 has expanded interest in the application of advanced control algorithms and machine learning in industrial automation systems. In this context, methods based on Reinforcement Learning (RL) stand out for their potential to adapt to dynamic and uncertain processes, operating without the need for explicit mathematical models. However, the practical application of these algorithms on the shop floor is still limited, constrained by the hardware architecture of Programmable Logic Controllers (PLCs) and by the requirements for determinism and static memory allocation. The objective is to develop a framework for the automatic translation of reinforcement learning policies, trained in a Python environment, into Structured Text (ST) language, in compliance with the IEC 61131-3 standard. The methodology consists of the offline training of a Q-learning agent in a simulated environment, followed by the translation of the knowledge matrix and the control code for insertion into the PLC. As a case study, the control of a first-order dynamic system was considered, using a Proportional-Integral (PI) controller as a performance baseline. The converted policy is executed and validated in a simulated industrial automation environment using the EcoStruxure Control Expert programming software. The results demonstrated the technical feasibility of the conversion, preserving the integrity of the agent's decision logic. In the comparative performance analysis, the RL-based controller outperformed a classically tuned PI controller, achieving a 16.8% reduction in the Integral of Absolute Error (IAE). The proposed solution offers a robust and scalable alternative for the modernization of control loops in critical sectors, such as mining, enabling the adoption of adaptive strategies on established automation platforms.
URI :	http://www.monografias.ufop.br/handle/35400000/8926
Aparece en las colecciones:	Engenharia de Controle e Automação

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
MONOGRAFIA_AplicaçãoAprendizadoReforço.pdf		1,27 MB	Adobe PDF	Visualizar/Abrir

Mostrar el registro Dublin Core completo del ítem