Algoritmos de Aprendizagem por Reforço Profunda para a Navegação de Embarcações em Águas Restritas

  • Rodrigo Pereira Abou Rejaili Escola Politécnica da Universidade de São Paulo
  • Jonathas Marcelo Pereira Figueiredo Escola Politécnica da Universidade de São Paulo

Resumo

A Aprendizagem por Reforço não foi completamente explorada para o controle automático de manobras de navios em águas restritas. No entanto, pode-se alcançar um controle mais robusto e eficiente com tais algoritmos. Este artigo apresenta o uso dos métodos Deep Q Network e Deep Deterministic Policy Gradient com um simulador numérico de manobras de navio para desenvolver leis de controle. Ambos os métodos provaram ser eficazes no controle da navegação através de um canal. Uma comparação da resposta e do comportamento de controle resultantes de cada método é apresentada.

Downloads

Não há dados estatísticos.

Biografia do Autor

Rodrigo Pereira Abou Rejaili, Escola Politécnica da Universidade de São Paulo

Graduando em Engenharia Mecatrônica na Escola Politécnica da Universidade de São Paulo, Brasil. Graduou-se em Engenharia Robótica e de Sistemas Embarcados na ENSTA ParisTech, França, e em Aprendizado de Máquina e Ciência de Dados na Universidade Paris Sud, França.

Jonathas Marcelo Pereira Figueiredo, Escola Politécnica da Universidade de São Paulo

Graduando em Engenharia Mecatrônica na Escola Politécnica da Universidade de São Paulo, Brasil. Graduou-se em Sistemas de Automação e Engenharia da Informação na ENSE3 Grenoble-INP, França.

Publicado
2018-12-29
Como Citar
Abou Rejaili, R., & Pereira Figueiredo, J. (2018). Algoritmos de Aprendizagem por Reforço Profunda para a Navegação de Embarcações em Águas Restritas. Mecatrone, 3(1). https://doi.org/10.11606/issn.2526-8260.mecatrone.2018.151953
Seção
Artigos