Uma estrutura de aprendizado profundo e modelo de controle preditivo para controlar quadrotors e robôs ágeis

Uma estrutura de aprendizagem profunda e MPC para controlar quadrotors e robôs ágeis

O MPC neural em tempo real pode, por exemplo, ser usado para modelar com eficiência efeitos de solo aerodinâmicos altamente complexos que ocorrem em voo próximo a obstáculos (tabela), usando apenas computação a bordo. Crédito: Salzmann et al

Nos últimos anos, os cientistas da computação desenvolveram algoritmos cada vez mais avançados para controlar os movimentos de agentes robóticos. Isso inclui técnicas de controle preditivo de modelo (MPC), que usam um modelo da dinâmica do agente para otimizar seu comportamento futuro em direção a um determinado objetivo, ao mesmo tempo em que satisfaz várias restrições (por exemplo, não pode colidir com obstáculos).

Pesquisadores da Universidade Técnica de Munique e da Universidade de Zurique criaram recentemente o Real-time Neural MPC, uma estrutura que integra arquiteturas de modelos complexos baseadas em redes neurais artificiais (ANNs) em uma estrutura MPC para robôs ágeis (ou seja, quadrotors—drones com quatro rotores) . Esse conceito, apresentado em Cartas de Robótica e Automação IEEEbaseia-se em uma abordagem anterior desenvolvida pelo Grupo de Percepção e Robótica da Universidade de Zurique.

“Encontramos o excelente trabalho do Grupo de Robótica e Percepção liderado por Davide Scaramuzza e ficamos imediatamente cativados por desenvolver sua ideia central de ter componentes orientados por dados (aprendidos) impulsionando algoritmos de controle ‘tradicionais'”, Tim Salzmann e Markus Ryll , pesquisadores do Grupo de Sistemas Aéreos Autônomos da Universidade Técnica de Munique, disseram ao Tech Xplore.

“Depois de elaborarmos uma prova de conceito para generalizar sua abordagem, que usa processos gaussianos (GPs), para redes neurais genéricas (modelos de aprendizado profundo), apresentamos nossa ideia ao Grupo de Robótica e Percepção da Universidade de Zurique. A partir daí, trabalhos técnicos e experimentos foram desenvolvidos em conjunto entre os dois laboratórios, iniciando uma nova colaboração.”

A nova estrutura proposta por Salzmann, Ryll e seus colegas combina modelos de aprendizado profundo e otimização online do MPC. Os modelos expressivos de aprendizado profundo são computacionalmente pesados. No entanto, ao aproximá-los online em tempo real, a estrutura pode alavancar hardware dedicado (GPUs) para processar esses modelos com eficiência, permitindo que seu sistema preveja ações ideais para robôs em tempo real.

“A estrutura MPC neural em tempo real permite a combinação de dois campos, controle ideal e aprendizado profundo, permitindo que ambas as partes aproveitem suas respectivas estruturas e dispositivos computacionais altamente otimizados”, explicaram Salzmann e Ryll. “Dessa forma, podemos realizar cálculos de aprendizado profundo em PyTorch/Tensorflow em uma GPU enquanto a otimização de controle é realizada em código C compilado em uma CPU. Isso permite usar o poder do aprendizado profundo em aplicativos anteriormente inatingíveis, por exemplo, no controle ideal integrado de um Quadrotor.”

Os pesquisadores avaliam sua estrutura em uma série de experimentos, tanto em um ambiente simulado quanto no mundo real. Nesses testes, eles o usam especificamente para controlar as ações de um quadrotor altamente ágil em tempo real.

Seus resultados são muito promissores, pois podem alavancar o poder preditivo de arquiteturas de redes neurais com capacidade paramétrica mais de 4.000 vezes maior do que as usadas anteriormente para controlar os movimentos de robôs ágeis em tempo real. Eles também descobriram que, em comparação com os métodos convencionais de MPC sem um componente de aprendizado profundo, sua estrutura pode reduzir os erros de rastreamento posicional em até 82%.

“Na robótica, buscamos modelos expressivos da dinâmica dos sistemas controlados e sua interação com o ambiente (por exemplo, efeitos aerodinâmicos, atrito dos pneus, etc.)”, disseram Salzmann e Ryll. “Embora muitas vezes sejam difíceis de formular analiticamente, abordagens baseadas em aprendizado, especialmente redes neurais, podem capturar dinâmica e efeitos de interação. No entanto, a precisão do modelo aumenta com o tamanho da rede neural. MPC neural em tempo real permite o uso de análises profundas modelos de aprendizagem muitas magnitudes mais poderosos e com melhor desempenho em comparação com o que era anteriormente viável no Model Predictive Control.”

Conforme demonstrado pela plataforma Nvidia Jetson lançada recentemente, os chips de GPU estão gradualmente encontrando seu caminho para os sistemas embarcados. A estrutura criada por essa equipe de pesquisadores poderá em breve permitir que os desenvolvedores aproveitem o alto poder preditivo de técnicas avançadas de IA orientada a dados para modelar melhor a dinâmica de robôs que integram chips de GPU e suas interações com o ambiente, reduzindo o risco de acidentes e melhorando sua capacidades de navegação.

“Existem muitos caminhos abertos para pesquisas futuras”, acrescentaram Salzmann e Ryll. “Um problema das abordagens de aprendizado profundo é que sua saída pode ser errática para situações que não fazem parte dos dados de treinamento (Out Of Distribution OOD). Detectar essas situações e fornecer uma alternativa para o controle para estabilizar o sistema levaria à robustez em situações de OOD.”

Mais Informações:
Tim Salzmann et al, Real-time Neural MPC: Deep Learning Model Predictive Control for Quadrotors and Agile Robotic Platforms, Cartas de Robótica e Automação IEEE (2023). DOI: 10.1109/LRA.2023.3246839

Guillem Torrente et al, MPC orientado a dados para Quadrotors, Cartas de Robótica e Automação IEEE (2021). DOI: 10.1109/LRA.2021.3061307

© 2023 Science X Network

Citação: Uma estrutura de controle preditivo de aprendizado profundo e modelo para controlar quadrotors e robôs ágeis (2023, 13 de março) recuperado em 13 de março de 2023 de https://techxplore.com/news/2023-03-deep-framework-quadrotors-agile-robots. html

Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem a permissão por escrito. O conteúdo é fornecido apenas para fins informativos.



[ad_2]

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *