Testando um modelo de aprendizado profundo não supervisionado para imitação de movimentos humanos por robôsReviltec

Etapas do processo de imitação humano-robô: 1) representar resultados de estimativa de um vídeo do artista A uma sequência de posições conjuntas x_A2) o retargeting de movimento traduz posições conjuntas x_A em posições conjuntas x_B para o executor B, 3) o controle do robô envia o controle de baixo nível. Crédito: Annabi et al.

Robôs que podem imitar de perto as ações e movimentos dos humanos em tempo real podem ser extremamente úteis, pois podem aprender a realizar tarefas diárias de maneiras específicas, sem terem que ser extensivamente pré-programados para essas tarefas. Embora as técnicas que permitem a aprendizagem por imitação tenham melhorado consideravelmente nos últimos anos, o seu desempenho é muitas vezes dificultado pela falta de correspondência entre o corpo de um robô e o do seu utilizador humano.

Pesquisadores da U2IS, ENSTA Paris, introduziram recentemente um novo modelo baseado em aprendizagem profunda que poderia melhorar as capacidades de imitação de movimento de sistemas robóticos humanóides. Este modelo, apresentado num artigo pré-publicado em arXivaborda a imitação de movimento em três etapas distintas, projetadas para reduzir os problemas de correspondência entre humanos e robôs relatados no passado.

“Este trabalho de pesquisa em estágio inicial visa melhorar a imitação online de robôs humanos, traduzindo sequências de posições conjuntas do domínio dos movimentos humanos para um domínio de movimentos alcançáveis por um determinado robô, portanto limitado pela sua incorporação”, Louis Annabi, Ziqi Ma , e Sao Mai Nguyen escreveram em seu artigo. “Aproveitando os recursos de generalização dos métodos de aprendizado profundo, resolvemos esse problema propondo um modelo de rede neural codificador-decodificador que realiza tradução de domínio para domínio.”

O modelo desenvolvido por Annabi, Ma e Nguyen separa o processo de imitação humano-robô em três etapas principais, a saber, estimativa de pose, redirecionamento de movimento e controle do robô. Em primeiro lugar, utiliza algoritmos de estimativa de pose para prever sequências de posições das articulações do esqueleto que sustentam os movimentos demonstrados por agentes humanos.

Posteriormente, o modelo traduz esta sequência prevista de posições das articulações do esqueleto em posições articulares semelhantes que podem ser realisticamente produzidas pelo corpo do robô. Finalmente, essas sequências traduzidas são utilizadas para planejar os movimentos do robô, resultando teoricamente em movimentos dinâmicos que poderiam ajudar o robô a realizar a tarefa em questão.

“Para treinar tal modelo, pode-se usar pares de movimentos robóticos e humanos associados, [yet] tais dados pareados são extremamente raros na prática e tediosos de coletar”, escreveram os pesquisadores em seu artigo. “Portanto, nos voltamos para métodos de aprendizado profundo para tradução não pareada de domínio para domínio, que adaptamos para realizar operações humano-robô imitação.”

Annabi, Ma e Nguyen avaliaram o desempenho de seu modelo em uma série de testes preliminares, comparando-o a um método mais simples para reproduzir orientações conjuntas que não é baseado em aprendizado profundo. Seu modelo não alcançou os resultados esperados, sugerindo que os atuais métodos de aprendizagem profunda podem não ser capazes de redirecionar com sucesso os movimentos em tempo real.

Os investigadores planeiam agora realizar mais experiências para identificar potenciais problemas com a sua abordagem, para que possam resolvê-los e adaptar o modelo para melhorar o seu desempenho. As descobertas da equipa até agora sugerem que, embora técnicas de aprendizagem profunda não supervisionadas possam ser usadas para permitir a aprendizagem por imitação em robôs, o seu desempenho ainda não é bom o suficiente para serem implementadas em robôs reais.

“Trabalhos futuros estenderão o estudo atual em três direções: investigar ainda mais a falha do método atual, conforme explicado na última seção, criar um conjunto de dados de movimento emparelhado de imitação humano-humano ou imitação robô-humano, e melhorar o modelo arquitetura para obter previsões de retargeting mais precisas”, concluem os pesquisadores em seu artigo.

Mais Informações:
Louis Annabi et al, Redirecionamento de movimento não supervisionado para imitação humano-robô, arXiv (2024). DOI: 10.48550/arxiv.2402.05115

Informações do diário:
arXiv

Citação: Testando um modelo de aprendizagem profunda não supervisionado para imitação de movimentos humanos por robôs (2024, 10 de março) recuperado em 10 de março de 2024 em https://techxplore.com/news/2024-03-unsupervised-deep-robot-imitation-human.html

Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem permissão por escrito. O conteúdo é fornecido apenas para fins informativos.

[ad_2]

Posted by admin

Tagged with

Posted by admin

Like to share?

Deixe um comentário Cancelar resposta