Uma estrutura escalável baseada em aprendizagem por reforço para facilitar a teleoperação de robôs humanóides

Uma estrutura escalável baseada em aprendizagem por reforço para facilitar a teleoperação de robôs humanóides

Crédito: He et al

A operação eficaz de robôs à distância, também conhecida como teleoperação, poderia permitir aos humanos realizar remotamente uma vasta gama de tarefas manuais, incluindo procedimentos arriscados e complexos. No entanto, a teleoperação também poderia ser usada para compilar conjuntos de dados de movimentos humanos, o que poderia ajudar a treinar robôs humanóides em novas tarefas.

Pesquisadores da Carnegie Mellon University desenvolveram recentemente o Human2HumanOid (H2O), um método para permitir a teleoperação eficaz de robôs humanóides de tamanho humano. Esta abordagem, apresentada num artigo publicado no arXiv servidor de pré-impressão, poderia permitir o treinamento de robôs humanóides em tarefas manuais que exigem conjuntos específicos de movimentos, incluindo praticar vários esportes, empurrar um carrinho ou carrinho de bebê e mover caixas.

“Muitas pessoas acreditam que 2024 é o ano do humanóide, em grande parte porque o alinhamento da encarnação entre humanos e humanóides permite uma integração perfeita das habilidades cognitivas humanas com capacidades humanóides versáteis”, disse Guanya Shi, co-autor do artigo, ao Tech Xplore.

“No entanto, antes de uma integração tão emocionante, precisamos primeiro criar uma interface entre humano e humanóide para coleta de dados e desenvolvimento de algoritmos. Nosso trabalho H2O (Human2HumanOid) dá o primeiro passo, introduzindo um sistema de teleoperação de corpo inteiro em tempo real usando apenas uma câmera RGB, que permite a um humano teleoperar com precisão um humanóide em muitas tarefas do mundo real.”







Crédito: He et al

O trabalho recente desses pesquisadores facilita a teleoperação de robôs humanóides de tamanho normal em tempo real. Em contraste com muitos outros métodos introduzidos em estudos anteriores, H2O conta apenas com uma câmera RGB, o que facilita seu aumento de escala e uso generalizado.

“Acreditamos que a teleoperação humana será essencial para ampliar o volante de dados para robôs humanóides, e tornar a teleoperação acessível e fácil de fazer é nosso principal objetivo”, disse Tairan He, coautor do artigo, ao Tech Xplore. “Inspirado em trabalhos anteriores que abordaram partes deste desafio – como animação de movimentos humanos baseada na física, transferência de movimentos humanos para humanóides do mundo real e teleoperação de humanóides – este estudo visa amalgamar esses componentes em uma única estrutura.”

H2O é um método escalável e eficiente que permite aos pesquisadores compilar grandes conjuntos de dados de movimentos humanos e redirecionar esses movimentos para robôs humanóides, para que os humanos possam teleoperá-los em tempo real, reproduzindo todos os seus movimentos corporais no robô. Conseguir a teleoperação de corpo inteiro de robôs em tempo real é uma tarefa desafiadora, uma vez que os corpos de robôs humanóides nem sempre lhes permitem replicar movimentos humanos envolvendo diferentes membros e os controladores baseados em modelos existentes nem sempre produzem movimentos realistas em robôs.







Crédito: He et al

“H2O teleoperação é uma estrutura baseada em aprendizagem por reforço (RL) que facilita a teleoperação de corpo inteiro em tempo real de robôs humanóides usando apenas uma câmera RGB”, explicou. “O processo começa redirecionando os movimentos humanos para capacidades humanóides através de um novo ‘ metodologia sim-to-data ‘, garantindo que os movimentos sejam viáveis ​​​​para as restrições físicas do humanóide. Este conjunto de dados de movimento refinado treina um imitador de movimento baseado em RL em simulação, que é posteriormente transferido para o robô real sem ajustes adicionais.”

O método desenvolvido por Shi, He e seus colegas tem inúmeras vantagens. Os pesquisadores mostraram que, apesar dos requisitos mínimos de hardware, ele permite que os robôs executem uma ampla gama de movimentos dinâmicos de todo o corpo em tempo real.

A filmagem de entrada usada para teleoperar robôs é coletada usando uma câmera RGB padrão. Os outros componentes do sistema incluem um algoritmo de retargeting, um método para limpar dados de movimento humano em simulações (garantindo que os movimentos possam ser efetivamente replicados em robôs) e um modelo baseado em aprendizagem por reforço que aprende novas políticas de teleoperação.







Crédito: He et al

“A conquista mais notável do nosso estudo é a demonstração bem-sucedida da teleoperação humanoide de corpo inteiro em tempo real, baseada na aprendizagem, a primeira desse tipo, até onde sabemos”, disse He. “Esta demonstração abre novos caminhos para aplicações de robôs humanóides em ambientes onde a presença humana é arriscada ou impraticável”.

Os pesquisadores demonstraram a viabilidade de sua abordagem em uma série de testes do mundo real, onde teleoperaram um robô humanóide e reproduziram com sucesso vários movimentos, incluindo deslocar uma caixa, chutar uma bola, empurrar um carrinho de bebê e pegar uma caixa e jogá-la em um lixeira.







Crédito: He et al

OH2A estrutura poderá em breve ser usada para replicar outros movimentos e treinar robôs em inúmeras tarefas do mundo real, desde tarefas domésticas até tarefas de manutenção, prestação de assistência médica e até mesmo resgate de humanos em locais perigosos. Como requer apenas uma câmera RGB, este novo método pode ser implementado de forma realista em uma ampla gama de configurações.

“O processo ‘sim-to-data’ e a estratégia de controle baseada em RL também podem influenciar os desenvolvimentos futuros na teleoperação de robôs e na imitação de movimento”, disse ele. “Nossa pesquisa futura se concentrará em melhorar e expandir as capacidades de teleoperação humanóide. As principais áreas incluem o aumento da fidelidade do redirecionamento de movimento para cobrir uma gama mais ampla de atividades humanas, abordando a lacuna entre o simulador e o real de forma mais eficaz e explorando maneiras de incorporar feedback do robô ao operador para criar uma experiência de teleoperação mais envolvente.”

Uma estrutura escalável baseada em aprendizagem por reforço para facilitar a teleoperação de robôs humanóides

Crédito: He et al

Em seus próximos estudos, Shi, He e seus colaboradores planejam avançar ainda mais em seu sistema. Por exemplo, gostariam de melhorar o seu desempenho em cenários complexos, não estruturados e imprevisíveis, pois isso poderia simplificar a sua implantação no mundo real.

“Também planejamos estender a estrutura para incluir a manipulação com mãos hábeis e melhorar gradualmente o nível de autonomia do robô para finalmente alcançar uma colaboração homem-robô eficiente, segura e hábil”, acrescentou Changliu Liu.

Mais Informações:
Tairan He et al, Aprendendo teleoperação de corpo inteiro em tempo real de humano para humanóide, arXiv (2024). DOI: 10.48550/arxiv.2403.04436

Informações do diário:
arXiv

© 2024 Science X Network

Citação: Uma estrutura escalonável baseada em aprendizagem por reforço para facilitar a teleoperação de robôs humanóides (2024, 6 de abril) recuperada em 6 de abril de 2024 em https://techxplore.com/news/2024-04-scalable-learningbased-framework-teleoperation-humanoid. HTML

Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem permissão por escrito. O conteúdo é fornecido apenas para fins informativos.



[ad_2]

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *