
Crédito: Laboratório de Robótica Geral da Universidade Duke
A natureza está repleta de animais que colaboram em grande número. As abelhas abrem os melhores pontos de alimentação e deixe os outros saberem onde estão. As formigas construem casas hierárquicas complexas construídas para a defesa. Bandos de estorninhos se movem pelo céu em belas formações como se fossem uma única entidade.
Nenhum desses animais, no entanto, colabora da maneira que os humanos o fazem. Os comportamentos da mente da colméia surgem de regras simples, seguidas por muitos indivíduos. Os seres humanos, no entanto, têm a capacidade de simpatizar entre si e prever as ações uma da outra – um traço conhecido como teoria da mente.
Agora, um grupo de pesquisadores da Duke University e da Columbia University descobriu como usar essa característica única humana para treinar rapidamente grupos de robôs para concluir tarefas complexas. Enquanto outros algoritmos de controle direcionam os robôs através de mecanismos mais semelhantes aos comportamentos da Hive-Mind, essa estrutura recém-demonstrada chamada Humac ensina grupos de robôs a colaborar através de insights fornecidos por um único treinador humano.
O estudo é publicado no arxiv servidor pré -impressão.
A pesquisa, aceita na Conferência Internacional do IEEE sobre Robótica e Automação (ICRA 2025), que será realizada de 19 a 23 de maio de 2025, em Atlanta, Geórgia, demonstra como os robôs podem aprender a antecipar as ações dos colegas de equipe, adaptar as estratégias em tempo real e resolver desafios que requerem a inteligência de coordenados humanos.
O trabalho pode ser um benefício para aplicações como resposta ao incêndio selvagem e tarefas de sobrevivência selvagem, onde os robôs precisam cooperar e colaborar sob restrições, com estruturas hierárquicas de equipes, incerteza dos limites do ambiente e da largura de comunicação.
“Os seres humanos começam a desenvolver a habilidade da teoria da mente por volta dos quatro anos”, explicou Boyuan Chen, professor assistente de engenharia mecânica e de engenharia mecânica de Dickinson, engenharia elétrica e de computação e ciência da computação na Universidade de Duke. “Isso nos permite interpretar e prever as intenções dos outros, permitindo que a colaboração surja. Essa é uma capacidade essencial que nossos robôs atuais estão faltando para permitir que eles trabalhem em equipe com outros robôs e humanos. Projetamos Humac para ajudar os robôs a aprender com a maneira como os humanos pensam e coordenam de uma maneira eficiente”.
Houve outras abordagens para ensinar robôs para colaborar em tarefas significativas. Uma é usar o aprendizado de reforço, onde os robôs aprendem interagindo no mesmo ambiente com milhões para bilhões de ensaios e erros, o que é ineficiente sem garantia de sucesso. Outro método envolve a imitação de aprender com grandes grupos de especialistas em humanos colaborativos, o que é caro e impraticável.
Humac adota uma abordagem radicalmente diferente. Durante o treinamento, a estrutura permite que um único operador humano assuma brevemente o controle de diferentes robôs dentro de uma equipe quando necessário, orientando -os a momentos estratégicos -chave, como um treinador dando conselhos direcionados durante um jogo de futebol. Essas interações mostram aos grupos como conduzir táticas colaborativas sofisticadas, como emboscada e circulação.
https://www.youtube.com/watch?v=2x92lnftuty
Seguindo essas breves demonstrações, o sistema incorpora as intervenções humanas nos algoritmos dos robôs. A idéia principal é que, para que os robôs possam aprender a colaborar, eles devem aprender a formar uma representação mental para prever simultaneamente quais são os planos de seus colegas de equipe e o que seus jogadores oponentes farão. Em outras palavras, incorporando implicitamente as decisões de todos os jogadores em seus próprios planos – teoria da mente.
“Nossa estrutura imagina o futuro da equipe de Human-AI, onde os seres humanos são líderes”, disse Chen. “Nesse caso, um humano está orientando um número maior de agentes de uma maneira rápida e adaptável, o que nunca foi feito antes”.
A equipe testou o HUMAC em um jogo dinâmico de esconde-esconde, onde uma equipe de três robôs buscadores tenta pegar uma equipe de três robôs mais rápidos em uma arena de forma quadrada, cheia de obstáculos aleatórios, dependendo apenas de observações visuais parciais. Essa configuração é desafiadora, pois os buscadores não colaborativos que continuam perseguindo os cursos mais próximos podem atingir apenas uma taxa de sucesso de 36%.
Com Humac, um treinador humano assume seletivamente o controle de robôs individuais quando necessário. Após apenas 40 minutos de orientação, a equipe de robôs exibe fortes comportamentos colaborativos, como emboscada e circulação. Nas simulações, a taxa de sucesso saltou para 84%e, mesmo em testes físicos de veículos terrestres, a taxa de sucesso manteve 80%.
“Observamos robôs começando a se comportar como companheiros de equipe genuínos”, disse Zhengran Ji, o principal autor e estudante de pós -graduação no laboratório de Chen. “Eles previam os movimentos um do outro e coordenaram naturalmente, sem comandos explícitos”.
“Foi realmente emocionante de assistir, e acreditamos que isso abre muitas oportunidades para futuras equipes de robôs colaborativos e equipes de robô humano em várias aplicações”, acrescentou Chen.
Imagine um enxame de drones coordenando em tempo real para localizar sobreviventes após um desastre natural, varrendo com eficiência por áreas cobertas de detritos sem caminhos sobrepostos. Qualquer aplicação em que um pequeno número de seres humanos precise ensinar um grande número de robôs a colaborar poderia usar essa abordagem. Os pesquisadores já estão trabalhando na expansão do HUMAC para equipes de robôs maiores e tarefas mais complexas, enquanto exploram métodos de interação mais ricos para otimizar e aprimorar a equipe de robôs humanos.
“A IA não é apenas uma ferramenta para os seres humanos, é um companheiro de equipe. A forma final de super inteligência não será a IA sozinha nem apenas os humanos, é a inteligência coletiva de humanos e IA”, disse Chen. “Assim como os humanos evoluíram para colaborar, a IA se tornará mais adaptável para trabalhar um com o outro e conosco. Humac é um passo em direção a esse futuro”.
Ativando a colaboração de vários robôs a partir de orientação única-humana, Zhengran Ji et al, permitindo a colaboração de vários robôs a partir de orientações únicas-humanas, arxiv (2024). Doi: 10.48550/arxiv.2409.19831
arxiv
Fornecido pela Universidade Duke
Citação: Teoria do ensino da mente para os robôs pode melhorar a colaboração (2025, 15 de maio) Recuperado em 15 de maio de 2025 em https://techxplore.com/news/2025-05-tomory-mind-robots-collaboration.html
Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa particular, nenhuma parte pode ser reproduzida sem a permissão por escrito. O conteúdo é fornecido apenas para fins de informação.