A nova abordagem permite que os enxames de drones naveguem autonomamente em ambientes complexos em alta velocidade

Uma nova abordagem permite que enxames de drones naveguem autonomamente em ambientes complexos em alta velocidade

Navegação de enxame ágil baseada na visão através de ambientes desordenados usando um controlador de rede neural de ponta a ponta treinado com física diferenciável. Crédito: Inteligência da máquina da natureza (2025). Doi: 10.1038/s42256-025-01048-0

Veículos aéreos não tripulados (UAVs), comumente conhecidos como drones, agora são amplamente utilizados em todo o mundo para enfrentar várias tarefas do mundo real, incluindo filmagens de vídeos para vários propósitos, monitoramento de culturas ou outros ambientes de cima, avaliando zonas de desastres e conduzindo operações militares. Apesar do uso generalizado, a maioria dos drones existentes precisa ser totalmente ou parcialmente operada por agentes humanos.

Além disso, muitos drones não conseguem navegar em ambientes desordenados, lotados ou desconhecidos sem colidir com objetos próximos. Aqueles que podem navegar nesses ambientes normalmente dependem de componentes caros ou volumosos, como sensores avançados, unidades de processamento de gráficos (GPUs) ou sistemas de comunicação sem fio.

Pesquisadores da Universidade de Shanghai Jiao Tong introduziram recentemente uma nova abordagem insetida que poderia permitir que equipes de vários drones navegassem autonomamente em ambientes complexos enquanto se movem em alta velocidade. Sua abordagem proposta, introduzida em um artigo publicado em Inteligência da máquina da naturezadepende de um algoritmo de aprendizado profundo e dos princípios da física central.

“Nossa pesquisa foi inspirada pelas incríveis recursos de voo de pequenos insetos como moscas”, disse ao Prof. Danping Zou e ao Prof. Weiyao Lin, co-senior autores do artigo, disse Tech Xplore. “Sempre nos surpreendeu como criaturas tão pequenas, com apenas um cérebro minúsculo e sensor limitado, podem realizar manobras ágeis e inteligentes-evitando obstáculos, pairando no ar ou perseguindo presas.

“Replicar que o nível de controle de vôo tem sido um sonho e um grande desafio na robótica. Requer percepção, planejamento e controle fortemente integrados – tudo em execução em computação integrada muito limitada, assim como no cérebro de insetos”.

Abordagens computacionais mais comuns para controlar o vôo de vários drones quebram a tarefa de navegação autônoma em módulos separados, como estimativa de estado, mapeamento, planejamento de caminhos, geração de trajetória e módulos de controle. Enquanto o combate dessas subtares separadamente pode ser eficaz, às vezes leva o acúmulo de erros em diferentes módulos e introduz a latência nas respostas dos drones. Em outras palavras, pode fazer com que os drones reajam mais lentamente quando se aproximam de obstáculos, o que pode aumentar o risco de colisões em ambientes dinâmicos e desorganizados.







Gravações originais de experimentos de enxame. Crédito: Inteligência da máquina da natureza (2025). Doi: 10.1038/s42256-025-01048-0

“O objetivo principal de nossa pesquisa foi explorar se uma rede neural artificial leve (RNA) poderia substituir este pipeline clássico por uma política compacta e de ponta a ponta”, disse o Prof. Zou e o Prof. Lin.

“Essa rede leva os dados do sensor como entrada e produz ações de controle diretamente-um paradigma que reflete como as moscas usam um pequeno número de neurônios para produzir um comportamento complexo e inteligente. Procuramos não apenas corresponder à elegância biológica, mas para demonstrar que o minimalismo no detecção e na computação ainda pode produzir vôo autônomo de alta desempenho”.

O novo sistema desenvolvido pelos pesquisadores depende principalmente de uma rede neural artificial leve recém-desenvolvida que pode gerar comandos de controle para um veículo aéreo quadrotor baseado em um mapa de profundidade de resolução de 12×16 de 12×16. Embora a definição dos mapas alimentados ao algoritmo seja baixa, foi considerado suficiente para a rede entender seu ambiente circundante e planejar efetivamente as ações dos veículos aéreos.

“Treinamos essa rede em um simulador personalizado composto por formas geométricas simples-cubos, elipsóides, cilindros e aviões-nos permitindo gerar ambientes diversos e estruturados”, explicou o Prof. Zou e o Prof. Lin. “Nosso processo de treinamento é altamente eficiente, graças a um pipeline diferenciável baseado em física. Ele suporta modos de treinamento de agente único e multi-agente: no ambiente multi-agente, outros drones são tratados como obstáculos dinâmicos durante a aprendizagem”.

Uma vantagem fundamental da abordagem de navegação por veículos multiaeriais desenvolvida pelos pesquisadores é que ela se baseia em uma rede neural profunda e altamente compacta e leve, que possui apenas três camadas convolucionais. Os pesquisadores o testaram em uma placa de computação incorporada que custa apenas US $ 21 e descobriram que ele executou com eficiência de maneira suave e com eficiência energética.

“O treinamento converge em apenas 2 horas em uma GPU RTX 4090, que é notavelmente rápida para o aprendizado de políticas”, disse o Prof. Zou e o Prof. Lin. “Nosso sistema também suporta naturalmente a navegação multi-robô sem nenhum planejamento centralizado ou comunicação explícita, permitindo a implantação escalável em cenários de enxame”.

Uma nova abordagem permite que enxames de drones naveguem autonomamente em ambientes complexos em alta velocidade

A rede neural da equipe é executada em um conselho de desenvolvimento de baixo custo que custa apenas 21 $. Crédito: Zhang et al.

Quando revisaram a literatura anterior no campo, os pesquisadores descobriram que muitos algoritmos de aprendizado profundo para a navegação por drones não generalizaram bem em cenários do mundo real. Isso geralmente ocorre porque eles não representam obstáculos inesperados ou mudanças no ambiente e precisam ser treinados com grandes quantidades de dados de voo rotulados por especialistas humanos.

“Nossa descoberta mais importante é que a incorporação do modelo de física do quadrotor diretamente no processo de treinamento pode melhorar significativamente a eficiência do treinamento e o desempenho do mundo real-em termos de robustez e agilidade”, disse o Prof. Zou e o Prof. Lin.

“Essa técnica, conhecida como aprendizado de física diferenciável, não foi inventada por nós, mas somos os primeiros a estendê-lo e aplicá-lo com sucesso ao controle quadrotor do mundo real. Através desta pesquisa, também chegamos a três idéias inesperadas, porém poderosas-lições que poderiam remodelar como pensamos sobre inteligência, modelos e percepção nos robóticos”.

As descobertas promissoras alcançadas pelo Prof. Zou, Prof. Lin e seus colegas demonstram o potencial de pequenos modelos baseados em rede neural artificial para combater tarefas complexas de navegação. Os pesquisadores mostraram que esses modelos podem ser mais eficazes do que costumam ser vistos e também podem ajudar a entender como os modelos maiores funcionam.

“Assim como a neurociência fez seu progresso precoce através da mosca da fruta, cujos circuitos neurais simples ajudaram a desbloquear idéias fundamentais, os pequenos modelos nos dão uma visão mais clara de como a percepção, a tomada de decisão e o controle são acoplados”, disse o Prof. Zou e o Prof. Lin. “No nosso caso, um modelo com menos de 2 MB de parâmetros permitiu a coordenação multi-agente sem qualquer comunicação-apresentando como a simplicidade pode levar a inteligência emergente”.

Notavelmente, o modelo leve desenvolvido pelos pesquisadores teve um bom desempenho, apesar de serem treinados em um ambiente simulado. Isso contrasta fortemente com muitos modelos desenvolvidos anteriormente que exigem quantidades substanciais de dados marcados com especialistas.







Reprodução de várias vistas do experimento enxame baseado em visão interna. Crédito: Inteligência da máquina da natureza (2025). Doi: 10.1038/s42256-025-01048-0

“Aprendemos que a inteligência não precisa depender de conjuntos de dados maciços”, disse os pesquisadores. “We trained our policy entirely in simulation—without internet-scale data, pre-collected logs, or handcrafted demonstrations—using only a few basic tasks and geometric environments powered by a differentiable physics engine. This challenges the common assumption that ‘more data is always better’ and suggests that structural alignment and embedded physical priors may matter more than sheer data volume.”

No geral, os resultados deste estudo recente sugerem que as redes neurais guiadas pelos princípios básicos da física podem obter melhores resultados do que as redes treinadas em milhões de imagens, mapas ou outros dados rotulados. Além disso, os pesquisadores descobriram que mesmo uma imagem de profundidade de baixa definição pode ser usada para guiar com precisão o comportamento dos robôs.

“Como a mosca da fruta, cuja visão é limitada a olhos compostos de baixa resolução, mas gerencia incríveis feitos aéreos, usamos imagens de profundidade de 12 × 16 pixels para controlar os drones voando a velocidades de até 20 m/s”, disse o Prof. Zou e o Prof. Lin. “Isso suporta uma hipótese ousada: o desempenho da navegação pode depender mais da compreensão interna do agente do mundo físico do que apenas da fidelidade do sensor”.

No futuro, a abordagem desenvolvida pelo Prof. Zou, Prof. Lin e seus colegas poderiam ser implantados em mais tipos de veículos aéreos e testados em cenários específicos do mundo real. Eventualmente, poderia ajudar a ampliar as tarefas que podem ser combinadas com drones ultra-leves, por exemplo, permitindo que eles tire automaticamente selfies ou competam em competições de corrida. A abordagem também pode ser útil para transmitir esportes ou outros eventos, para pesquisar edifícios colapsados durante operações de busca e salvamento e inspeção de armazéns desordenados.

“Atualmente, estamos explorando o uso do fluxo óptico em vez de mapas de profundidade para vôo totalmente autônomo”, acrescentou o Prof. Zou e o Prof. Lin. “O fluxo óptico fornece pistas de movimento fundamental e há muito tempo é estudado em neurociência como um componente -chave da visão de insetos.

“Ao usá-lo, esperamos nos aproximar ainda mais de imitar as estratégias naturais que os insetos usam para a navegação. Outra direção importante que estamos buscando é a interpretabilidade dos sistemas de aprendizagem de ponta a ponta”.

Embora a rede neural leve da equipe tenha sido considerada notavelmente bem em experimentos do mundo real, como esses resultados promissores funcionam ainda não são totalmente compreendidos. Como parte de seus próximos estudos, o Prof. Zou e o Prof. Lin esperam esclarecer mais as representações internas da rede, o que também pode oferecer informações sobre como os insetos processa seus arredores e planejam suas ações.

Escrito para você por nosso autor Ingrid Fadelli, editado por Gaby Clark, e verificou e revisado por Andrew Zinin-este artigo é o resultado de um trabalho humano cuidadoso. Confiamos em leitores como você para manter vivo o jornalismo científico independente. Se este relatório é importante para você, considere uma doação (especialmente mensalmente). Você vai conseguir um sem anúncios conta como um agradecimento.

Mais informações:
Aprendendo vôo ágil baseado em visão por meio da física diferenciável. Inteligência da máquina da natureza(2025). Doi: 10.1038/s42256-025-01048-0.

© 2025 Science X Network

Citação: A nova abordagem permite que os enxames de drones naveguem autonomamente em ambientes complexos em alta velocidade (2025, 21 de julho) recuperados em 21 de julho de 2025 de https://techxplore.com/news/2025-07-approach-drone-swarms-otonyly-complex.html

Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa particular, nenhuma parte pode ser reproduzida sem a permissão por escrito. O conteúdo é fornecido apenas para fins de informação.



[ad_2]

Deixe uma resposta