Experiências virtuais auto-geradas permitem que os robôs se adaptem a tarefas invisíveis com maior flexibilidade

Novo estudo revela a técnica AI, permitindo que os robôs se adaptem a tarefas invisíveis com maior flexibilidade

(A – F) Ambientes Mujoco, (G -H) Ambientes ML1. Crédito: arxiv (2025). Doi: 10.48550/arxiv.2502.02834

Os seres humanos instintivamente andam e correm – a caminhada de brilho parece fácil, e naturalmente ajustamos nosso ritmo e ritmo sem pensar consciente. Para robôs físicos de IA, no entanto, o domínio dos movimentos básicos não se traduz automaticamente à adaptabilidade em situações novas ou inesperadas.

Mesmo que um robô seja treinado para executar em alta velocidade, ele pode ter dificuldades com ajustes diferenciados – como modificar os ângulos das pernas ou aplicar a força certa – quando enfrentados por tarefas diferentes, geralmente levando a movimentos instáveis ​​ou interrompidos.

Reconhecendo esse desafio, o professor Seungyul Han e sua equipe de pesquisa da Escola de Pós-Graduação de Inteligência Artificial da Unist desenvolveram uma técnica pioneira de aprendizado de meta-reforço que permite aos agentes da IA ​​antecipar e se prepararem para tarefas desconhecidas de forma independente.

Eles introduziram treinamento virtual com reconhecimento de tarefas (TAVT)-uma abordagem inovadora que equipa a IA com a capacidade de gerar e aprender com tarefas virtuais com antecedência, aumentando significativamente sua capacidade de se adaptar a desafios imprevistos.

A pesquisa utiliza um sistema de módulos duplos compreendendo um componente de representação baseado em aprendizado profundo e um módulo de geração. O módulo de representação avalia as semelhanças entre diferentes tarefas, criando um espaço latente que captura recursos essenciais. O módulo de geração então sintetiza novas tarefas virtuais que refletem aspectos centrais dos cenários do mundo real. Esse processo permite efetivamente as situações de pré-experiência da IA ​​que ainda não encontrou, aumentando sua prontidão para as tarefas fora da distribuição (OOD).

Jeongmo Kim, o pesquisador principal, explica, “o aprendizado tradicional de reforço treina um agente para se destacar em uma tarefa específica, limitando sua capacidade de generalizar. Embora a aprendizagem de meta-reforço expõe o agente a várias tarefas, adaptando-se a sites não vistos,” acrescentando “” nossa abordagem de TAVT se prepara para se preparar para se preparar para as pessoas que se preparam.

A equipe testou o TAVT em várias simulações robóticas, incluindo guepardas, formigas e robôs bípedos. Notavelmente, no experimento de Cheetah-Vid-Ood, os robôs que utilizam o TAVT rapidamente se adaptaram às velocidades intermediárias anteriormente inesperadas (1,25 e 1,75 m/s), mantendo um movimento estável e eficiente. Por outro lado, os robôs treinados convencionalmente geralmente lutam para ajustar, resultando em instabilidade ou perda de equilíbrio.

O professor Han enfatizou “esse método melhora significativamente a capacidade de uma IA de generalizar em diversas tarefas, o que é vital para aplicações como veículos autônomos, drones e robôs físicos que operam em ambientes imprevisíveis. Ele abre o caminho para sistemas de IA mais flexíveis e resilientes”.

A pesquisa foi apresentada na Conferência Internacional sobre Aprendizagem de Máquina (ICML 2025), que ocorreu em Vancouver, Canadá, de 13 a 19 de julho de 2025. O artigo está disponível no arxiv servidor pré -impressão. Este trabalho ressalta um esforço conjunto para promover as tecnologias principais da IA ​​e promover soluções inovadoras para desafios do mundo real.

Mais informações:
Jeongmo Kim et al., Treinamento virtual com reconhecimento de tarefas: aprimorando a generalização no aprendizado de meta-reforço para tarefas fora da distribuição, arxiv (2025). Doi: 10.48550/arxiv.2502.02834

Informações do diário:
arxiv

Fornecido pelo Ulsan National Institute of Science and Technology

Citação: Experiências virtuais auto-geradas permitem que os robôs se adaptem a tarefas invisíveis com maior flexibilidade (2025, 25 de agosto) recuperado em 25 de agosto de 2025 de https://techxplore.com/news/2025-08-generado- virtual-enable-robots-inseen.html

Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa particular, nenhuma parte pode ser reproduzida sem a permissão por escrito. O conteúdo é fornecido apenas para fins de informação.



[ad_2]

Deixe uma resposta