Conjunto de dados de pose 6D inovador estabelece novo padrão para desempenho de preensão robótica

Conjunto de dados de pose 6D inovador estabelece novo padrão para desempenho de preensão robótica

Pesquisadores do SIT, no Japão, desenvolveram um novo conjunto de dados para melhorar a precisão robótica na estimativa de pose 6D, melhorando as tarefas de pegar e colocar em ambientes industriais. Crédito: Phan Xuan Tan da SIT, Japão

A estimativa precisa da pose do objeto refere-se à capacidade de um robô de determinar a posição e a orientação de um objeto. É essencial para a robótica, especialmente em tarefas de recolha e colocação, que são cruciais em indústrias como a produção e a logística.

À medida que os robôs são cada vez mais encarregados de operações complexas, a sua capacidade de determinar com precisão os seis graus de liberdade (pose 6D) de objetos, posição e orientação torna-se crítica. Essa capacidade garante que os robôs possam interagir com objetos de maneira confiável e segura. No entanto, apesar dos avanços na aprendizagem profunda, o desempenho dos algoritmos de estimativa de pose 6D depende em grande parte da qualidade dos dados nos quais são treinados.

Um novo estudo apresenta um conjunto de dados meticulosamente projetado com o objetivo de melhorar o desempenho de algoritmos de estimativa de pose 6D. Este conjunto de dados aborda uma grande lacuna na pesquisa robótica e de automação, fornecendo um recurso abrangente que permite aos robôs executar tarefas com maior precisão e adaptabilidade em ambientes do mundo real. Este estudo foi publicado na revista Resultados em Engenharia em dezembro de 2024.

Assoc. O professor Phan Xuan Tan, do Instituto de Tecnologia de Shibaura, no Japão, afirma: “Nosso objetivo era criar um conjunto de dados que não apenas avançasse na pesquisa, mas também abordasse desafios práticos na automação robótica industrial. Esperamos que sirva como um recurso valioso para pesquisadores e engenheiros parecido.”

A equipe de pesquisa criou um conjunto de dados que não apenas atendeu às demandas da comunidade de pesquisa, mas também é aplicável em ambientes industriais práticos. Usando a câmera de profundidade Intel RealSense D435, eles capturaram imagens RGB e de profundidade de alta qualidade, anotando cada uma com rotação de dados de pose 6D e translação dos objetos. O conjunto de dados apresenta uma variedade de formas e tamanhos, com técnicas de aumento de dados adicionadas para garantir sua versatilidade em diversas condições ambientais. Essa abordagem torna o conjunto de dados altamente aplicável a uma ampla gama de aplicações robóticas.

“Nosso conjunto de dados foi cuidadosamente projetado para ser prático para as indústrias. Ao incluir objetos com formas e variáveis ​​ambientais variadas, ele fornece um recurso valioso não apenas para pesquisadores, mas também para engenheiros que trabalham em áreas onde os robôs operam em condições dinâmicas e complexas”, acrescenta Assoc. . Prof.

Conjunto de dados de pose 6D inovador estabelece novo padrão para desempenho de preensão robótica

Erros na reprodução do modelo CAD do objeto durante a aquisição de dados. Crédito: Resultados em Engenharia (2024). DOI: 10.1016/j.rineng.2024.103459

O conjunto de dados foi avaliado usando modelos de aprendizagem profunda de última geração, EfficientPose e FFB6D, alcançando taxas de precisão de 97,05% e 98,09%, respectivamente. As altas taxas de precisão provam que o conjunto de dados fornece informações de pose confiáveis ​​e precisas, o que é crucial para aplicações como manipulação robótica, controle de qualidade na fabricação e veículos autônomos. O forte desempenho desses algoritmos no conjunto de dados ressalta o potencial para melhorar sistemas robóticos que exigem precisão.

Assoc. O professor Tan afirma: “Embora nosso conjunto de dados inclua uma variedade de formas básicas, como prismas retangulares, trapézios e cilindros, expandi-lo para incluir objetos mais complexos e irregulares o tornaria mais aplicável a cenários do mundo real.

“Embora a câmera Intel RealSense Depth D435 ofereça excelente profundidade e dados RGB, a dependência do conjunto de dados nela pode limitar sua acessibilidade para pesquisadores que não têm acesso ao mesmo equipamento.”

Apesar desses desafios, os pesquisadores estão otimistas quanto ao impacto do conjunto de dados. Os resultados demonstram claramente que um conjunto de dados bem projetado melhora significativamente o desempenho dos algoritmos de estimativa de pose 6D, permitindo que os robôs executem tarefas mais complexas com maior precisão e eficiência.

“Os resultados valem o esforço”, afirma Assoc. Prof. Olhando para o futuro, a equipa planeia expandir o conjunto de dados incorporando uma variedade mais ampla de objetos e automatizando partes do processo de recolha de dados para torná-lo mais eficiente e acessível. Estes esforços visam melhorar ainda mais a aplicabilidade e a utilidade do conjunto de dados, beneficiando tanto os investigadores como as indústrias que dependem da automação robótica.

O estudo foi liderado pelo Professor Associado Tan, Faculdade de Engenharia, Instituto de Tecnologia Shibaura, Japão, juntamente com sua equipe de pesquisadores, Dr. Van-Truong Nguyen, Sr. Universidade da Indústria de Hanói, Vietnã, Professor Associado Thai-Viet Dang da Universidade de Ciência e Tecnologia de Hanói, Vietnã.

Mais informações:
Van-Truong Nguyen et al, Um conjunto de dados RGB-D abrangente para estimativa de pose 6D para seleção e posicionamento de robôs industriais: Criação e validação no mundo real, Resultados em Engenharia (2024). DOI: 10.1016/j.rineng.2024.103459

Fornecido pelo Instituto de Tecnologia Shibaura

Citação: Conjunto de dados de pose 6D inovador estabelece novo padrão para desempenho de preensão robótica (2025, 16 de janeiro) recuperado em 16 de janeiro de 2025 em https://techxplore.com/news/2025-01-6d-pose-dataset-standard-robotic.html

Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem permissão por escrito. O conteúdo é fornecido apenas para fins informativos.



Deixe uma resposta