
Crédito: domínio público UNSPLASH/CC0
Tem sido um objetivo desde que os humanóides tenham sido objeto de imaginação popular-um robô de uso geral que pode realizar tarefas mecânicas como dobrar a roupa ou a reciclagem de classificação simplesmente sendo solicitada.
Em 25 de setembro, o Google Deepmind, o Alphabet’s Aia Lab, fez um zumbido no espaço, mostrando um robô humanóide aparentemente fazendo exatamente isso.
A empresa publicou uma postagem no blog e uma série de vídeos do Robot Humanoid Apollo de Apptronik, roupas dobráveis, classificando itens em caixas e até colocando itens na bolsa de uma pessoa – todos através de comandos de linguagem natural.
Fazia parte de uma vitrine dos mais recentes modelos de IA da empresa-a Robotics 1.5 e a Gemini Robotics-ER 1.5. O objetivo do anúncio era ilustrar como os grandes modelos de idiomas podem ser usados para ajudar os robôs físicos a “perceber, planejar [and] Pense em tarefas “com várias etapas”, de acordo com a empresa.
É importante ver as últimas notícias do DeepMind com um pouco de ceticismo, principalmente em torno de reivindicações de robôs tendo a capacidade de “pensar”, diz Ravinder Dahiya, um professor de engenharia elétrica e de computação do nordeste que co-autoria Inteligência da máquina da natureza Relatório sobre como a IA pode ser integrada aos robôs.
Gemini Robotics 1.5 e Gemini Robotics-ER 1.5 são conhecidos como modelos de ação em linguagem de visão, o que significa que eles utilizam sensores de visão e dados de imagem e idioma para grande parte de sua análise do mundo exterior, explica Dahiya.
A Gemini Robotics 1.5 funciona “transformando informações e instruções visuais no comando motor”. Enquanto a Gemini Robotics-ER 1.5 “é especializada em entender os espaços físicos, planejar e tomar decisões logísticas dentro de seus arredores”, de acordo com o Google DeepMind.

Ravinder Dahiya, professor de engenharia elétrica e de computação, é especialista em detecção de toque robótico. Crédito: Matthew Modoono/Northeastern University
Embora tudo possa parecer mágico na superfície, tudo é baseado em um conjunto de regras muito definido. O robô não está realmente pensando de forma independente. Tudo é apoiado por montes de dados de treinamento de alta qualidade e planejamento e algoritmos de cenários estruturados, diz Dahiya.
“Torna -se fácil iterar modelos visuais e de idiomas nesse caso, porque há uma boa quantidade de dados”, diz ele. “A visão na IA não é novidade. Está existente há muito tempo.”
O que é novo é que a equipe DeepMind conseguiu integrar essa tecnologia com grandes modelos de idiomas, permitindo que os usuários solicitem ao robô que executem tarefas usando linguagem simples, diz ele.
Isso é impressionante e “um passo na direção certa”, diz Dahiya, mas ainda estamos longe de ter robôs humanóides com as capacidades de detecção ou pensamento em paridade com os seres humanos, observa ele.
Por exemplo, Dahiya e outros pesquisadores estão em processo de desenvolvimento de tecnologias de detecção que permitem que os robôs tenham um senso de toque e feedback tátil. Dahiya, em particular, está trabalhando na criação de peles de robô eletrônico.
Ao contrário dos dados da visão, não há quase tantos dados de treinamento para esse tipo de detecção, ele destaca, o que é importante em aplicações que envolvam a manipulação de objetos suaves e duros.
Mas assim como um exemplo. Também temos um longo caminho a percorrer para dar aos robôs a capacidade de registrar dor e cheiro, acrescenta ele.
“Para ambientes incertos, você precisa confiar em todas as modalidades do sensor, não apenas na visão”, diz ele.
Aude Billard et al, um roteiro para a IA em robótica, Inteligência da máquina da natureza (2025). Doi: 10.1038/s42256-025-01050-6
Fornecido pela Northeastern University
Esta história é republicada, cortesia do Northeastern Global News.Northeastern.edu.
Citação: Robôs humanóides em casa? Não é tão rápido, diz o especialista (2025, 3 de outubro) recuperado em 3 de outubro de 2025 de https://techxplore.com/news/2025-10-humanoid-bots-home-fast-expert.html
Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa particular, nenhuma parte pode ser reproduzida sem a permissão por escrito. O conteúdo é fornecido apenas para fins de informação.
[ad_2]