SEM CATEGORIA TECNOLOGIA

Como projetar e controlar robôs com corpos elásticos e flexíveis

Os pesquisadores do MIT inventaram uma maneira de otimizar eficientemente o controle e o design de robôs flexíveis para tarefas-alvo, que tradicionalmente tem sido um empreendimento monumental em computação.

Robôs macios têm corpos elásticos, flexíveis e elásticos que podem se mover essencialmente um número infinito de maneiras a qualquer momento. Computacionalmente, isso representa uma “representação de estado” altamente complexa, que descreve como cada parte do robô está se movendo. As representações de estado para robôs flexíveis podem ter potencialmente milhões de dimensões, dificultando o cálculo da maneira ideal de fazer um robô concluir tarefas complexas.

Na Conferência sobre Sistemas de Processamento de Informação Neural, no mês que vem, os pesquisadores do MIT apresentarão um modelo que aprende uma representação de estado compacta, ou “de baixa dimensão”, porém detalhada, com base na física subjacente do robô e seu ambiente, entre outros fatores. . Isso ajuda o modelo a co-otimizar iterativamente o controle de movimento e os parâmetros de design de material atendidos em tarefas específicas.

“Robôs macios são criaturas de dimensão infinita que se dobram de um bilhão de maneiras diferentes a qualquer momento”, diz o primeiro autor Andrew Spielberg, estudante de pós-graduação no Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL). “Mas, na verdade, existem maneiras naturais de dobrar objetos macios. Descobrimos que os estados naturais de robôs macios podem ser descritos de maneira muito compacta em uma descrição de baixa dimensão. Otimizamos o controle e o design de robôs macios aprendendo uma boa descrição dos estados prováveis ​​”.

Nas simulações, o modelo permitiu que os robôs flexíveis 2-D e 3-D concluíssem tarefas – como mover certas distâncias ou atingir um ponto-alvo – com mais rapidez e precisão do que os métodos atuais. Os pesquisadores planejam implementar o modelo em robôs macios reais.

Juntando Spielberg no papel estão os estudantes de pós-graduação da CSAIL, Allan Zhao, Tao Du e Yuanming Hu; Daniela Rus, diretora da CSAIL e Andrew e Erna Viterbi Professora de Engenharia Elétrica e Ciência da Computação; e Wojciech Matusik, professor associado do MIT em engenharia elétrica e ciência da computação e chefe do Grupo de Fabricação Computacional.

A robótica leve é ​​um campo de pesquisa relativamente novo, mas é promissor para a robótica avançada. Por exemplo, corpos flexíveis poderiam oferecer interação mais segura com os seres humanos, melhor manipulação de objetos e mais manobrabilidade, entre outros benefícios.

O controle de robôs em simulações depende de um “observador”, um programa que calcula variáveis ​​que vêem como o robô está se movendo para concluir uma tarefa. No trabalho anterior, os pesquisadores decompuseram o robô macio em aglomerados projetados à mão de partículas simuladas. As partículas contêm informações importantes que ajudam a diminuir os possíveis movimentos do robô. Se um robô tentar dobrar de uma certa maneira, por exemplo, os atuadores podem resistir a esse movimento o suficiente para que possam ser ignorados. Mas, para robôs tão complexos, escolher manualmente quais clusters serão rastreados durante as simulações pode ser complicado.

Com base nesse trabalho, os pesquisadores criaram um método de “otimização do aprendizado no loop”, em que todos os parâmetros otimizados são aprendidos durante um único ciclo de feedback, ao longo de muitas simulações. E, ao mesmo tempo que o aprendizado da otimização – ou “in the loop” – o método também aprende a representação do estado.

O modelo emprega uma técnica chamada método de ponto material (MPM), que simula o comportamento de partículas de materiais contínuos, como espumas e líquidos, cercados por uma grade de fundo. Ao fazer isso, ele captura as partículas do robô e seu ambiente observável em pixels ou pixels 3D, conhecidos como voxels, sem a necessidade de qualquer cálculo adicional.

Em uma fase de aprendizado, essas informações brutas da grade de partículas são alimentadas em um componente de aprendizado de máquina que aprende a inserir uma imagem, compactá-la em uma representação de baixa dimensão e descomprimir a representação novamente na imagem de entrada. Se esse “autoencoder” reter detalhes suficientes durante a compactação da imagem de entrada, ele poderá recriar com precisão a imagem de entrada da compactação.

No trabalho dos pesquisadores, as representações compactadas aprendidas do auto-codificador servem como a representação de estado de baixa dimensão do robô. Em uma fase de otimização, essa representação compactada volta ao controlador, o que gera uma atuação calculada de como cada partícula do robô deve se mover na próxima etapa simulada pelo MPM.

Simultaneamente, o controlador usa essas informações para ajustar a rigidez ideal de cada partícula para alcançar o movimento desejado. No futuro, essas informações de material podem ser úteis para robôs flexíveis de impressão 3D, onde cada ponto de partícula pode ser impresso com rigidez ligeiramente diferente. “Isso permite a criação de projetos de robôs atendidos para os movimentos do robô que serão relevantes para tarefas específicas”, diz Spielberg. “Ao aprender esses parâmetros juntos, você mantém tudo o mais sincronizado possível para facilitar esse processo de design”.

Otimização mais rápida

Todas as informações de otimização são, por sua vez, retornadas ao início do loop para treinar o autoencoder. Em muitas simulações, o controlador aprende o movimento ideal e o design do material, enquanto o autoencoder aprende a representação de estado cada vez mais detalhada. “A chave é que queremos que esse estado de baixa dimensão seja muito descritivo”, diz Spielberg.

Depois que o robô chega ao seu estado final simulado por um período definido – digamos, o mais próximo possível do destino -, ele atualiza uma “função de perda”. Esse é um componente crítico do aprendizado de máquina, que tenta minimizar alguns erros. Nesse caso, minimiza, por exemplo, a que distância o robô parou do alvo. Essa função de perda flui de volta para o controlador, que usa o sinal de erro para ajustar todos os parâmetros otimizados para melhor concluir a tarefa.

Se os pesquisadores tentassem alimentar diretamente todas as partículas brutas da simulação no controlador, sem a etapa de compressão, “o tempo de execução e otimização explodiria”, diz Spielberg. Usando a representação compactada, os pesquisadores conseguiram diminuir o tempo de execução de cada iteração de otimização de vários minutos para cerca de 10 segundos.

Os pesquisadores validaram seu modelo em simulações de vários robôs biped e quadriped 2-D e 3-D. Eles pesquisadores também descobriram que, enquanto os robôs que usam métodos tradicionais podem fazer até 30.000 simulações para otimizar esses parâmetros, os robôs treinados em seu modelo realizaram apenas cerca de 400 simulações.

A implantação do modelo em robôs reais significa resolver problemas com ruídos e incertezas do mundo real que podem diminuir a eficiência e a precisão do modelo. Mas, no futuro, os pesquisadores esperam projetar um pipeline completo, da simulação à fabricação, para robôs flexíveis .