IE, 23/02/2023
Por Jijo Malayil
O modelo de linguagem poderia comandar braços robóticos, drones e robôs assistentes domésticos.
Imagine um cenário no qual você pode se comunicar diretamente com os robôs, permitindo que eles concluam várias tarefas para você. Para conseguir isso, a Microsoft delineou seus planos de parceria com a OpenAI para desenvolver os recursos do ChatGPT para controlar robôs. A gigante do software usou o chatbot e "controlou várias plataformas, como braços robóticos, drones e robôs assistentes domésticos intuitivamente com a linguagem", escreveu a empresa em uma postagem no blog.
Os robôs ainda dependem fortemente de códigos escritos à mão para realizar suas tarefas, enquanto os humanos consideram a linguagem falada a maneira mais intuitiva de se comunicar. A Microsoft trabalhou para alterar essa realidade e "tornar possíveis as interações naturais entre humanos e robôs usando o novo modelo de linguagem AI da OpenAI, ChatGPT".
Como o ChatGPT pode ajudar nesse sentido?
A equipe planeja aproveitar a capacidade da plataforma de desenvolver respostas coerentes e gramaticalmente corretas para vários prompts e perguntas e ver se o ChatGPT pode pensar além do texto e raciocinar sobre o mundo físico para ajudar nas tarefas de robótica. "Queremos ajudar as pessoas a interagir com robôs de forma mais fácil, sem a necessidade de aprender linguagens de programação complexas ou detalhes sobre sistemas robóticos."
O principal obstáculo no caminho para um modelo de linguagem baseado em IA é resolver problemas considerando as leis da física, o contexto do ambiente operacional e como as ações físicas do robô podem mudar o estado do mundo. Mesmo que o ChatGPT possa fazer muito sozinho, ele ainda precisa de ajuda. A Microsoft lançou uma série de princípios de design, incluindo estruturas de solicitação exclusivas, APIs de alto nível e feedback humano via texto. Esses modelos podem ser usados para guiar modelos de linguagem para resolver tarefas de robótica.
A empresa também está lançando o PromptCraft, uma plataforma de código aberto onde qualquer pessoa pode "compartilhar exemplos de estratégias de solicitação para diferentes categorias de robótica".
Usando esses princípios de design, os pesquisadores podem ajustar e utilizar o conhecimento do ChatGPT para controlar diferentes formatos de robôs para várias tarefas. A equipe poderia usar o modelo de linguagem para resolver "quebra-cabeças de robótica, juntamente com implantações complexas de robôs nos domínios de manipulação, aéreo e de navegação".
Várias instâncias em que o modelo funcionou
A equipe conseguiu usar o sistema para permitir que o ChatGPT controlasse um drone. De acordo com a Microsoft, o ChatGPT fez perguntas de acompanhamento quando os comandos não eram claros e "escreveu estruturas de código complexas para o drone, como um padrão em zigue-zague para inspecionar as prateleiras visualmente. Ele até descobriu como tirar uma selfie".
O modelo também realizou um exercício simulado de inspeção industrial com o simulador Microsoft AirSim. “O modelo foi capaz de analisar efetivamente a intenção de alto nível do usuário e as dicas geométricas para controlar o drone com precisão”.
O modelo mostrou a capacidade de unir os domínios textual e físico quando encarregado de construir o logotipo da Microsoft a partir de blocos de madeira.
O ChapGPT também poderia escrever um algoritmo para um drone atingir uma meta no espaço sem colidir com obstáculos.
A Microsoft, no entanto, fez ressalvas para os usuários, pois tais práticas precisam de uma análise completa antes de serem usadas no dia-a-dia. “Incentivamos os usuários a aproveitar o poder das simulações para avaliar esses algoritmos antes de possíveis implantações na vida real e sempre tomar as precauções de segurança necessárias”.
Artigos recomendados: Drones e ChatGPT
Fonte:https://interestingengineering.com/innovation/microsoft-trains-chatgpt-to-control-robots
Nenhum comentário:
Postar um comentário