NA, 13/03/2024
Por Loz Blain
Ele pode planejar e executar autonomamente tarefas de milhares de etapas. Pode construir e implantar projetos de software inteiros sozinho. Pode pesquisar e corrigir bugs 7 vezes melhor do que o GPT-4 da OpenAI, e treina e implanta suas próprias IA personalizadas para resolver problemas.
A Cognition Labs anunciou o Devin, o "primeiro engenheiro de software de IA do mundo". E embora seja verdade que LLMs anteriores como o GPT-4 e o Claude da Anthropic já fossem capazes de escrever e executar código há algum tempo, o Devin parece ser uma mudança significativa.
Essencialmente, essa nova IA é projetada para agir como uma equipe de software inteira - diga o que você quer, e ela colocará seus chapéus de gerenciamento de projetos e análise de negócios para elaborar um plano e criar requisitos. Em seguida, criará pequenos lacaios de IA para executar determinadas etapas, alternando entre seus próprios terminais isolados, editores de código e navegadores. Em seguida, testará, depurará e iterará até considerar o aplicativo completo, e o implantará para você.
Se desejar, ela pode fazer todo esse processo - que pode envolver milhares de pontos de decisão - completamente autonomamente, simplesmente fornecendo a você um produto final para examinar e solicitar alterações. Ou programadores experientes podem tratá-la mais como um colaborador, permanecendo mais envolvidos na tomada de decisões e no design, ou simplesmente usá-la como uma equipe de lacaios de codificação ou teste, ou um especialista em documentação.
De certa forma, então, parece algo semelhante ao que o AutoGPT prometeu, mas não conseguiu entregar imediatamente: um executivo de IA encarregado de sua própria equipe, que gerencia um projeto inteiro do início ao fim.
Parece ter algumas capacidades novas e surpreendentes; a Cognition Labs diz que ela é capaz de se aprimorar em novas tecnologias que possa precisar para concluir uma tarefa. No exemplo abaixo, ela lê um post de blog para descobrir como usar o ControlNet no Modal e, em questão de minutos, usa essa tecnologia e técnicas previamente desconhecidas para alcançar o resultado desejado: neste caso, gerar imagens de IA com palavras nelas.
Possivelmente mais assustador é a capacidade do Devin de criar e treinar suas próprias IAs escravas. No vídeo abaixo, o sistema Devin clona uma versão do modelo de linguagem Llama de código aberto da Meta com 7 bilhões de parâmetros, verifica o arquivo readme para aprender a configurá-lo e o faz - até mesmo excluindo e reinstalando pacotes que não estão funcionando. Em seguida, ele inicia uma execução de treinamento e, em questão de horas, clonou e treinou um novo modelo de IA especificamente para uma tarefa.
IAs gerando e treinando seus próprios agentes de IA caseiros; é uma ideia incrivelmente poderosa e absolutamente o tipo de coisa que um programador autônomo de próxima geração provavelmente precisa ser capaz de fazer, já que muitas tarefas agora podem e devem ser realizadas por IA personalizadas cada vez mais capazes. Por outro lado, meu Deus; qualquer pessoa ao lado dirá "As AIs buscarão poder e nos matarão todos" da cerca provavelmente não ficará encantada com essa ideia.
Em termos de desempenho, o Devin parece ser um grande avanço. A Cognition Labs já começou a dar trabalhos reais de programação para a IA, retirados do Upwork, um dos quais envolvia configurar, depurar e testar um modelo de visão computacional.
A equipe o comparou com o GPT-4 e outros modelos em torno do desafio de lidar com problemas do mundo real em projetos de código aberto no GitHub e tentar resolvê-los autonomamente. Sem qualquer assistência, o Devin foi capaz de resolver quase 14% do seu subconjunto desses problemas. O próximo melhor sistema testado, Claude 2, resolveu 4,8%, e o GPT-4 menos de 2% - e todos os modelos testados, exceto o Devin, foram informados exatamente quais arquivos precisavam ser editados em vez de terem que descobrir sozinhos.
O Devin está atualmente em acesso antecipado, e a Cognition Labs está pedindo aos potenciais clientes que entrem em contato diretamente em vez de abrir as portas imediatamente.
Mas esta é a forma mais avançada que já vimos até agora do que certamente parece estar por vir: o programador de IA de ponta a ponta que simplesmente descobre o que você quer e vai lá e faz, depois conserta o que você não gosta - em uma fração do tempo e a uma fração do custo que uma equipe de software humana precisa. Da inspiração aos resultados com 0% de transpiração.
Haverá uma séria reação a isso - claramente, alguns desenvolvedores estão menos do que encantados, embora se haja um grupo de pessoas que pode ver para onde o vento está soprando nesse sentido, seriam os programadores. Além disso, haverá sérias reações das pessoas responsáveis por manter sistemas críticos em torno da ideia de deixar algum modelo de IA passar por cima de todo o código, "corrigindo" coisas de maneiras que podem não ser totalmente compreendidas, com efeitos downstream que podem ser difíceis de prever. Vai demorar antes que as pessoas confiem nesse tipo de modelo.
Two weeks ago, I had Devin build a small SMS website summarizer and deploy it via Twilio. I was very impressed how autonomous it was.
— Silas Alberti (@SilasAlberti) March 13, 2024
My favorite part about Devin is that it feels very collaborative. Almost like a human co-worker.
My prediction is that being a strong engineer… pic.twitter.com/HywlaI9DBq
Mas quanto melhor esses sistemas ficam, mais o papel de um codificador começa a se parecer com o de um supervisor. E em algum momento, a IA se tornará um melhor supervisor também. Esse novo lançamento ecoa as palavras do CEO da Nvidia, Jensen Huang, que recentemente disse na Cúpula Mundial dos Governos em Dubai que as crianças não deveriam estar aprendendo a codificar.
Portanto, parece que o Devin pode ser o principal engenheiro de software de IA no momento -, mas a Cognition Labs não deveria apostar nisso por muito tempo. Quase qualquer pessoa que lance um produto forte no campo da IA deve ter uma sensação palpável de alguém de olho neles; a OpenAI provavelmente tem algo muito avançado em teste que leva as coisas a outro nível. Pode ser um produto específico, ou isso pode ser o tipo de coisa que o GPT-5 engolirá no café da manhã enquanto escreve simultaneamente mil roteiros monótonos, anódinos e inofensivos e gera filmes inteiros, junto com crossovers de videogame e planos CAD para figuras de merchandising.
Artigos recomendados: AGI e Automação
Fonte:https://newatlas.com/technology/devin-ai-software-engineer/
Nenhum comentário:
Postar um comentário