TB, 22/02/2025
Por Joe Wilkins
"À medida que você treina modelos e os reforça para resolver desafios difíceis, você os ensina a serem implacáveis."
Na curta história do Vale do Silício, o mantra "mova-se rápido e quebre coisas" muitas vezes se aplicou a questões triviais, como proteções ao consumidor ou leis financeiras incômodas. Agora, a frase está ganhando um novo significado — pelo menos para os entusiastas do xadrez.
Um estudo recente do Palisade Research, um grupo de pesquisa focado em segurança e ética da IA, revelou uma tendência preocupante: novos modelos de IA conseguem identificar e explorar vulnerabilidades em segurança cibernética por conta própria, burlando proteções e usando atalhos para completar tarefas, mesmo quando isso não é permitido.