Páginas

12 de out. de 2022

Um Joe Rogan gerado por IA conversa com Steve Jobs sobre seu uso de LSD: áudio deepfake




GM, 11/10/2022 



Por Kyle Barr 



O Podcast.ai gerou uma gravação de áudio falsa usando vozes artificiais e transcrições de modelos de linguagem com base nos antigos discursos públicos e palestras de Rogan e Jobs.

É “Spooky Season”, então faz sentido que estaríamos vendo, ou pelo menos ouvindo, alguns famosos da tecnologia voltando dos mortos. Steve Jobs muitas vezes sentimos que ainda tem os dois pés fora da cova pela frequência com que o empresário de tecnologia é trazido (a vida) em conversas por pessoas dentro e fora da empresa que ele co-fundou. No entanto, um podcast recém-lançado hospedado por uma versão falsa de Joe Rogan tenta trazer a voz de Jobs de volta com… resultados interessantes.

A sinuosa entrevista falsa de quase 20 minutos foi surreal e ocasionalmente engraçada. Rogan começa abertamente chamando Jobs de “uma memória do passado”, com Jobs – falando de uma maneira um tanto empolada – dizendo “bom ver você, amigo. Já faz muito tempo desde que eu estive no show.” Rogan criou seu show em 2009, dois anos antes da morte de Jobs. O cofundador da Apple nunca esteve no programa. Ainda assim, o falso Rogan fica visivelmente em silêncio durante a maior parte da entrevista, fazendo perguntas simples e muito raramente opinando sobre a Apple ou qualquer uma das afirmações malucas de Jobs.

Em alguns pontos, a entrevista soava como clipes antigos de gravações anteriores das duas celebridades grampeadas como (quem deixa) iniciais em uma carta de resgate descuidada. Perto da marca de 2:30 minutos, o falso Rogan disse “temos uma conexão estranha que se liga ao fato de que eu era um grande fã do Gizmodo e ainda vou lá o tempo todo, mas houve alguma controvérsia ou algo assim”. Jobs responde: “Ficamos surpresos como você ao ver essas coisas no Gizmodo”.

Obrigado pela mensagem, Steve, mas ainda assim, não poderíamos saber do que falavão. Talvez tenha sido todo aquele negócio com o vazamento do iPhone 4, mas quem pode adivinhar?

Jobs então inicia uma discussão inteira sobre o budismo e depois a segue para o uso do LSD, acrescentando que “revela você por quem ou o que você é”. O falso fundador da Apple também mencionou os problemas que a Microsoft estava tendo com o Windows 3, ignorando as quase três décadas desde que o sistema operacional foi lançado. Ao final da entrevista falsa, Rogan e Jobs mencionam como "a tecnologia é uma espada de dois gumes", mas depois acabam mencionando que literalmente jogam seus computadores pela janela.

Apesar da estranha discrepância de áudio e falha de áudio, é surpreendente o quão bem a tecnologia funciona para imitar a fala, especialmente o teor e o estilo de fala de Rogan. O podcast foi criado usando o Play.ht, um gerador de texto para voz baseado em IA. De acordo com o site podcast.ai, a voz de Jobs foi gerada pelos modelos de linguagem de IA usando gravações do famoso fundador da Apple descobertas online. Pode ser por isso que Jobs parece estar falando além de Rogan em muitas partes do podcast, já que sua voz pode ser baseada em suas apresentações ao vivo. Play.ht revelou recentemente seu Peregrine, o modelo de conversão de texto em fala que eles afirmam adiciona emoção e humor humanos aos geradores de voz. Não está claro qual modelo foi usado no podcast.ai, mas neste podcast falso Rogan e Jobs pareciam brincar e rir sobre jogar os macs um do outro pela janela.

A empresa por trás do Peregrine escreveu que usa modelos de linguagem baseados em conceitos semelhantes aos modelos de linguagem GPT do DALL-E e OpenAI. Isso permite que o gerador de linguagem imite os tons e emoções dos humanos “de maneira auto-supervisionada”, de acordo com a empresa. Play.ht também mostrou como a tecnologia pode ser usada para clonar outras vozes famosas como Kevin Hart, Tom Hanks e até mesmo o falecido presidente John F. Kennedy.

Em um e-mail com o Gizmodo, o cofundador da Play.ht, Syed Hammad, disse que sua empresa criou o podcast.ai para demonstrar os recursos de sua ferramenta de fala de IA. Ele acrescentou que algumas das falhas encontradas no áudio de Jobs foram devido às entrevistas e apresentações de baixa qualidade das quais eles foram originados. Hammad disse que há alguns problemas com seu modelo de fala, incluindo um tempo de renderização lento, mas eles estão trabalhando em novas atualizações que devem resolver esses problemas.

A voz [de Jobs] foi criada com apenas alguns minutos de seu discurso de seus vídeos no palco ou entrevistas que tinham muito barulho, daí as falhas”, escreveu Hammad. “Mas, no entanto, a (reprodução da) voz acabou sendo muito impressionante.”

O Podcast.ai agora está pedindo aos usuários que votem (para escolher quem "irá") nas próximas entrevistas geradas por IA. Embora existam discrepâncias óbvias de áudio envolvidas nesta última exibição de tecnologia de IA, é fácil ver como essa tecnologia pode um dia se tornar avançada o suficiente para tornar as deepfakes um verdadeiro incômodo muito além de seu uso criminoso atual.

Por mais peculiar que seja ouvir um fac-símile de Joe Rogan, um homem que muitas vezes é muito franco, ser tão constrangido em uma entrevista com um dos empresários de tecnologia mais famosos de todos os tempos, Rogan provavelmente cadenciaria (o andamento da entrevista) um pouco, ao entrevistar o verdadeiro Jobs se o CEO ainda estivesse vivo hoje. Recentemente, ele entrevistou o CEO da Meta, Mark Zuckerberg, por quase três horas, onde eles conversaram sobre tudo, desde MMA até a criação do chamado metaverso e acordar sentindo como se estivesse levando “um soco no estômago”. Sabendo como foi essa entrevista, só podemos suspeitar que uma entrevista na vida real entre Rogan e Jobs seria igualmente estranha.

Artigos recomendados: IA e DPF


Fonte:https://gizmodo.com/joe-rogan-steve-jobs-ai-podcast-1849643390

Nenhum comentário:

Postar um comentário