Páginas

24 de ago. de 2023

Uma startup de IA agora pode gerar fala usando sua voz em 30 idiomas





Decrypt, 23/08/2023 



Por José Antonio Lanz 



Quer saber como você soaria falando outro idioma – sem sotaque? Descubra com o novo gerador de fala do ElevenLab.

A corrida armamentista da IA ​​continua a acelerar, com novas fronteiras na clonagem de voz surgindo quase diariamente. O desenvolvimento mais recente vem da startup ElevenLabs, com sede em São Francisco, que acaba de anunciar que seu novo modelo de IA agora pode imitar vozes falando fluentemente em 30 idiomas diferentes – uma expansão dramática dos oito originais que eram suportados anteriormente.



A empresa usou a Lukeman Literary, uma agência literária e editora independente, como exemplo, explicando que a empresa produz muitos audiolivros todos os anos em vários idiomas.

A equipe de Lukeman costumava levar semanas para produzir um único audiolivro porque era necessário encontrar o dublador certo, reservar um estúdio de gravação e gravar e gerenciar a pós-produção”, disse a ElevenLabs em uma postagem oficial no blog descrevendo todo o processo, que normalmente leva algumas horas.

De acordo com a ElevenLabs, o novo modelo Multilingual v2 oferece áudio “emocionalmente rico” que captura as inflexões matizadas da fala natural. Os usuários digitam o texto que desejam que seja falado no idioma de destino, e a IA gera uma narração contínua.

A empresa oferece duas opções principais de clonagem de voz: uma ferramenta de conversão de texto em fala e um “VoiceLab” para clonar vozes específicas.

Os usuários carregam amostras de fala para criar um clone de voz personalizado, que a IA analisa para construir uma versão sintética. Essa voz clonada pode então ser manipulada para dizer qualquer coisa imaginável. A  ElevenLabs afirma que a atualização mais recente significa que esses doppelgangers de IA agora podem falar fluentemente línguas como sueco, árabe e malaio.

As capacidades linguísticas expandidas também coincidem com o fato de a ElevenLabs retirar sua tecnologia de clonagem de voz dos testes beta. A empresa pretende comercializar a ferramenta para aplicações práticas como narração de audiolivros, como é o caso da Lukeman Literary.

Resolvendo preocupações

O potencial de utilização indevida da tecnologia obscurece estas ambições empresariais. O áudio deepfake deixa os usuários vulneráveis ​​a campanhas de fraude e desinformação. A própria ElevenLabs sofreu reações adversas no ano passado, quando sua plataforma foi explorada para se passar outra pessoa e assediar figuras públicas.

A empresa afirma que salvaguardas mais rigorosas foram implementadas desde então, mas persistem preocupações éticas. Como o Decrypt relatou recentemente, um “golpista poderia usar IA para clonar a voz de seu ente querido”, e tudo o que seria necessário para obter resultados confiáveis ​​seriam alguns minutos de áudio.

Grandes empresas de tecnologia como a Meta enfrentam críticas semelhantes por desenvolverem IA generativa poderosa sem total transparência. A Meta revelou recentemente uma ferramenta de síntese de voz de IA chamada Voicebox, que reconheceu que poderia facilmente facilitar deepfakes. Ao contrário do ElevenLabs, a Meta se absteve de qualquer divulgação pública devido aos “riscos de uso indevido”.

No entanto, apesar dos receios, o rápido progresso na clonagem de voz por IA parece imparável. Como afirmou o linguista Mati Staniszewski, da ElevenLabs: “Eventualmente, esperamos cobrir ainda mais idiomas e vozes com a ajuda da IA ​​e eliminar as barreiras linguísticas ao conteúdo”.

Garantir a implementação ética continua a ser um grande desafio, uma vez que a linha entre a desinformação global e as formas inovadoras de comunicação é muito tênue. Agir com cuidado é fundamental – para que a nossa aldeia global de vozes não se transforme numa cacofónica Torre de Babel.

Artigos recomendados: DPF e Psyop


Fonte:https://decrypt.co/153544/ai-voice-cloning-30-languages-elevenlabs-startup 

Nenhum comentário:

Postar um comentário