13 de jun. de 2023

AI MusicGen da Meta faz música a partir de prompts de texto




TX, 13/06/2023 



Por Peter Grad 



O filósofo do século 19, Thomas Carlyle, certa vez declarou: "Diz-se que a música é a fala dos anjos".

Alguém se pergunta o que Tom teria pensado sobre uma era posterior servindo protopunk, death metal e rock gótico.

Além disso, o que ele teria a dizer sobre as abordagens atuais da música composta não por anjos, mas por CPUs, RAM e grandes modelos de linguagem?

A Meta anunciou na semana passada que desenvolveu um processador de música AI que gera música com base em descrições de linguagem natural.

O MusicGen da Meta, que segue os passos do lançamento do MusicLM pelo Google em janeiro, que gera música com base em prompts de texto ou cantarolando, foi treinado em 20.000 horas de música. Seu código-fonte aberto está disponível no Github e o modelo pode ser testado online no Hugging Face.

Os usuários inserem uma breve descrição da música que desejam ouvir, como "Uma mistura dinâmica de hip-hop e elementos orquestrais, com cordas e metais arrebatadores, evocando a energia vibrante da cidade". Ou a descrição poderia ser mais simples: "música rock dos anos 90 com um riff de guitarra".

Opcionalmente, uma música pode ser carregada para ajudar a orientar a criação do conteúdo desejado.

O MusicGen gera um clipe de 12 segundos em alguns minutos.

De acordo com suas avaliações do programa, a Meta descobriu que o MusicGen se saiu melhor em medidas objetivas e subjetivas do que outros programas comparáveis, como MusicLM, Diffusion e Noise2Music.

"MusicGen produz amostras de alta qualidade que são melhor alinhadas melodicamente com uma determinada estrutura harmônica, enquanto aderem a uma descrição textual", relatou a Meta em um artigo publicado em 8 de junho no servidor de pré-impressão arXiv .

A ferramenta é vista como uma ajuda potencialmente inestimável para compositores e intérpretes.

Meta testou três versões de seu modelo. Eles variaram na quantidade de detalhes musicais fornecidos: 300 milhões, 1,5 bilhão e 3,3 bilhões de parâmetros.

Nas avaliações, a Meta descobriu que os humanos preferiam os resultados do modelo de faixa intermediária (1,5 bilhão de parâmetros). Isso talvez reflita a teoria do produtor musical e eletrônico francês, Rone, para uma produção musical de sucesso: "Menos é mais".

O modelo com o maior número de parâmetros, no entanto, gerou uma saída que refletiu com mais precisão a entrada de texto e áudio.

Inevitavelmente, como acontece com muitos projetos de IA em outros campos, surgirão preocupações. Acima de tudo, estão as questões legais que envolvem o uso de material protegido por direitos autorais.

Meta diz que todas as músicas usadas no treinamento são liberadas por acordos legais com detentores de direitos autorais.

Mas os usuários que adicionam uma música ou o nome do artista à sua descrição podem abrir a porta para possíveis violações de direitos autorais. O MusicLM do Google impede que os usuários incluam nomes de artistas, mas o Meta não.

E como o Meta permite que os usuários também enviem uma música para ser usada para ajudar a moldar a saída final, a linha entre o conteúdo original e o copiado é tênue.

O cantor e compositor australiano Nick Cave, abordando o tema da música AI no início deste ano, não deixou dúvidas sobre sua posição na música AI.

"As canções surgem do sofrimento... elas se baseiam na complexa e interna luta humana da criação", disse ele. "Até onde eu sei, os algoritmos não sentem. Os dados não sofrem. O ChatGPT não tem um ser interior, não esteve em lugar nenhum, não suportou nada, não teve a audácia de ir além de suas limitações e, portanto, não tem capacidade para uma experiência transcendente compartilhada, pois não tem limitações a partir das quais transcender”.

Da mesma forma, Ben Beaumont-Thomas, do The Guardian, afirmou recentemente: "A IA sempre será um ato de homenagem. Pode ser um ato de homenagem muito bom, do tipo que, se fosse humano, receberia reservas durante todo o ano em navios de cruzeiro e em Las cassinos de Las Vegas."

Mas o CEO do Spotify, Daniel Ek, tem uma visão mais otimista sobre a música gerada por IA.

"Isso pode ser potencialmente enorme para a criatividade ... Isso deve levar a mais música [que] achamos que é ótima culturalmente", disse ele.

Artigos recomendados: AIG e Meta


Fonte:https://techxplore.com/news/2023-06-meta-ai-musicgen-music-text.html 

Nenhum comentário:

Postar um comentário

Related Posts Plugin for WordPress, Blogger...