Decrypt, 02/01/2024
Por Joseph Antony
O gerador de imagens de IA MidJourney começará a treinar seu modelo de vídeo nos próximos dias e espera lançar um produto final “em alguns meses”
Midjourney, a ferramenta generativa de criação de imagens talvez mais conhecida por rodar dentro de um servidor Discord, está espalhando suas asas de IA. Os criadores do Midjourney anunciaram nesta terça-feira que planejam introduzir um modelo de “texto para vídeo” nos próximos meses.
A empresa começará a treinar seus modelos de vídeo a partir de janeiro, disse o CEO David Holz durante uma sessão do Discord “Office Hour”. Esta mudança representa uma progressão natural para a plataforma, baseada num modelo de imagem maduro para estimular a dinâmica competitiva da indústria de vídeo generativo.
As notas da sessão do Discord incluíam ajustes planejados para V6 Niji – modelo gerador de mangá/anime do Midjourney – e correções de consistência para o próximo lançamento oficial do Midjourney V6. A empresa também escreveu que sua lista de tarefas exige “o início do treinamento para novos modelos de vídeo”, que poderia estar pronto “em alguns meses”.
Nenhuma informação adicional sobre o modelo foi compartilhada por Holz ou pela equipe Midjourney.
Midjourney é conhecido por enfatizar a qualidade e a experiência do usuário em detrimento da velocidade bruta, mesmo que isso significasse ficar atrás dos concorrentes. A empresa lançou melhorias como inpainting e outpainting meses depois que os recursos se tornaram funcionais de fato em outras plataformas como Stable Diffusion, e sua recente incursão na geração de texto rudimentar veio depois que era um recurso comum em outros modelos como Dall-E 3, SDXL ou até mesmo alguns geradores menos populares como Ideograma ou IF.
Entrando em um campo lotado
Essa aposta no setor de vídeo também surge na esteira dos lançamentos da concorrência. Stability AI anunciou recentemente Stable Video Diffusion; A Meta acaba de apresentar seu gerador de vídeo EMU, e modelos existentes como Pika e Runway ML estão marcando seu território, deixando a entrada da Midjourney emergir em um cenário competitivo robusto. Além disso, outros geradores de imagens como o Leonardo AI já implementaram recursos de geração de vídeo, intensificando ainda mais a corrida.
A recente atualização v6 do Midjourney, com acompanhamento rápido aprimorado e imagens mais realistas, é o esforço mais recente da empresa para permanecer relevante e competitivo. Se os seus modelos mostrarem alguma coesão, poderão ganhar terreno sólido num campo tão emergente – mesmo com modelos que ainda estão longe da perfeição.
As implicações destes desenvolvimentos vão muito além de uma corrida corporativa pela supremacia. À medida que a Midjourney e outras empresas inovam e refinam as suas ofertas, as indústrias criativas e de comunicação social estão à beira de uma era transformadora. A capacidade de gerar, manipular e interagir com conteúdo de vídeo por meio de IA abre muitas possibilidades – desde facilitar as coisas para artistas e anunciantes até potencialmente remodelar a forma como percebemos a realidade.
Artigos recomendados: Video e Web3
Fonte:https://decrypt.co/211583/midjourney-leaps-into-ai-video-creation
Nenhum comentário:
Postar um comentário