Correio Paulista: Midjourney V5 é lançado com novos recursos que prometem acessibilidade

IE, 08/04/2023

"Experimente! Acreditamos que esta ferramenta transformará seu processo linguístico-visual tanto em termos de poder criativo quanto de descoberta."

O laboratório independente de pesquisa de inteligência artificial Midjourney, com sede em San Francisco, revelou seu novo recurso “/descrever” que transforma imagens em palavras em um tuíte. A empresa, popular por sua capacidade alimentada por IA de criar imagens com base em uma série de prompts, lançou mais recursos, incluindo “repetição” e “permutações” para seus assinantes profissionais.

Paul DelSignore, tecnólogo criativo e aficionado por inteligência artificial, foi ao Medium para detalhar como isso poderia beneficiar os usuários. Ele prevê um futuro com melhor indexação de mecanismo de pesquisa e funcionalidade de pesquisa como resultado de “/descrever”.

Isso também pode ajudar muito a melhorar a acessibilidade, automatizando a geração de texto ALT para imagens carregadas na Web e pode ser uma dádiva de Deus para pessoas com deficiência visual e dificuldades de leitura em encontrar seu caminho na Internet.

O Midjourney permite que o usuário carregue uma imagem ao encontrar o prompt “/describe” e, em seguida, apresenta ao usuário quatro descrições que seu mecanismo de IA gera com base na imagem fornecida.

Essas descrições são seguidas por botões numerados de um a quatro, representando cada descrição gerada. Esses botões remixam a imagem com base em sua descrição correspondente, caso o usuário clique nela.

DelSignore compartilha ainda sua experiência de remixar o retrato oficial da tripulação dos astronautas da NASA para o programa espacial Artemis II.

Midjourney descreveu o retrato da tripulação como “o grupo de astronautas da NASA posa para uma foto, no estilo de retratos fotorrealistas, ciano escuro e laranja, imagens encenadas uniformemente, representações românticas de eventos históricos, retratos de celebridades, Hasselblad h6d-400c, não representativo - ar 117:77 — v 5”

A estrela do show, no entanto, foi a imagem remixada que Midjourney gerou com base nessa descrição.

No entanto, nem todas as imagens obtêm descrições precisas. Ao testar o recurso com o retrato de uma mulher em um vestido de bolinhas, PetaPixel observou Midjourney apresentar descrições de qualidade variável.

Desde identificar erroneamente a lente usada para capturar a imagem até rotular erroneamente o vestido para ser xadrez preto e branco, essas descrições variam de interessantes a intrigantes, polvilhadas com diferentes níveis de precisão. Imagens de paisagens resultaram em descrições geralmente úteis, mas informações de localização erradas.

Embora esteja em um estágio inicial e longe do produto final, a ferramenta "/describe" do Midjourney é intrigante e promissora, concluiu PetaPixel.

Igualmente promissor é o novo recurso de “permutações”, que permite aos assinantes profissionais criar até 40 combinações em uma única consulta, listando opções entre chaves {} junto com o prompt “/imagine”.

As permutações, juntamente com a “repetição”, outro novo recurso que executa a consulta muitas vezes especificada com o parâmetro “--repeat”, fornecem melhorias que, embora aparentemente pequenas, serão adotadas por usuários avançados.

Artigos recomendados: IA e Tech

Fonte:https://interestingengineering.com/innovation/midjourney-v5-rolls-out-with-new-features-promising-accessibility

Páginas

9 de abr. de 2023

Midjourney V5 é lançado com novos recursos que prometem acessibilidade

Nenhum comentário:

Postar um comentário