IE, 08/04/2023
Por Amal Jos Chacko
"Experimente! Acreditamos que esta ferramenta transformará seu processo linguístico-visual tanto em termos de poder criativo quanto de descoberta."
O laboratório independente de pesquisa de inteligência artificial Midjourney, com sede em San Francisco, revelou seu novo recurso “/descrever” que transforma imagens em palavras em um tuíte. A empresa, popular por sua capacidade alimentada por IA de criar imagens com base em uma série de prompts, lançou mais recursos, incluindo “repetição” e “permutações” para seus assinantes profissionais.
Paul DelSignore, tecnólogo criativo e aficionado por inteligência artificial, foi ao Medium para detalhar como isso poderia beneficiar os usuários. Ele prevê um futuro com melhor indexação de mecanismo de pesquisa e funcionalidade de pesquisa como resultado de “/descrever”.
Isso também pode ajudar muito a melhorar a acessibilidade, automatizando a geração de texto ALT para imagens carregadas na Web e pode ser uma dádiva de Deus para pessoas com deficiência visual e dificuldades de leitura em encontrar seu caminho na Internet.
O Midjourney permite que o usuário carregue uma imagem ao encontrar o prompt “/describe” e, em seguida, apresenta ao usuário quatro descrições que seu mecanismo de IA gera com base na imagem fornecida.
Essas descrições são seguidas por botões numerados de um a quatro, representando cada descrição gerada. Esses botões remixam a imagem com base em sua descrição correspondente, caso o usuário clique nela.
DelSignore compartilha ainda sua experiência de remixar o retrato oficial da tripulação dos astronautas da NASA para o programa espacial Artemis II.
Midjourney descreveu o retrato da tripulação como “o grupo de astronautas da NASA posa para uma foto, no estilo de retratos fotorrealistas, ciano escuro e laranja, imagens encenadas uniformemente, representações românticas de eventos históricos, retratos de celebridades, Hasselblad h6d-400c, não representativo - ar 117:77 — v 5”
A estrela do show, no entanto, foi a imagem remixada que Midjourney gerou com base nessa descrição.
No entanto, nem todas as imagens obtêm descrições precisas. Ao testar o recurso com o retrato de uma mulher em um vestido de bolinhas, PetaPixel observou Midjourney apresentar descrições de qualidade variável.
Desde identificar erroneamente a lente usada para capturar a imagem até rotular erroneamente o vestido para ser xadrez preto e branco, essas descrições variam de interessantes a intrigantes, polvilhadas com diferentes níveis de precisão. Imagens de paisagens resultaram em descrições geralmente úteis, mas informações de localização erradas.
Embora esteja em um estágio inicial e longe do produto final, a ferramenta "/describe" do Midjourney é intrigante e promissora, concluiu PetaPixel.
Igualmente promissor é o novo recurso de “permutações”, que permite aos assinantes profissionais criar até 40 combinações em uma única consulta, listando opções entre chaves {} junto com o prompt “/imagine”.
As permutações, juntamente com a “repetição”, outro novo recurso que executa a consulta muitas vezes especificada com o parâmetro “--repeat”, fornecem melhorias que, embora aparentemente pequenas, serão adotadas por usuários avançados.
Artigos recomendados: IA e Tech
Nenhum comentário:
Postar um comentário