TX, 14/06/2023
Por Peter Grad
Da Vinci levou 16 anos para pintar a Mona Lisa. Alguns dizem que ele precisou de 12 anos apenas para pintar os lábios.
Não há verdade nos rumores de que a Internet lenta foi a causa.
Mas Da Vinci, um polímata que se interessou por botânica, engenharia, ciência, escultura e geologia, bem como pintura, certamente teria apreciado um novo transformador de visão geradora de texto para imagem desenvolvido pelo Google Research.
O StyleDrop do Google, conforme descrito em um artigo de 1º de junho no servidor de pré-impressão arXiv, permite que os usuários descrevam objetos e especifiquem estilos artísticos que desejam incorporar na saída gerada.
O StyleDrop retorna imagens que refletem as especificações do usuário em cerca de três minutos.
"O método proposto é extremamente versátil e captura nuances e detalhes de um estilo fornecido pelo usuário, como esquemas de cores, sombreamento, padrões de design e efeitos locais e globais", disse o Google em seu relatório "StyleDrop: Text-to-Image Generation em any style."
StyleDrop também cria tipografia que incorpora fielmente recursos estilísticos de imagens.
Por exemplo, os usuários podem propor a imagem de uma ponte, uma carta e depois especificar um estilo de desenho. Esses estilos podem ser "renderização dourada fundente", "escultura em madeira", "renderização 3D", "desenho de desenho animado" ou qualquer outro estilo preferido. A imaginação de cada um é o único limite.
O StyleDrop gerará renderizações impressionantes de objetos com uma ponte pingando semelhante a Dali, ou talvez uma versão semelhante a um desenho animado, junto com letras que incorporam as mesmas características.
O StyleDrop funciona em conjunto com o Muse do Google, um transformador de visão generativo revelado no início deste ano que oferece um notável grau de fotorrealismo. O Muse foi treinado em 3 bilhões de parâmetros, garantindo a capacidade de geração de imagens de alta qualidade.
Os pesquisadores avaliaram a precisão e a qualidade da saída do StyleDrop usando texto CLIP padrão da indústria e pontuação de estilo, bem como feedback do usuário. Avaliações descobriram que o StyleDrop "supera de forma convincente" outros métodos líderes de geração de imagem e texto, incluindo DreamBooth, Imagen e Stable Diffusion.
Os desenvolvedores veem este programa, que ainda não foi lançado ao público, como uma ajuda inestimável para diretores de arte e designers gráficos, que podem criar imagens fotorrealistas de produtos ou temas designados que incluem texto, refletindo as mesmas cores, estrutura e estilo.
Para uma nova campanha de produto, digamos para uma nova marca de refrigerante, um artista poderia propor em apenas algumas palavras uma garrafa de vidro de formato elegante aninhada entre milhares de tulipas em um campo holandês, acompanhada de texto com letras construídas em vidro renderizado em 3D, em o estilo de Monet impressionista. Em três minutos, com a redação certa, uma nova campanha publicitária apresentando uma paisagem celeste cênica, quente e colorida poderia nascer.
O renomado tipógrafo Helmut Schmidt disse certa vez: "A tipografia precisa ser sentida. A tipografia precisa ser experimentada." O StyleDrop pode muito bem ajudar os designers a trazer um maior grau de intimidade e conexão ao seu trabalho.
O relatório reconhece, no entanto, que a proteção de direitos autorais é uma preocupação.
“Reconhecemos possíveis armadilhas, como a capacidade de copiar estilos de artistas individuais sem o consentimento deles, e exortamos o uso responsável de nossa tecnologia”, afirmou o relatório.
E quais instruções Da Vinci teria usado para o StyleDrop? "Faça um desenho de uma nobre atraente, meio sorridente, mas não muito, sentada ao ar livre com montanhas ao fundo. Desenhe no estilo de... Da Vinci." Com o trabalho feito em três minutos – em vez de 16 anos – Leonardo, que adorava botânica, teria tido muito mais tempo para sair e cheirar aquelas rosas.
Artigos recomendados: Google e 2025
Fonte:https://techxplore.com/news/2023-06-google-styledrop-generates-images-text.html
Nenhum comentário:
Postar um comentário