TX, 28/06/2023
Por Rachel Gordon
Os computadores possuem duas capacidades notáveis no que diz respeito às imagens: eles podem identificá-las e gerá-las novamente. Historicamente, essas funções permaneceram separadas, semelhantes aos atos díspares de um chef que é bom em criar pratos (geração) e um conhecedor que é bom em degustar pratos (reconhecimento).
No entanto, não podemos deixar de nos perguntar: o que seria necessário para orquestrar uma união harmoniosa entre essas duas capacidades distintas? Tanto o chef quanto o conhecedor compartilham um entendimento comum no sabor da comida. Da mesma forma, um sistema de visão unificada requer uma compreensão profunda do mundo visual.