EDT, 05/04/2023
Por Jon Fingas
Segmentar Qualquer coisa não precisa de treinamento para saber que há algo em uma imagem.
A IA normalmente precisa ser treinada com material existente para detectar objetos, mas a Meta tem uma maneira de a tecnologia localizar itens sem ajuda. A gigante da mídia social publicou um modelo de IA que pode "segmentar qualquer coisa" que pode detectar objetos em fotos e vídeos, mesmo que não façam parte do conjunto de treinamento. Você pode selecionar itens clicando neles ou usando prompts de texto de formato livre. Como explica a Reuters, você pode digitar a palavra "gato" e observar a IA destacar todos os felinos em uma determinada foto.
O modelo também pode trabalhar em conjunto com outros modelos. Ele pode ajudar a reconstruir um objeto em 3D usando uma única imagem ou desenhar a partir de visualizações de um headset de realidade misturada. Efetivamente, o Segment Anything pode limitar a necessidade de treinamento adicional de IA.
Tanto o modelo de IA quanto um conjunto de dados poderão ser baixados com uma licença não comercial. Ou seja, os criadores não podem usá-lo para produtos. Isso é principalmente para pesquisa e expansão do acesso à tecnologia. No momento, a Meta usa uma tecnologia um tanto semelhante para moderar conteúdo proibido, recomendar postagens e marcar fotos.
Os desenvolvedores reconhecem que o modelo existente é falho. Ele pode perder detalhes mais sutis e não é tão preciso na detecção dos limites quanto alguns modelos. E embora o Segment Anything possa lidar com prompts em tempo real, ele se atrapalha quando o processamento de imagem exigente está envolvido. Algumas ferramentas de IA mais especializadas provavelmente superarão esse modelo em seus respectivos campos, diz a Meta.
Você não está prestes a ver essa IA em robôs ou outros dispositivos em que a detecção rápida e precisa de objetos é (geralmente) vital. No entanto, modelos como esse ainda podem ajudar em situações em que é impraticável depender exclusivamente de dados de treinamento. Uma rede social poderia usar a tecnologia para acompanhar um volume de conteúdo em rápido crescimento. No mínimo, isso mostra que a Meta quer generalizar a visão computacional.
A Meta não é estranha em compartilhar descobertas de IA, como um tradutor para idiomas não escritos. Com isso dito, há pressão sobre a empresa para mostrar que é uma potência na categoria tanto quanto pesos pesados da tecnologia como Google e Microsoft. Ela já está planejando "personas" generativas de IA para seus aplicativos sociais, e invenções como o Segment Anything mostram que ela tem algumas vantagens próprias.
Artigos recomendados: Meta e Biometria
Nenhum comentário:
Postar um comentário