YF, 27/08/2022 - com TechCrunch
Por Kyle Wiggers
A pesquisa no campo de aprendizado de máquina e IA, agora uma tecnologia-chave em praticamente todos os setores e empresas, é volumosa demais para que qualquer um leia tudo. Esta coluna, Perceptron, tem como objetivo coletar algumas das descobertas e artigos recentes mais relevantes – particularmente, mas não limitado a, inteligência artificial – e explicar por que eles são importantes.
Um "earable" (audível) que usa sonar para ler expressões faciais estava entre os projetos que nos chamaram a atenção nas últimas semanas. O mesmo aconteceu com o ProcTHOR, uma estrutura do Allen Institute for AI (AI2) que gera ambientes processualmente que podem ser usados para treinar robôs do mundo real. Entre os outros destaques, (a empresa) Meta criou um sistema de IA que pode prever a estrutura de uma proteína a partir de uma única sequência de aminoácidos. E pesquisadores do MIT desenvolveram um novo hardware que, segundo eles, oferece computação mais rápida para IA com menos energia.
O "earable", que foi desenvolvido por uma equipe da Cornell, se parece com um par de fones de ouvido volumosos. Os alto-falantes enviam sinais acústicos para o lado do rosto do usuário, enquanto um microfone capta os ecos quase imperceptíveis criados pelo nariz, lábios, olhos e outras características faciais. Esses "perfis de eco" permitem que o earable capture movimentos como sobrancelhas levantadas e olhos arregalados, que um algoritmo de IA traduz em expressões faciais completas.
O audível tem algumas limitações. Ele dura apenas três horas com bateria e precisa descarregar o processamento em um smartphone, e o algoritmo de IA de tradução de eco deve treinar em 32 minutos de dados faciais antes de começar a reconhecer expressões. Mas os pesquisadores argumentam que é uma experiência muito mais elegante do que os gravadores tradicionalmente usados em animações para filmes, TV e videogames. Por exemplo, para o jogo de mistério LA Noire, a Rockstar Games construiu um equipamento com 32 câmeras treinadas no rosto de cada ator.
Talvez algum dia, o earable de Cornell seja usado para criar animações para robôs humanóides. Mas esses robôs terão que aprender a navegar em uma sala primeiro. Felizmente, o ProcTHOR do AI2 dá um passo (sem trocadilhos) nessa direção, criando milhares de cenas personalizadas, incluindo salas de aula, bibliotecas e escritórios nos quais robôs simulados devem concluir tarefas, como pegar objetos e mover móveis.
A ideia nos bastidores é que simular iluminação que contém um subconjunto de uma enorme variedade de materiais de superfície (por exemplo, madeira, azulejo, etc.) e objetos domésticos, é expor os robôs simulados à maior variedade possível. É uma teoria bem estabelecida em IA que o desempenho em ambientes simulados pode melhorar o desempenho de sistemas do mundo real; empresas de carros autônomos como a Waymo da Alphabet simulam bairros inteiros para ajustar como seus carros do mundo real se comportam.
Quanto ao ProcTHOR, AI2 afirma em um documento que dimensionar o número de ambientes de treinamento melhora consistentemente o desempenho. Isso é um bom presságio para robôs com destino a residências, locais de trabalho e outros lugares.
É claro que treinar esses tipos de sistemas requer muito poder de computação. Mas isso pode não ser o caso para sempre. Pesquisadores do MIT dizem que criaram um processador “analógico” que pode ser usado para criar redes super-rápidas de “neurônios” e “sinapses”, que por sua vez podem ser usados para executar tarefas como reconhecer imagens, traduzir idiomas e muito mais.
O processador dos pesquisadores usa "resistores protônicos programáveis" dispostos em uma matriz para "aprender" habilidades. Aumentar e diminuir a condutância elétrica dos resistores imita o fortalecimento e o enfraquecimento das sinapses entre os neurônios no cérebro, uma parte do processo de aprendizagem.
A condutância é controlada por um eletrólito que governa o movimento dos prótons. Quando mais prótons são empurrados para um canal no resistor, a condutância aumenta. Quando os prótons são removidos, a condutância diminui.
Processador em uma placa de circuito de computador
Um material inorgânico, o vidro fosfossilicato, torna o processador da equipe do MIT extremamente rápido porque contém poros do tamanho de nanômetros cujas superfícies fornecem os caminhos perfeitos para a difusão de proteínas. Como benefício adicional, o vidro pode funcionar à temperatura ambiente e não é danificado pelas proteínas à medida que se movem ao longo dos poros.
"Uma vez que você tenha um processador analógico, você não estará mais treinando redes nas quais todos os outros estão trabalhando", disse o autor principal e pós-doutorando do MIT Murat Onen, segundo um comunicado à imprensa. "Você estará treinando redes com complexidades sem precedentes que ninguém mais pode pagar e, portanto, superam amplamente todas elas. Em outras palavras, este não é um carro mais rápido, é uma espaçonave".
Falando em aceleração, o Aprendizado de Máquina (Machine Learning) agora está sendo usado em gerenciamento de aceleradores de partículas, pelo menos em forma experimental. No Lawrence Berkeley National Lab, duas equipes mostraram que a simulação baseada em ML da máquina completa e do feixe fornece uma previsão altamente precisa até 10 vezes melhor do que a análise estatística comum.
"Se você pode prever as propriedades do feixe com uma precisão que supera suas flutuações, você pode usar a previsão para aumentar o desempenho do acelerador", disse Daniele Filippetto, do laboratório. Não é pouca coisa simular toda a física e equipamentos envolvidos, mas surpreendentemente os esforços iniciais de várias equipes para fazê-lo produziram resultados promissores.
E no Oak Ridge National Lab, uma plataforma alimentada por IA está permitindo que eles façam tomografia computadorizada hiperespectral usando espalhamento de nêutrons, encontrando...talvez devêssemos deixá-los explicar.
No mundo médico, há uma nova aplicação de análise de imagem baseada em aprendizado de máquina no campo da neurologia, onde pesquisadores da University College London treinaram um modelo para detectar sinais precoces de lesões cerebrais causadoras de epilepsia.
Ressonâncias magnéticas de cérebros usadas para treinar o algoritmo UCL.
Uma causa frequente de epilepsia resistente a medicamentos é o que é conhecido como displasia cortical focal, uma região do cérebro que se desenvolveu de forma anormal, mas por qualquer motivo não parece obviamente anormal na ressonância magnética. Detectá-lo precocemente pode ser extremamente útil, então a equipe da UCL treinou um modelo de inspeção de ressonância magnética chamado Detecção de Lesão de Epilepsia Multicêntrico em milhares de exemplos de regiões cerebrais saudáveis e afetadas por FCD.
O modelo foi capaz de detectar dois terços dos FCDs mostrados, o que é realmente muito bom, pois os sinais são muito sutis. Na verdade, encontrou 178 casos em que os médicos não conseguiram localizar um FCD, mas conseguiram. Naturalmente, a palavra final vai para os especialistas, mas um computador insinuando que algo pode estar errado às vezes pode ser o suficiente para olhar mais de perto e obter um diagnóstico confiável.
"Nós colocamos ênfase na criação de um algoritmo de IA que fosse interpretável e pudesse ajudar os médicos a tomar decisões. Mostrar aos médicos como o algoritmo MELD fez suas previsões foi uma parte essencial desse processo", disse Mathilde Ripart, da UCL.
Artigos recomendados: IA e Tech
Fonte:https://finance.yahoo.com/news/perceptron-face-tracking-earables-analog-121511899.html
Nenhum comentário:
Postar um comentário