Mostrando postagens classificadas por relevância para a consulta fala. Ordenar por data Mostrar todas as postagens
Mostrando postagens classificadas por relevância para a consulta fala. Ordenar por data Mostrar todas as postagens

16 de jun. de 2023

O Voicebox AI da Meta é um Dall-E para conversão de texto em fala




EDT, 16/06/2023 



Por Andrew Tarantola 



Mas a empresa não compartilhará o aplicativo ou seu código-fonte por enquanto.

Hoje, estamos um passo mais perto do futuro de (uma) celebridade imortal que há muito nos foi prometido (desde abril). A Meta revelou o Voicebox, seu modelo generativo de conversão de texto em fala que promete fazer pela palavra falada o que ChatGPT e Dall-E, respeitosamente, fizeram pela geração de texto e imagem. 

22 de mai. de 2023

A IA de fala de código aberto da Meta reconhece mais de 4.000 idiomas falados




EDT, 22/05/2023 



Por Will Shanklin 



Ela também pode produzir conversão de texto em fala em mais de 1.100 idiomas.

A Meta criou um modelo de linguagem de IA que (em uma mudança de ritmo refrescante) não é um clone do ChatGPT. O projeto Massively Multilingual Speech (MMS) da empresa pode reconhecer mais de 4.000 idiomas falados e produzir fala (text-to-speech) em mais de 1.100. Como a maioria de seus outros projetos de IA anunciados publicamente, a Meta está abrindo o MMS hoje para ajudar a preservar a diversidade linguística e incentivar os pesquisadores a construir sobre sua fundação. "Hoje, estamos compartilhando publicamente nossos modelos e código para que outros na comunidade de pesquisa possam desenvolver nosso trabalho", escreveu a empresa. "Através deste trabalho, esperamos fazer uma pequena contribuição para preservar a incrível diversidade linguística do mundo."

1 de mai. de 2024

A análise de voz por IA fornece aos trabalhadores das linhas de prevenção ao suicídio um painel emocional




NA, 01/05/2024 



Por Paul McClure 



Um modelo de IA rastreia com precisão emoções como medo e preocupação nas vozes dos atendentes de linhas de crise, de acordo com uma nova pesquisa. O desenvolvedor do modelo espera que ele possa fornecer assistência em tempo real aos operadores de telefone enquanto trabalham para prevenir suicídios.

A triagem dos operadores das linhas de crise ou suicídio quanto ao seu nível atual de risco de suicídio é crucial para detectar e prevenir o suicídio.

27 de set. de 2022

A interface cérebro-computador "não invasiva" da Meta prevê o que você está ouvindo




AI, 27/09/2022 



Por Sirisha 



“Para alguns, as interfaces cérebro-computador podem ser a chave para restaurar a comunicação”

A Inteligência Artificial, sem dúvida, é uma campeã dos desfavorecidos e deficientes. Se os muitos casos de uso médico não forem suficientes, aqui está mais um para você. Recentemente, a Meta anunciou um aplicativo de interface cérebro-computador para escrever palavras na tela para pessoas com deficiência auditiva. Interface cérebro-computador do Meta que pode interpretar ondas cerebrais por meio de sua tecnologia não invasiva começou a se desenvolver em 2017 e foi descrito como um experimento para digitar mais de 100 palavras por minuto sem precisar digitar manualmente as palavras ou usar serviços de transcrição de fala para texto. Conforme relatado pelo TechCrunch, o experimento começou com uma pergunta: “E se você pudesse digitar diretamente do seu cérebro?” Agora está em um momento interessante de estender essa tecnologia para decifrar os sons que se ouve. Jean-Remi King, cientista pesquisador da Meta falando à TIME, disse: “Há uma série de coisas ruins que podem roubar a capacidade de falar de alguém – mas para alguns, as interfaces cérebro-computador podem ser a chave para restaurar a comunicação”.

28 de ago. de 2023

Avanços na IA, chips impulsionam o reconhecimento de voz

Chip AI analógico de 14 nm na mão do pesquisador



TX, 28/08/2023 



Por Peter Grad 



Desenvolvimentos separados em tecnologia de reconhecimento de fala da IBM, e das universidades da Califórnia em São Francisco e Berkeley, oferecem notícias promissoras para pacientes que sofrem de paralisia vocal e perda de fala.

A IBM relatou a criação de um chip de computador mais rápido e com maior eficiência energética, capaz de turbinar a saída do modelo de reconhecimento de voz.

4 de ago. de 2023

Humanos não distinguem bem deepfake de voz com a fala humana




CT, 03/08/2023 



Por Fidel Farato 



A chegada da Inteligência Artificial (IA) generativa acelerou e melhorou os resultados de muitas ferramentas de criação, como as usadas na geração de áudios falsos. O problema é que, aparentemente, as pessoas têm pouca capacidade em distinguir o que é um deepfake de voz e uma fala humana verdadeira, segundo estudo publicado na revista científica PLoS ONE.

No experimento, os pesquisadores do University College London (UCL), na Inglaterra, testaram a capacidade de 529 pessoas em identificar o que era uma voz real e o que era um deepfake sonoro. Em mais de um quarto dos casos (27%), os voluntários se confundiram entre o que era real e inventado pelo algoritmo da IA. Os áudios estavam em inglês ou em mandarim.

24 de ago. de 2023

Uma startup de IA agora pode gerar fala usando sua voz em 30 idiomas





Decrypt, 23/08/2023 



Por José Antonio Lanz 



Quer saber como você soaria falando outro idioma – sem sotaque? Descubra com o novo gerador de fala do ElevenLab.

A corrida armamentista da IA ​​continua a acelerar, com novas fronteiras na clonagem de voz surgindo quase diariamente. O desenvolvimento mais recente vem da startup ElevenLabs, com sede em São Francisco, que acaba de anunciar que seu novo modelo de IA agora pode imitar vozes falando fluentemente em 30 idiomas diferentes – uma expansão dramática dos oito originais que eram suportados anteriormente.

12 de out. de 2022

A nova IA do Google pode ouvir um trecho de música e continuar tocando




MITTR, 07/10/2022 



Por Tammy Xu 



A técnica, chamada AudioLM, gera sons naturalistas sem a necessidade de anotação humana.

Um novo sistema de IA pode criar fala e música com som natural após ser solicitado com alguns segundos de áudio.

O AudioLM, desenvolvido por pesquisadores do Google, gera áudio que se encaixa no estilo do prompt, incluindo sons complexos como música de piano ou pessoas falando, de uma forma quase indistinguível da gravação original. A técnica mostra-se promissora para acelerar o processo de treinamento da IA ​​para gerar áudio e, eventualmente, pode ser usada para gerar automaticamente músicas para acompanhar vídeos.

Um Joe Rogan gerado por IA conversa com Steve Jobs sobre seu uso de LSD: áudio deepfake




GM, 11/10/2022 



Por Kyle Barr 



O Podcast.ai gerou uma gravação de áudio falsa usando vozes artificiais e transcrições de modelos de linguagem com base nos antigos discursos públicos e palestras de Rogan e Jobs.

É “Spooky Season”, então faz sentido que estaríamos vendo, ou pelo menos ouvindo, alguns famosos da tecnologia voltando dos mortos. Steve Jobs muitas vezes sentimos que ainda tem os dois pés fora da cova pela frequência com que o empresário de tecnologia é trazido (a vida) em conversas por pessoas dentro e fora da empresa que ele co-fundou. No entanto, um podcast recém-lançado hospedado por uma versão falsa de Joe Rogan tenta trazer a voz de Jobs de volta com… resultados interessantes.

20 de jan. de 2023

O futuro da voz da IA ​​está aqui: a nova IA tem fala sintética emocionalmente inteligente




ZMSC, 20/01/2023 



Por Rupendra Brahambhatt 



Esta IA sabe como soar como você ou qualquer outra pessoa.

Os lançamentos de IA do ano passado nos dão uma ideia de que não são os empregos de baixa qualificação que a IA procura. Se você é um artista, definitivamente deveria se preocupar – especialmente se você é um dublador. Um artigo de pesquisa publicado recentemente pela Microsoft revela detalhes sobre o VALL-E, um modelo de IA que pode reproduzir a voz de qualquer pessoa a partir de uma amostra de voz de apenas três segundos.

8 de nov. de 2023

Implante usa sinais cerebrais para decodificar o que as pessoas estão tentando dizer




NA, 07/11/2023 



Por Paul McClure 



Os pesquisadores desenvolveram um sensor de alta resolução que registra sinais cerebrais para decodificar o que as pessoas estão tentando dizer. Embora ainda seja cedo, o dispositivo pode fornecer às pessoas que perderam a fala devido a doenças neurodegenerativas a capacidade de se comunicar.

Perder a capacidade de se comunicar pode ser um efeito secundário de doenças neurodegenerativas debilitantes como a esclerose lateral amiotrófica (ELA), onde a função cognitiva é preservada, mas os músculos que controlam a fala tornam-se fracos e tensos. Uma solução para restaurar a comunicação é decodificar sinais diretamente do córtex motor do cérebro, o que desencadeia movimentos musculares em uma ordem específica para produzir sons diferentes.

22 de out. de 2024

Cientistas descobrem a razão pela qual pessoas com esquizofrenia ouvem vozes — e talvez como interrompê-las




ZMSC, 21/10/2024 



Por Tibi Puiu 



A incapacidade do cérebro de reconhecer sua própria fala pode explicar as vozes fantasmas da esquizofrenia.

Para aqueles que vivem com esquizofrenia, o som de vozes — vozes que ninguém mais pode ouvir — pode ser uma parte avassaladora e persistente da vida diária. Mas o mistério de por que essas alucinações acontecem tem perplexado os cientistas por décadas. Agora, os pesquisadores acreditam que podem estar mais perto de resolver esse enigma.

14 de set. de 2022

Estamos entrando na era da tecnologia de voz antiética: IA e deepfake vocal




SI, 13/09/2022 



Por Sue Poremba 



Em 2019, o Google lançou um banco de dados sintético de fala com um objetivo muito específico: interromper deepfakes de áudio. 

Atores maliciosos podem sintetizar a fala para tentar enganar os sistemas de autenticação de voz”, relatou o blog da Google News Initiative na época. “Talvez igualmente preocupante, a conscientização pública de 'deep fakes' (áudio ou videoclipes gerados por modelos de deep learning) pode ser explorada para manipular a confiança na mídia.”

15 de mai. de 2024

Desvendando o Controverso Esforço do Canadá para Policiar o Mundo Digital




RTN, 15/05/2024 



Por Didi Rankovic 



O mais recente dos esforços legislativos do Canadá para restringir a liberdade de expressão, a Lei de Danos Online (Projeto de Lei C-63), foi introduzido e promovido no início do ano pelo Primeiro-Ministro Justin Trudeau como necessário principalmente para proteger crianças e categorias de populações vulneráveis na internet.

O texto real do projeto, no entanto, revela amplas implicações, incluindo censura abrangente e penalidades draconianas, à medida que mais um país empurra tais medidas sob o lema de "pensar nas crianças".

E aqui, a mensagem foi “enfeitada” com as primeiras garantias de Trudeau de que o projeto de lei seria focado nos objetivos declarados.

12 de mai. de 2022

China encara OTAN como ameaça e teme que expansão do bloco chegue as suas fronteiras




HM, 12/05/2022 



Por Barbara Martinelli 



A guerra na Ucrânia levou a divisões mais claras do mundo e a China mostra de que lado está a cada dia que passa. Assim como a Rússia, Pequim também culpa a OTAN pelo conflito, o Ministérios das Relações Exteriores da China acusou a aliança militar ocidental de ter colocado a Rússia “contra a parede” ao aceitar 14 novos membros desde o fim da Guerra Fria, incluindo países que fazem fronteira com a nação eslava. Já a OTAN se defende denunciando a China por sua pretensão de “minar a ordem global”, no que diz respeito a segurança, o que levou ao anúncio em abril, feito pelo norueguês Jens Stoltenberg, secretário-geral da organização, que a China será incluída na estratégia de defesa da aliança e que “a sua crescente influência e políticas coercitivas afetam nossa segurança”.

12 de nov. de 2022

Como a IA conversacional pode remover informações confidenciais das chamadas do contact center




VB, 10/11/2022 



Por Sean Michael Kerner 



Todos os dias, as pessoas ligam para os centros de contato do cliente e fornecem informações confidenciais, como números de cartão de crédito, aos agentes por voz. Agora, uma solução conversacional de inteligência artificial (IA) usando recursos de compreensão de linguagem natural oferece uma maneira de remover essas informações das chamadas, enquanto ainda transmite dados para transações. 

Isso é importante porque lidar com qualquer tipo de informação de identificação pessoal (PII) inevitavelmente envolve uma série de conformidade com os regulamentos de segurança e privacidade que podem variar de acordo com a jurisdição. Há também um risco não trivial de que informações confidenciais possam ser vazadas ou roubadas. De fato, existem incidentes conhecidos em que as informações de cartão de crédito fornecidas por voz foram anotadas por agentes mal-intencionados, levando a resultados indesejáveis.

16 de ago. de 2023

IA recria clipe de música do Pink Floyd a partir de gravações de atividade cerebral






NS, 15/08/2023 



Por Carissa Wong 



Uma inteligência artificial pode adivinhar como uma música soa com base em padrões de atividade cerebral gravados enquanto as pessoas a ouvem

Uma inteligência artificial criou um cover aceitável de uma música do Pink Floyd analisando a atividade cerebral gravada enquanto as pessoas ouviam o original. As descobertas ampliam nossa compreensão de como percebemos o som e podem, eventualmente, melhorar os dispositivos para pessoas com dificuldades de fala.

29 de fev. de 2024

Novo sistema de IA da Alibaba, 'EMO', cria vídeos realistas de fala e canto a partir de fotos




VB, 28/02/2024 



Por Michael Nuñez 



Pesquisadores do Instituto de Computação Inteligente da Alibaba desenvolveram um novo sistema de inteligência artificial chamado "EMO", abreviação de Emote Portrait Alive, que pode animar uma única foto de retrato e gerar vídeos da pessoa falando ou cantando de maneira incrivelmente realista.

O sistema, descrito em um artigo de pesquisa publicado no arXiv, é capaz de criar movimentos faciais fluidos e expressivos e poses de cabeça que correspondem de perto aos nuances de uma faixa de áudio fornecida. Isso representa um avanço significativo na geração de vídeos de cabeças falantes impulsionada por áudio, uma área que desafiou os pesquisadores de IA por anos.

26 de set. de 2024

ONU Pressiona por Controle Global com Novo Pacto: IDs Digitais, Censura e Vigilância no Centro




RTN, 24/09/2024 



Por Didi Rankovic 



A Cúpula do Futuro da Organização das Nações Unidas (ONU) de 2024, realizada antes da Assembleia Geral da ONU deste ano, revelou que a organização mundial está se movendo em direção à adição de mais iniciativas ao seu atual e futuro “portfólio de assalto ao poder”.

Desta vez, é o Pacto para o Futuro (com o Compacto Digital Global como um anexo), que acaba de ser adotado.

O principal componente desse esquema é o documento de “resultado orientado para a ação”, sendo o outro um acordo internacional, e a implementação de ambos, impulsionada pela ONU, deve começar após a cúpula.

10 de abr. de 2024

Chefe da Inteligência Alemã Defende Monitoramento de Fala e Pensamento




RTN, 09/04/2024 



Por Didi Rankovic 



Thomas Haldenwang defende seus esforços para policiar os "padrões de pensamento e fala" dos cidadãos, afirmando que até mesmo "expressões de opinião" legais podem ser alvo de vigilância.

O chefe da agência de espionagem doméstica da Alemanha, Thomas Haldenwang, escreveu um artigo de opinião para um jornal alemão e forneceu algumas ideias sobre como ele entende a liberdade de expressão e, mais importante, seus limites.

Haldenwang, que está à frente do Escritório Federal para a Proteção da Constituição (BfV), defendeu no artigo publicado pelo Frankfurter Allgemeine Zeitung sua política de vigilância dos cidadãos, que inclui monitorar "padrões de pensamento e fala".

Related Posts Plugin for WordPress, Blogger...