Correio Paulista: Resultados da pesquisa fala

Mostrando postagens classificadas por relevância para a consulta fala. Ordenar por data Mostrar todas as postagens

16 de jun. de 2023

O Voicebox AI da Meta é um Dall-E para conversão de texto em fala

EDT, 16/06/2023

Mas a empresa não compartilhará o aplicativo ou seu código-fonte por enquanto.

Hoje, estamos um passo mais perto do futuro de (uma) celebridade imortal que há muito nos foi prometido (desde abril). A Meta revelou o Voicebox, seu modelo generativo de conversão de texto em fala que promete fazer pela palavra falada o que ChatGPT e Dall-E, respeitosamente, fizeram pela geração de texto e imagem.

Um Implante Cerebral Acaba de Transformar os Pensamentos de uma Mulher em Fala em Tempo Quase Real

ZMSCE, 01/04/2025

Por Tibi Puiu

Essa tecnologia restaura a fala em tempo real para pessoas que não podem falar, utilizando apenas sinais cerebrais.

Em um hospital na Califórnia, uma mulher que não falava há quase duas décadas articulou silenciosamente as palavras: "Por que ele te disse isso?" Momentos depois, uma voz sintética — treinada a partir de um único clipe gravado antes de um AVC roubar sua fala — reproduziu as palavras em voz alta.

As palavras não foram digitadas nem escolhidas em um menu. Elas vieram diretamente de seu cérebro.

A IA de fala de código aberto da Meta reconhece mais de 4.000 idiomas falados

EDT, 22/05/2023

Por Will Shanklin

Ela também pode produzir conversão de texto em fala em mais de 1.100 idiomas.

A Meta criou um modelo de linguagem de IA que (em uma mudança de ritmo refrescante) não é um clone do ChatGPT. O projeto Massively Multilingual Speech (MMS) da empresa pode reconhecer mais de 4.000 idiomas falados e produzir fala (text-to-speech) em mais de 1.100. Como a maioria de seus outros projetos de IA anunciados publicamente, a Meta está abrindo o MMS hoje para ajudar a preservar a diversidade linguística e incentivar os pesquisadores a construir sobre sua fundação. "Hoje, estamos compartilhando publicamente nossos modelos e código para que outros na comunidade de pesquisa possam desenvolver nosso trabalho", escreveu a empresa. "Através deste trabalho, esperamos fazer uma pequena contribuição para preservar a incrível diversidade linguística do mundo."

Dispositivo Vestível Assistido por IA ‘Fala’ Para Pessoas com Cordas Vocais Disfuncionais

ZMSCE, 28/03/2025

Por Alexandra Gerea

A fonoaudiologia é uma área da ciência médica focada na mecânica da produção da voz, além da avaliação, tratamento e prevenção de distúrbios de comunicação. Agora, tecnologias assistidas por inteligência artificial (IA) fazem parte das opções de tratamento para condições que afetam a fala, como a gagueira ou a incapacidade de controlar certos músculos após um derrame.

Engenheiros biomédicos da UCLA desenvolveram um dispositivo que traduz os movimentos dos músculos da laringe em fala com incrível precisão. Este pequeno dispositivo não invasivo oferece uma alternativa promissora para pessoas com distúrbios vocais, permitindo uma comunicação eficaz durante a recuperação.

A análise de voz por IA fornece aos trabalhadores das linhas de prevenção ao suicídio um painel emocional

NA, 01/05/2024

Por Paul McClure

Um modelo de IA rastreia com precisão emoções como medo e preocupação nas vozes dos atendentes de linhas de crise, de acordo com uma nova pesquisa. O desenvolvedor do modelo espera que ele possa fornecer assistência em tempo real aos operadores de telefone enquanto trabalham para prevenir suicídios.

A triagem dos operadores das linhas de crise ou suicídio quanto ao seu nível atual de risco de suicídio é crucial para detectar e prevenir o suicídio.

A interface cérebro-computador "não invasiva" da Meta prevê o que você está ouvindo

AI, 27/09/2022

Por Sirisha

“Para alguns, as interfaces cérebro-computador podem ser a chave para restaurar a comunicação”

A Inteligência Artificial, sem dúvida, é uma campeã dos desfavorecidos e deficientes. Se os muitos casos de uso médico não forem suficientes, aqui está mais um para você. Recentemente, a Meta anunciou um aplicativo de interface cérebro-computador para escrever palavras na tela para pessoas com deficiência auditiva. Interface cérebro-computador do Meta que pode interpretar ondas cerebrais por meio de sua tecnologia não invasiva começou a se desenvolver em 2017 e foi descrito como um experimento para digitar mais de 100 palavras por minuto sem precisar digitar manualmente as palavras ou usar serviços de transcrição de fala para texto. Conforme relatado pelo TechCrunch, o experimento começou com uma pergunta: “E se você pudesse digitar diretamente do seu cérebro?” Agora está em um momento interessante de estender essa tecnologia para decifrar os sons que se ouve. Jean-Remi King, cientista pesquisador da Meta falando à TIME, disse: “Há uma série de coisas ruins que podem roubar a capacidade de falar de alguém – mas para alguns, as interfaces cérebro-computador podem ser a chave para restaurar a comunicação”.

Avanços na IA, chips impulsionam o reconhecimento de voz

Chip AI analógico de 14 nm na mão do pesquisador

TX, 28/08/2023

Por Peter Grad

Desenvolvimentos separados em tecnologia de reconhecimento de fala da IBM, e das universidades da Califórnia em São Francisco e Berkeley, oferecem notícias promissoras para pacientes que sofrem de paralisia vocal e perda de fala.

A IBM relatou a criação de um chip de computador mais rápido e com maior eficiência energética, capaz de turbinar a saída do modelo de reconhecimento de voz.

Humanos não distinguem bem deepfake de voz com a fala humana

CT, 03/08/2023

Por Fidel Farato

A chegada da Inteligência Artificial (IA) generativa acelerou e melhorou os resultados de muitas ferramentas de criação, como as usadas na geração de áudios falsos. O problema é que, aparentemente, as pessoas têm pouca capacidade em distinguir o que é um deepfake de voz e uma fala humana verdadeira, segundo estudo publicado na revista científica PLoS ONE.

No experimento, os pesquisadores do University College London (UCL), na Inglaterra, testaram a capacidade de 529 pessoas em identificar o que era uma voz real e o que era um deepfake sonoro. Em mais de um quarto dos casos (27%), os voluntários se confundiram entre o que era real e inventado pelo algoritmo da IA. Os áudios estavam em inglês ou em mandarim.

Uma startup de IA agora pode gerar fala usando sua voz em 30 idiomas

Decrypt, 23/08/2023

Por José Antonio Lanz

Quer saber como você soaria falando outro idioma – sem sotaque? Descubra com o novo gerador de fala do ElevenLab.

A corrida armamentista da IA continua a acelerar, com novas fronteiras na clonagem de voz surgindo quase diariamente. O desenvolvimento mais recente vem da startup ElevenLabs, com sede em São Francisco, que acaba de anunciar que seu novo modelo de IA agora pode imitar vozes falando fluentemente em 30 idiomas diferentes – uma expansão dramática dos oito originais que eram suportados anteriormente.

A nova IA do Google pode ouvir um trecho de música e continuar tocando

MITTR, 07/10/2022

Por Tammy Xu

A técnica, chamada AudioLM, gera sons naturalistas sem a necessidade de anotação humana.

Um novo sistema de IA pode criar fala e música com som natural após ser solicitado com alguns segundos de áudio.

O AudioLM, desenvolvido por pesquisadores do Google, gera áudio que se encaixa no estilo do prompt, incluindo sons complexos como música de piano ou pessoas falando, de uma forma quase indistinguível da gravação original. A técnica mostra-se promissora para acelerar o processo de treinamento da IA para gerar áudio e, eventualmente, pode ser usada para gerar automaticamente músicas para acompanhar vídeos.

GM, 11/10/2022

Por Kyle Barr

O Podcast.ai gerou uma gravação de áudio falsa usando vozes artificiais e transcrições de modelos de linguagem com base nos antigos discursos públicos e palestras de Rogan e Jobs.

É “Spooky Season”, então faz sentido que estaríamos vendo, ou pelo menos ouvindo, alguns famosos da tecnologia voltando dos mortos. Steve Jobs muitas vezes sentimos que ainda tem os dois pés fora da cova pela frequência com que o empresário de tecnologia é trazido (a vida) em conversas por pessoas dentro e fora da empresa que ele co-fundou. No entanto, um podcast recém-lançado hospedado por uma versão falsa de Joe Rogan tenta trazer a voz de Jobs de volta com… resultados interessantes.

O futuro da voz da IA está aqui: a nova IA tem fala sintética emocionalmente inteligente

ZMSC, 20/01/2023

Por Rupendra Brahambhatt

Esta IA sabe como soar como você ou qualquer outra pessoa.

Os lançamentos de IA do ano passado nos dão uma ideia de que não são os empregos de baixa qualificação que a IA procura. Se você é um artista, definitivamente deveria se preocupar – especialmente se você é um dublador. Um artigo de pesquisa publicado recentemente pela Microsoft revela detalhes sobre o VALL-E, um modelo de IA que pode reproduzir a voz de qualquer pessoa a partir de uma amostra de voz de apenas três segundos.

Implante usa sinais cerebrais para decodificar o que as pessoas estão tentando dizer

NA, 07/11/2023

Por Paul McClure

Os pesquisadores desenvolveram um sensor de alta resolução que registra sinais cerebrais para decodificar o que as pessoas estão tentando dizer. Embora ainda seja cedo, o dispositivo pode fornecer às pessoas que perderam a fala devido a doenças neurodegenerativas a capacidade de se comunicar.

Perder a capacidade de se comunicar pode ser um efeito secundário de doenças neurodegenerativas debilitantes como a esclerose lateral amiotrófica (ELA), onde a função cognitiva é preservada, mas os músculos que controlam a fala tornam-se fracos e tensos. Uma solução para restaurar a comunicação é decodificar sinais diretamente do córtex motor do cérebro, o que desencadeia movimentos musculares em uma ordem específica para produzir sons diferentes.

Cientistas descobrem a razão pela qual pessoas com esquizofrenia ouvem vozes — e talvez como interrompê-las

ZMSC, 21/10/2024

Por Tibi Puiu

A incapacidade do cérebro de reconhecer sua própria fala pode explicar as vozes fantasmas da esquizofrenia.

Para aqueles que vivem com esquizofrenia, o som de vozes — vozes que ninguém mais pode ouvir — pode ser uma parte avassaladora e persistente da vida diária. Mas o mistério de por que essas alucinações acontecem tem perplexado os cientistas por décadas. Agora, os pesquisadores acreditam que podem estar mais perto de resolver esse enigma.

Estamos entrando na era da tecnologia de voz antiética: IA e deepfake vocal

SI, 13/09/2022

Por Sue Poremba

Em 2019, o Google lançou um banco de dados sintético de fala com um objetivo muito específico: interromper deepfakes de áudio.

“Atores maliciosos podem sintetizar a fala para tentar enganar os sistemas de autenticação de voz”, relatou o blog da Google News Initiative na época. “Talvez igualmente preocupante, a conscientização pública de 'deep fakes' (áudio ou videoclipes gerados por modelos de deep learning) pode ser explorada para manipular a confiança na mídia.”

Desvendando o Controverso Esforço do Canadá para Policiar o Mundo Digital

RTN, 15/05/2024

Por Didi Rankovic

O mais recente dos esforços legislativos do Canadá para restringir a liberdade de expressão, a Lei de Danos Online (Projeto de Lei C-63), foi introduzido e promovido no início do ano pelo Primeiro-Ministro Justin Trudeau como necessário principalmente para proteger crianças e categorias de populações vulneráveis na internet.

O texto real do projeto, no entanto, revela amplas implicações, incluindo censura abrangente e penalidades draconianas, à medida que mais um país empurra tais medidas sob o lema de "pensar nas crianças".

E aqui, a mensagem foi “enfeitada” com as primeiras garantias de Trudeau de que o projeto de lei seria focado nos objetivos declarados.

China encara OTAN como ameaça e teme que expansão do bloco chegue as suas fronteiras

HM, 12/05/2022

Por Barbara Martinelli

A guerra na Ucrânia levou a divisões mais claras do mundo e a China mostra de que lado está a cada dia que passa. Assim como a Rússia, Pequim também culpa a OTAN pelo conflito, o Ministérios das Relações Exteriores da China acusou a aliança militar ocidental de ter colocado a Rússia “contra a parede” ao aceitar 14 novos membros desde o fim da Guerra Fria, incluindo países que fazem fronteira com a nação eslava. Já a OTAN se defende denunciando a China por sua pretensão de “minar a ordem global”, no que diz respeito a segurança, o que levou ao anúncio em abril, feito pelo norueguês Jens Stoltenberg, secretário-geral da organização, que a China será incluída na estratégia de defesa da aliança e que “a sua crescente influência e políticas coercitivas afetam nossa segurança”.

Como a IA conversacional pode remover informações confidenciais das chamadas do contact center

VB, 10/11/2022

Por Sean Michael Kerner

Todos os dias, as pessoas ligam para os centros de contato do cliente e fornecem informações confidenciais, como números de cartão de crédito, aos agentes por voz. Agora, uma solução conversacional de inteligência artificial (IA) usando recursos de compreensão de linguagem natural oferece uma maneira de remover essas informações das chamadas, enquanto ainda transmite dados para transações.

Isso é importante porque lidar com qualquer tipo de informação de identificação pessoal (PII) inevitavelmente envolve uma série de conformidade com os regulamentos de segurança e privacidade que podem variar de acordo com a jurisdição. Há também um risco não trivial de que informações confidenciais possam ser vazadas ou roubadas. De fato, existem incidentes conhecidos em que as informações de cartão de crédito fornecidas por voz foram anotadas por agentes mal-intencionados, levando a resultados indesejáveis.

IA recria clipe de música do Pink Floyd a partir de gravações de atividade cerebral

NS, 15/08/2023

Por Carissa Wong

Uma inteligência artificial pode adivinhar como uma música soa com base em padrões de atividade cerebral gravados enquanto as pessoas a ouvem

Uma inteligência artificial criou um cover aceitável de uma música do Pink Floyd analisando a atividade cerebral gravada enquanto as pessoas ouviam o original. As descobertas ampliam nossa compreensão de como percebemos o som e podem, eventualmente, melhorar os dispositivos para pessoas com dificuldades de fala.

Novo sistema de IA da Alibaba, 'EMO', cria vídeos realistas de fala e canto a partir de fotos

VB, 28/02/2024

Por Michael Nuñez

Pesquisadores do Instituto de Computação Inteligente da Alibaba desenvolveram um novo sistema de inteligência artificial chamado "EMO", abreviação de Emote Portrait Alive, que pode animar uma única foto de retrato e gerar vídeos da pessoa falando ou cantando de maneira incrivelmente realista.

O sistema, descrito em um artigo de pesquisa publicado no arXiv, é capaz de criar movimentos faciais fluidos e expressivos e poses de cabeça que correspondem de perto aos nuances de uma faixa de áudio fornecida. Isso representa um avanço significativo na geração de vídeos de cabeças falantes impulsionada por áudio, uma área que desafiou os pesquisadores de IA por anos.

Páginas

16 de jun. de 2023

2 de abr. de 2025

22 de mai. de 2023

30 de mar. de 2025

1 de mai. de 2024

27 de set. de 2022

28 de ago. de 2023

4 de ago. de 2023

24 de ago. de 2023

12 de out. de 2022

20 de jan. de 2023

8 de nov. de 2023

22 de out. de 2024

14 de set. de 2022

15 de mai. de 2024

12 de mai. de 2022

12 de nov. de 2022

16 de ago. de 2023

29 de fev. de 2024

Inscrever-se

Publicações recentes