PHYS, 24/11/2023
Por Allessandra DiCorato
Os bancos de dados de sequências microbianas contêm uma riqueza de informações sobre enzimas e outras moléculas que poderiam ser adaptadas para a biotecnologia. Mas esses bancos de dados cresceram tanto nos últimos anos que se tornou difícil pesquisar eficientemente enzimas de interesse.
Agora, cientistas do Broad Institute do MIT e de Harvard, do McGovern Institute for Brain Research do MIT e do National Center for Biotechnology Information (NCBI) dos National Institutes of Health desenvolveram um novo algoritmo de busca que identificou 188 tipos de novos sistemas CRISPR raros em genomas bacterianos, abrangendo milhares de sistemas individuais. O trabalho surgiu na Science.
O algoritmo, que vem do laboratório do pioneiro do CRISPR, Feng Zhang, usa abordagens de agrupamento de big data para pesquisar rapidamente grandes quantidades de dados genômicos. A equipe usou seu algoritmo, chamado Fast Locality-Sensitive Hashing-based clustering (FLSHclust), para extrair três grandes bancos de dados públicos que contêm dados de uma ampla gama de bactérias incomuns, incluindo aquelas encontradas em minas de carvão, cervejarias, lagos antárticos e saliva de cachorro.
Os cientistas descobriram um número e uma diversidade surpreendentes de sistemas CRISPR, incluindo alguns que podem fazer edições no DNA de células humanas, outros que podem ter como alvo o RNA e muitos com uma variedade de outras funções.
Os novos sistemas poderiam ser potencialmente aproveitados para editar células de mamíferos com menos efeitos fora do alvo do que os atuais sistemas Cas9. Eles também poderão um dia ser usados como diagnóstico ou servir como registros moleculares de atividade dentro das células.
Os investigadores dizem que a sua pesquisa destaca um nível sem precedentes de diversidade e flexibilidade do CRISPR, e que provavelmente ainda existem muitos mais sistemas raros a serem descobertos à medida que as bases de dados continuam a crescer.
“A biodiversidade é um tesouro e, à medida que continuamos a sequenciar mais genomas e amostras metagenómicas, há uma necessidade crescente de ferramentas melhores, como o FLSHclust, para pesquisar esse espaço de sequência para encontrar as gemas moleculares”, disse Zhang, co-autor sênior do estudo e membro principal do instituto Broad.
Zhang também é pesquisador do Instituto McGovern de Pesquisa do Cérebro do MIT, junto com o Professor James e Patricia Poitras de Neurociências do MIT, com nomeações conjuntas nos departamentos de Ciências do Cérebro e Cognitivas e Engenharia Biológica, e pesquisador do Howard Hughes Medical Institute. Eugene Koonin, um distinto investigador do NCBI, também é co-autor sênior do estudo.
Procurando por CRISPR
CRISPR, que significa Clustered Regularly Interspaced Short Palindromic Repeats, é um sistema de defesa bacteriana que foi desenvolvido em muitas ferramentas para edição e diagnóstico de genoma.
Para extrair bancos de dados de sequências de proteínas e ácidos nucleicos para novos sistemas CRISPR, os pesquisadores desenvolveram um algoritmo baseado em uma abordagem emprestada da comunidade de big data. Essa técnica, chamada hashing sensível à localidade, agrupa objetos que são semelhantes, mas não exatamente idênticos.
A utilização desta abordagem permitiu à equipe investigar milhares de milhões de sequências de proteínas e ADN – do NCBI, da sua base de dados Whole Genome Shotgun e do Joint Genome Institute – em semanas, enquanto os métodos anteriores que procuravam objetos idênticos teriam levado meses. Eles projetaram seu algoritmo para procurar genes associados ao CRISPR.
“Este novo algoritmo permite-nos analisar dados num período de tempo suficientemente curto para que possamos realmente recuperar resultados e fazer hipóteses biológicas”, disse Soumya Kannan, co-autor do estudo. Kannan era estudante de graduação no laboratório de Zhang quando o estudo começou e atualmente é pesquisador de pós-doutorado, e membro júnior na Universidade de Harvard. Han Altae-Tran, estudante de pós-graduação no laboratório de Zhang durante o estudo e atualmente pesquisador de pós-doutorado na Universidade de Washington, foi o outro co-autor do estudo.
“Esta é uma prova do que você pode fazer quando melhora os métodos de exploração e usa o máximo de dados possível”, disse Altae-Tran. "É realmente emocionante poder melhorar a escala em que pesquisamos."
Novos sistemas
Em sua análise, Altae-Tran, Kannan e seus colegas notaram que os milhares de sistemas CRISPR que encontraram se enquadravam em algumas categorias existentes e em muitas categorias novas. Eles estudaram vários dos novos sistemas com mais detalhes no laboratório.
Eles encontraram várias novas variantes de sistemas CRISPR Tipo I conhecidos, que usam um RNA guia com 32 pares de bases de comprimento, em vez do guia de 20 nucleotídeos do Cas9. Devido aos seus RNAs-guia mais longos, esses sistemas Tipo I poderiam ser potencialmente usados para desenvolver uma tecnologia de edição genética mais precisa e menos propensa à edição fora do alvo.
A equipe de Zhang mostrou que dois desses sistemas poderiam fazer pequenas edições no DNA das células humanas. E como esses sistemas Tipo I são semelhantes em tamanho ao CRISPR-Cas9, eles provavelmente poderiam ser entregues a células de animais ou humanos usando as mesmas tecnologias de entrega de genes usadas hoje para CRISPR.
Um dos sistemas Tipo I também mostrou “atividade colateral” – ampla degradação de ácidos nucleicos após a proteína CRISPR se ligar ao seu alvo. Os cientistas usaram sistemas semelhantes para fazer diagnósticos de doenças infecciosas, como o SHERLOCK, uma ferramenta capaz de detectar rapidamente uma única molécula de DNA ou RNA. A equipe de Zhang acredita que os novos sistemas também poderiam ser adaptados para tecnologias de diagnóstico.
Os pesquisadores também descobriram novos mecanismos de ação para alguns sistemas CRISPR Tipo IV e um sistema Tipo VII que visa precisamente o RNA, que poderia ser potencialmente usado na edição de RNA. Outros sistemas poderiam ser potencialmente utilizados como ferramentas de registro – um documento molecular de quando um gene foi expresso – ou como sensores de atividade específica numa célula viva.
Dados de mineração
Os cientistas dizem que seu algoritmo poderia ajudar na busca por outros sistemas bioquímicos. “Este algoritmo de busca pode ser usado por qualquer pessoa que queira trabalhar com esses grandes bancos de dados para estudar como as proteínas evoluem, ou para descobrir novos genes”, disse Altae-Tran.
Os pesquisadores acrescentam que suas descobertas ilustram não apenas o quão diversos são os sistemas CRISPR, mas também que a maioria é rara e encontrada apenas em bactérias incomuns.
“Alguns destes sistemas microbianos foram encontrados exclusivamente na água das minas de carvão”, disse Kannan. “Se alguém não estivesse interessado nisso, talvez nunca tivéssemos visto esses sistemas. Ampliar a nossa diversidade de amostragem é muito importante para continuar a expandir a diversidade do que podemos descobrir.”
Artigos recomendados: CRISPR e Biotech
Fonte:https://phys.org/news/2023-11-algorithm-reveals-kinds-crispr.html
Nenhum comentário:
Postar um comentário