Eletricidade e CRISPR usados ​​para gravar dados no DNA bacteriano

9

Nos últimos anos, os pesquisadores usaram DNA para codificar tudo, desde um sistema operacional para malware. Em vez de ser uma curiosidade tecnológica, esses esforços foram tentativas sérias de tirar proveito das propriedades do DNA para armazenamento de dados a longo prazo. O DNA pode permanecer quimicamente estável por centenas de milhares de anos e é improvável que percamos a tecnologia para lê-lo, algo que você não pode dizer sobre coisas como unidades ZIP e discos MO.

Mas, até agora, gravar dados no DNA envolveu converter os dados em uma sequência de bases em um computador e, em seguida, ordenar essa sequência de algum lugar que opera um sintetizador químico – as coisas vivas não entram realmente em cena. Mas, separadamente, um grupo de pesquisadores estava descobrindo como registrar eventos biológicos, modificando o DNA de uma célula, permitindo-lhes ler a história da célula. Um grupo da Universidade de Columbia descobriu agora como unir os dois esforços e gravar dados no DNA usando diferenças de voltagem aplicadas a bactérias vivas.

CRISPR e armazenamento de dados

O sistema CRISPR foi desenvolvido como uma forma de editar genes ou eliminá-los inteiramente do DNA. Mas o sistema chamou a atenção dos biólogos pela primeira vez porque inseriu novas sequências no DNA. Para todos os detalhes, veja nossa cobertura do Nobel, mas por enquanto, apenas saiba que parte do sistema CRISPR envolve a identificação de DNA de vírus e inserção de cópias dele no genoma bacteriano para reconhecê-lo caso o vírus apareça novamente.

O grupo de Columbia descobriu como usar isso para registrar memórias em bactérias. Digamos que você tenha um processo que ativa genes em resposta a uma substância química específica, como um açúcar. Os pesquisadores desviaram isso também para ativar um sistema que faz cópias de um pedaço circular de DNA chamado plasmídeo. Uma vez que o número de cópias era alto, eles ativaram o sistema CRISPR. Dadas as circunstâncias, era mais provável inserir uma cópia do DNA do plasmídeo no genoma. Quando o açúcar não estava presente, geralmente colocava outra coisa.

Usando esse sistema, foi possível dizer se uma bactéria foi exposta ao açúcar no passado. Não é perfeito, pois o sistema CRISPR nem sempre insere algo quando você deseja, mas funciona na média. Então, você só precisa sequenciar bactérias suficientes para descobrir a sequência média de eventos.

Para adaptar isso para armazenamento de dados, os pesquisadores usaram dois plasmídeos. Um é igual ao descrito acima: presente em níveis baixos quando um sinal específico está ausente e presente em níveis muito altos quando o sinal está próximo. O segundo está sempre presente em níveis moderados. Quando o CRISPR é ativado, ele tende a inserir sequências de qualquer plasmídeo que esteja presente em níveis mais elevados, conforme mostrado no diagrama abaixo.

À esquerda, sem qualquer sinal, o plasmídeo vermelho está presente em níveis baixos. Quando CRISPR é ativado, a sequência do plasmídeo azul tem maior probabilidade de ser inserida no genoma. À direita, quando o sinal está presente, há muito mais plasmídeo vermelho e, portanto, é mais provável que seja inserido no genoma. "Src =" https://cdn.arstechnica.net/wp-content/uploads/2021 /01/Memory-diagram-1.png "width =" 640 "height =" 457 "srcset =" https://cdn.arstechnica.net/wp-content/uploads/2021/01/Memory-diagram-1. png 2x
Prolongar / À esquerda, sem qualquer sinal, o plasmídeo vermelho está presente em níveis baixos. Quando CRISPR é ativado, a sequência do plasmídeo azul tem maior probabilidade de ser inserida no genoma. À direita, quando o sinal está presente, há muito mais plasmídeo vermelho e, portanto, é mais provável que seja inserido no genoma.

John Timmer

Por si só, ele armazena apenas um bit. Mas o processo pode ser repetido, criando um trecho de DNA que é uma série de inserções derivadas dos plasmídeos vermelho e azul, com a identidade sendo determinada pela presença ou não do sinal.

Dando um solavanco

É um sistema simples, mas muito distante dos tipos de coisas que normalmente associamos à produção de dados – a saída de uma leitura ou cálculo do sensor raramente é um açúcar ou antibiótico misturado com um monte de bactérias. Fazer com que as bactérias respondam a um sinal elétrico acabou sendo relativamente simples. E. coli é capaz de alterar a atividade dos genes dependendo se está em um ambiente químico oxidante ou redutor. E os pesquisadores poderiam alterar o ambiente aplicando diferenças de voltagem a um produto químico específico na cultura com a bactéria.

Mais especificamente, a diferença de voltagem alteraria o estado oxidativo de uma substância química chamada ferrocianeto. Isso, por sua vez, fez com que as bactérias alterassem a atividade dos genes. Ao projetar o plasmídeo para que respondesse ao mesmo sinal desses genes, os pesquisadores foram capazes de controlar os níveis do plasmídeo aplicando voltagens diferentes. E eles poderiam registrar esse nível desse plasmídeo ativando o sistema CRISPR nessas células.

É muito fácil ver como cada uma das inserções em uma série pode ser considerada zero ou um, dependendo da identidade da inserção. Mas lembre-se de que esse sistema não é perfeito; com bastante frequência, o CRISPR não inseria nada quando ativado, o que deslocaria todos os bits subsequentes. Como esse processo é aleatório, quanto mais longa a série de bits que você tenta codificar, mais provável será que pelo menos um deles acabe sendo pulado.

Para limitar esse problema, os pesquisadores mantiveram seus dados em três bits por população bacteriana. Mesmo assim, eles tiveram que treinar um algoritmo de aprendizado supervisionado para reconstruir a série de bits mais provável com base em uma média das sequências encontradas na população. E, mesmo com isso, o sistema falhou em reconhecer a série de bits em cerca de seis por cento das vezes. No final, eles decidiram usar um bit de paridade que era a soma dos dois primeiros para permitir a correção de erros e, em seguida, editaram várias populações em paralelo.

(Ao dar aos plasmídeos de cada população uma etiqueta de sequência única chamada "código de barras", foi possível misturar muitos deles em uma única população depois que os bits foram codificados e ainda desemaranhar tudo depois que o DNA foi sequenciado.)

Com tudo no lugar, eles armazenaram e leram "Olá, mundo!" Eles até colocaram a bactéria em algum solo de envasamento por uma semana e mostraram que foram capazes de recuperar a mensagem. (Armazená-los no freezer obviamente funciona melhor.) Eles estimam que a mensagem pode ser retida por pelo menos 80 gerações de bactérias.

Vamos ser claros: como meio de armazenamento, em sua forma atual, isso é terrível. Se você quisesse inserir alguns dados no DNA, seria muito melhor se o DNA fosse sintetizado quimicamente. Mas é intrigante pensar que poderíamos ir direto dos sinais elétricos para o DNA alterado, e pode haver algumas maneiras de melhorar o sistema agora que ele foi estabelecido.

Nature Chemical Biology, 2021. DOI: 10.1038 / s41589-020-00711-4 (Sobre DOIs)

Fonte: Ars Technica