banner

Notícias

Nov 03, 2023

Método de aprendizado de máquina desenvolvido por pesquisadores da CMU ilumina aspectos fundamentais da evolução

Uma equipe de pesquisadores do Departamento de Biologia Computacional da Carnegie Mellon University (abre em uma nova janela) (CBD) desenvolveu novos métodos para identificar partes do genoma essenciais para entender como certas características das espécies evoluíram.

O trabalho, publicado na Science(abre em nova janela) e liderado pelo professor adjunto da Escola de Ciência da Computação Andreas Pfenning(abre em nova janela), contribui para o Projeto Zoonomia(abre em nova janela), um esforço para sequenciar todos os genomas de 240 mamíferos para lançar luz sobre aspectos fundamentais de genes e características com implicações importantes para proteger a saúde humana e conservar a biodiversidade. Entender esses novos e grandes conjuntos de dados requer o que há de mais moderno em tecnologia de inteligência artificial (IA) e aprendizado de máquina (ML).

Certas partes do genoma conhecidas como DNA codificador fornecem instruções para a produção de proteínas, os reguladores indispensáveis ​​da função celular. Com o tempo, surgem pequenas diferenças nas instruções que o DNA codificador fornece para a produção de proteínas, tornando-se uma das forças motrizes por trás da evolução.

No entanto, esses pedaços de DNA produtores de proteínas representam apenas um por cento dos três bilhões de pares de nucleotídeos que compõem o genoma humano. Outras regiões de DNA não codificantes, conhecidas como intensificadores, determinam quando e onde genes específicos estão ativos. A equipe da CMU criou uma abordagem de ML chamada Tissue-Aware Conservation Inference Toolkit (TACIT) para aprender mais sobre como essas áreas operam. Enquanto um modelo tradicional de evolução pode demonstrar mudanças no tamanho do cérebro de uma espécie por meio de um conjunto de mutações em um grupo de genes, os intensificadores podem simplesmente ativar ou desativar os genes e obter o mesmo resultado.

A maioria das pesquisas sobre a evolução dos mamíferos concentra-se nas partes do genoma que mudaram relativamente pouco ao longo de milhões de anos. Essas regiões conservadas, especialmente genes, fornecem informações sobre elementos fundamentais no DNA de mamíferos que destacam características únicas em espécies individuais.

O desafio para Pfenning e sua equipe é que, ao longo do tempo, as regiões intensificadoras de DNA podem mudar em sequência, mas não em função. Por exemplo, um intensificador de ilhotas bem estudado (abre em uma nova janela) regula os níveis de genes em padrões semelhantes em humanos, camundongos, peixes-zebra e esponjas, apesar de mais de 700 milhões de anos de evolução. Isso os torna muito mais difíceis de identificar e rastrear usando métodos tradicionais de exame de nucleotídeos individuais.

O TACIT enfrenta esse problema ao prever com precisão se um intensificador estará ativo em um determinado tipo de célula ou tecido. Ele permite que os cientistas identifiquem essas importantes regiões intensificadoras em um genoma recém-sequenciado sem conduzir um novo experimento de laboratório, oferecendo aplicações potenciais na biologia da conservação. O kit de ferramentas pode fazer previsões sobre como os intensificadores funcionam em espécies ameaçadas ou ameaçadas, onde experimentos de laboratório controlados são impossíveis.

“O TACIT oferece uma oportunidade sem precedentes para prever a função de partes do genoma fora dos genes em espécies das quais não podemos obter amostras primárias de tecido, como o golfinho-nariz-de-garrafa e o rinoceronte-negro criticamente ameaçado”, disse Irene Kaplow, principal autora do estudo. o papel e um associado de pós-doutorado e Lane Fellow em CBD. "À medida que os métodos de ML e os métodos para identificar intensificadores de tipos de células específicos melhoram, prevejo que seremos capazes de ampliar as funções do TACIT para fornecer novos tipos de insights sobre a evolução dos mamíferos".

Depois de prever a função das sequências genômicas nos 240 mamíferos, a equipe de pesquisa aplicou o TACIT para identificar as partes do genoma que evoluíram em mamíferos para cérebros maiores e descobriram que essas tendiam a estar perto de genes cujas mutações foram implicadas no cérebro humano. transtornos de tamanho. Eles também identificaram um potencializador associado ao comportamento social em mamíferos que é específico para um subtipo particular de neurônio, o interneurônio inibitório positivo da parvalbumina.

COMPARTILHAR