Quando o genoma humano foi sequenciado há quase 20 anos, muitos pesquisadores estavam confiantes de que seriam capazes de localizar rapidamente os genes responsáveis ​​por doenças complexas como diabetes ou esquizofrenia. Mas eles pararam rapidamente, bloqueados em parte por sua ignorância do sistema de interruptores que governam onde e como os genes são expressos no corpo. Essa regulação gênica é o que diferencia uma célula do coração de uma célula do cérebro, por exemplo, e distingue os tumores do tecido saudável. Agora, um esforço massivo de uma década começou a preencher o quadro, ligando os níveis de atividade dos 20.000 genes humanos que codificam proteínas, conforme mostrado pelos níveis de seu RNA, a variações em milhões de trechos de DNA regulador.

Ao observar até 54 tipos de tecido em centenas de pessoas recentemente falecidas, o projeto de expressão de tecido genótipo (GTEx) de US $ 150 milhões se propôs a criar “um balcão único para a genética da regulação genética”, disse Emmanouil Dermitzakis, membro da equipe da GTEx , um geneticista da Universidade de Genebra. Em uma série de artigos na Science , Science Advances , Cell e outras revistas esta semana, os pesquisadores da GTEx lançaram as grandes análises finais desses dados gratuitos para download, bem como ferramentas para explorar ainda mais os dados.

“Este recurso é inestimável” para qualquer pessoa interessada em doenças específicas, ou estudo de tecidos ou tipos de células, diz Jan Korbel, geneticista humano no Laboratório Europeu de Biologia Molecular (EMBL), Heidelberg. “É um tesouro público”, disse Jun Li, geneticista da Universidade de Michigan, em Ann Arbor.

Mas a complexa análise principal mostra como podem ser complicadas as interconexões entre os genes e seu DNA regulador. Os artigos “são escritos em burocracia” e os resultados anunciados são difíceis de decifrar, diz Dan Graur, biólogo evolucionista da Universidade de Houston e conhecido crítico da grande ciência. E como outros críticos, ele observa que o projeto, com 85% doadores brancos, carece de diversidade e, portanto, perderá variação genética em outros grupos.

O GTEx ainda não consegue identificar as sequências responsáveis ​​por doenças como doenças cardíacas e insuficiência renal, ou traçar como as camadas de regulação gênica funcionam juntas. “Não devemos fazer as malas e dizer que a expressão do gene está resolvida”, disse o genomicista Ewan Birney, vice-diretor geral do EMBL, que liderou outro grande projeto genômico chamado ENCODE.

Depois que o GTEx foi lançado em 2010, famílias de mais de 900 pessoas falecidas que já haviam doado seus órgãos ou tecidos para transplantes concordaram que os pesquisadores também poderiam colher amostras dos tecidos saudáveis ​​de seus entes queridos, por exemplo, cérebro, músculo, gordura, pâncreas e coração . Ter vários tecidos do mesmo assunto deu aos pesquisadores a confiança de que a variação na expressão gênica entre, digamos, o músculo e o pâncreas, era real e significativa. “Pela primeira vez, temos esse conjunto homogêneo para que possamos chegar às diferenças biológicas entre os tecidos”, diz Barbara Stranger, membro do GTEx, geneticista da Northwestern University.

Os pesquisadores descreveram cada amostra e, em seguida, fotografaram e congelaram todos os tecidos para análise futura. Eles decifraram genomas e quantificaram o RNA para medir a atividade genética. Além de comparar tecidos dentro de uma pessoa, eles também podem comparar o mesmo tecido em indivíduos diferentes. Eles foram capazes de vincular variações no DNA aos níveis de expressão gênica usando análises estatísticas para encontrar padrões de mudança correlacionados. O coração do banco de dados GTEx é uma compilação das relações complexas entre trechos de DNA regulatório chamados loci de traços quantitativos de expressão, ou eQTLs, e os genes que eles regulam.

Uma fase piloto, concluída em 2015, examinou nove tecidos em profundidade e demonstrou que as  amostras de cadáveres eram substitutos razoáveis ​​para o tecido vivo , diz o co-líder da GTEx, Tuuli Lappalainen, geneticista humano do New York Genome Center. Agora, depois de analisar quase 20.000 amostras, o GTEx “atingiu um tamanho em que podemos obter insights muito mais claros e nítidos”, diz a co-líder Kristin Ardlie, geneticista humana do Broad Institute. Ela e seus colegas descobriram que quase todos os genes humanos são regulados por pelo menos um eQTL, muitos dos quais têm como alvo vários genes e presumivelmente afetam várias características.

Stranger descobriu outro resultado importante: quase todos os tecidos, incluindo, por exemplo, pele e coração, mostraram diferenças na expressão gênica entre homens e mulheres. “A grande maioria da biologia é compartilhada por homens e mulheres”, diz Stranger, mas as diferenças de expressão podem ajudar a explicar por que homens e mulheres têm diferentes padrões de doença ou reações a drogas. “Considero essa uma descoberta importante”, diz Korbel.

Da mesma forma, o co-líder da Broad, François Aguet, e seus colegas confirmaram que certos eQTLs estendem seu alcance a genes distantes, mesmo aqueles em outros cromossomos. A GTEx documentou 143 desses elementos “trans”, alguns dos quais afetam vários genes em todo o genoma.

Kelly Frazer, da Universidade da Califórnia, em San Diego, já está usando os dados para ajudar a entender os chamados estudos de associação do genoma (GWAS), que representam grandes mistérios. Em um GWAS, grandes consórcios olham para os genomas de milhares de pacientes com uma doença ou característica específica e observam centenas de mudanças genéticas sutis, muitas vezes fora dos próprios genes. Mas os pesquisadores muitas vezes não têm ideia de  qual desses muitos suspeitos desencadeia a doença ou molda o traço.

Por exemplo, estudos de GWAS identificaram mais de 500 variações genéticas que pareciam afetar o ritmo cardíaco e a condutância elétrica. Frazer queria saber como um fator de transcrição específico para o coração chamado NKX2-5 influenciava essas características. Sua equipe identificou milhares de variações de DNA que podem afetar a atividade do NKX2-5 e, portanto, talvez alterar o ritmo cardíaco.

Paola Benaglio, do laboratório de Frazer, analisou e comparou essas variações de DNA, dados GWAS e dados GTEx para identificar quais variações de DNA realmente regulam a atividade de NKX2-5. Ela conseguiu primeiro estreitar os eQTLs candidatos para 55, depois para nove e, finalmente, usando dados GWAS sobre ritmos cardíacos e outras ferramentas, ela se concentrou em uma única base variável no cromossomo 1. Em seguida, ela bloqueou essa base de DNA usando o genoma editor CRISPR e confirmou que altera a ligação NKX2-5, Benaglio, Frazer e seus colegas relataram no ano passado na  Nature Genetics .

“Tenho certeza de que há centenas de pessoas como eu” que apreciam o banco de dados, diz Frazer. As estatísticas a comprovam. Mensalmente, 16.000 pessoas visitam o portal GTEx, e outras examinam os dados em outros sites. Em 2018, 900 jornais o citaram. Birney entende o entusiasmo, mas adverte que podem surgir correlações espúrias entre eQLTs e genes. Aproximar-se de uma variante causadora de doenças via GTEx “não é um golpe certeiro”.

Graur, por sua vez, permanece cético de que a atividade do gene em cadáveres reflita adequadamente o que está acontecendo nos vivos, apesar dos dados da equipe sobre a preservação da expressão do gene. “É como estudar o comportamento de acasalamento de um animal atropelado”, diz ele.

Com o término do projeto, os Institutos Nacionais de Saúde dos EUA estão planejando um GTEx de desenvolvimento que matriculará pessoas com menos de 20 anos para criar um atlas de expressão gênica desde o nascimento até a idade adulta. Em tais esforços de acompanhamento, um conjunto mais diversificado de doadores de tecido “seria muito valioso”, diz Korbel. O GTEx inicialmente atirou para esse objetivo, mas vacilou porque os tecidos e órgãos doadores são desproporcionalmente brancos. Os pesquisadores precisam “se comunicar com mais eficácia”, diz Laura Siminoff, uma cientista social da Temple University que foi financiada desde o início para examinar a ética GTEx. “Caso contrário, estaremos fazendo esta ciência para os brancos.”

Os resultados até agora não podem contar a história completa de como o genoma dá origem a uma miríade de tecidos e doenças do ser humano. Ainda assim, Birney prevê, “o GTEx será usado e reutilizado continuamente, e haverá alguns usos que não posso prever”.