Os modelos de fundação alavancaram diversos perfis de expressão gênica para tarefas como anotação do tipo de célula ou previsão da resposta à perturbação. No entanto, ainda não existe modelo para demonstrar como o cenário da cromatina regula a transcrição. Escrevendo NaturezaLu et al. Introduzir o transformador de expressão geral (GET), um modelo de fundação treinado em dados de acessibilidade da cromatina de diversos tipos de células humanas e usá -lo para prever a atividade gênica em células específicas.
O modelo GET foi pré-criado usando dados de acessibilidade de cromatina única de células de 213 tipos de células humanas e subsequentemente ajustadas em cromatina emparelhada e dados de sequenciamento de RNA, permitindo que ele aprenda como regiões e recursos interagem entre si em diversos tipos de células. Nos eritroblastos fetais, seja identificado de longo alcance cis-elementos reguladores e seus fatores de transcrição associados que foram perdidos por modelos anteriores. Os pesquisadores também construíram o catálogo GET GET Publicamente, que combina sequências reguladoras previstas e informações da estrutura de proteínas do alphafold2 para prever interações diretas ou indiretas do fator de transcrição. Eles usam o catálogo para identificar como a interação PAX5 específica para linfócitos e receptores nucleares pode ser aprimorada por uma mutação específica da linha germinativa PAX5 associada ao aumento do risco de leucemia linfoblástica aguda de células B.