Home NATURALEZA A ferramenta de IA se ajusta ao viés ancestral em dados genéticos

A ferramenta de IA se ajusta ao viés ancestral em dados genéticos

6
0


A ascendência humana tem um impacto considerável na expressão gênica, mas conjuntos de dados genômicos para análise de doenças sub-representam severamente populações não européias, limitando assim o avanço da medicina de precisão. Em um papel em Comunicações da naturezaSmith et al. Introduzir uma ferramenta de aprendizado de máquina para mitigar os efeitos do viés ancestral em dados transcriptômicos.

A ferramenta, chamada Phyloframe, cria assinaturas de doenças com reconhecimento de ascendência, integrando dados genômicos da população com conjuntos de dados de treinamento menores e relevantes para doenças. O Phyloframe usa um modelo de regressão logística com penalidade de LASSO para obter um conjunto inicial de genes relevantes para a doença. Em seguida, usa dados genômicos da população para ajudar a compensar as mudanças de distribuição de dados causadas por diferenças de ascendência humana. Em resumo, o Phyloframe projeta a assinatura inicial da doença em uma rede de interação funcional, estendendo a rede para incluir o primeiro e o segundo vizinho de cada gene de assinatura. Esse novo conjunto é então filtrado por uma estatística definida como frequência de alelo aprimorada (EAF)-que captura o enriquecimento alélico específico da população em tecido saudável-para identificar genes ancestralmente diversos que interagem com a assinatura original. De cada ancestralidade, um subconjunto selecionado de genes com alta variabilidade de expressão de EAF e genes nos dados de treinamento é adicionado à assinatura do filoframe. A retirada do modelo com a inclusão forçada desses genes equitativos resulta em uma assinatura de doenças que generalizam para todas as populações, mesmo que não sejam representadas nos dados de treinamento.



Source link

LEAVE A REPLY

Please enter your comment!
Please enter your name here