Como a inteligência artificial pode ajudar a identificar o risco de óbito de recém-nascidos

Alexandre Chiavegatto Filho e André Filipe de Moraes Batista

Paper

Predição de mortalidade neonatal com dados rotineiramente coletados: uma abordagem de machine learning

Neonatal Mortality Prediction With Routinely Collected Data: a Machine Learning Approach

autores

André Filipe de Moraes Batista, Carmen Diniz, Eliana Bonilha, Ichiro Kawachi e Alexandre Chiavegatto Filho

Área e sub-área

Saúde pública, Inteligência artificial

Publicado em

BMC Pediatrics, em 21/07/2021

Link para o original

A recente diminuição na mortalidade neonatal foi mais lenta do que o esperado para a maioria dos países. Considerando esse cenário, vem crescendo o interesse por estratégias para mitigar esse problema. Esta pesquisa, publicada na BMC Pediatrics, testou a eficácia de algoritmos de machine learning para identificar o risco de óbito entre recém-nascidos.

Os pesquisadores treinaram cinco algoritmos diferentes para avaliar as probabilidades de óbito. Os resultados se mostraram hábeis em identificar, com desempenho preditivo muito alto, o risco de mortalidade neonatal no município de São Paulo.

A qual pergunta a pesquisa responde?

É possível identificar o risco de óbito de recém-nascidos da cidade de São Paulo utilizando inteligência artificial?

Por que isso é relevante?

A identificação desse risco abre a possibilidade de que sejam feitas medidas preventivas específicas para que esses óbitos não ocorram.

Resumo da pesquisa

As recentes diminuições na mortalidade neonatal foram mais lentas do que o esperado para a maioria dos países. O estudo teve como objetivo predizer o risco de mortalidade neonatal utilizando apenas dados rotineiramente disponíveis de registros de nascimento na maior cidade das Américas.

Foi realizado um relacionamento probabilístico de todos os registros de nascimento ocorridos no município de São Paulo, Brasil, entre 2012 e 2017 com os registros de óbitos de 2012 a 2018 (1.202.843 nascimentos e 447.687 óbitos), sendo identificado um total de 7.282 óbitos neonatais (a mortalidade neonatal de 6,46 por 1.000 nascidos vivos). Nascimentos de 2012 e 2016 (N = 941.308; ou 83,44% do total) foram usados para treinar cinco algoritmos de machine learning diferentes, enquanto os nascimentos ocorridos em 2017 (N = 186.854; ou 16,56% do total) foram usados para testar o desempenho desses algoritmos em novos dados não vistos.

O melhor desempenho foi obtido pelo algoritmo Extreme Gradient Boosting Trees (XGBoost), com uma AUC muito alta de 0,97 e F1-score de 0,55 (sendo essas métricas que indicam a qualidade de um algoritmo de inteligência artificial). Os 5% de nascimentos com maior risco previsto de morte neonatal incluíram mais de 90% das mortes neonatais reais. Por outro lado, não houve óbitos entre os 5% de nascimentos com o menor risco previsto.

Algoritmos de machine learning foram capazes de identificar com desempenho preditivo muito alto o risco de mortalidade neonatal de recém-nascidos usando apenas dados coletados rotineiramente.

Quais foram as conclusões?

A identificação de recém-nascidos com alto risco de mortalidade pode ser o primeiro passo para a adoção de intervenções direcionadas para prevenir sua ocorrência. Nosso estudo mostra que algoritmos populares de machine learning são capazes de identificar o risco de mortalidade neonatal de recém-nascidos com um desempenho preditivo muito alto usando apenas dados coletados rotineiramente na cidade de São Paulo.

Quem deveria conhecer os seus resultados?

Profissionais da área da saúde e gestores públicos de saúde.

Referências

do Nascimento, CF ; dos Santos, H. G. ; Batista, A. F. M. ; Lay, A. A. R. ; Duarte, Y.A.O. ; Chiavegatto Filho, A.D.P. . Cause-specific mortality prediction in older residents of São Paulo, Brazil: a machine learning approach. Age and Ageing, v. 1, p. 1-, 2021.

Fernandes, FT ; Oliveira, T. A. ; Teixeira, C. E. ; Batista, A. F. M. ; Dalla Costa, G. ; Chiavegatto Filho, A.D.P. . A multipurpose machine learning approach to predict Covid-19 negative prognosis in São Paulo, Brazil. Scientific Reports, v. 11, p. 1-, 2021.

Chiavegatto Filho, A.D.P. ; dos Santos, H. G. ; do Nascimento, CF ; Massa, K.H.C. ; Kawachi, I. . Overachieving municipalities in public health: a machine learning approach. Epidemiology, v. 1, p. 1-, 2018.

Alexandre Chiavegatto Filho possui graduação em economia pela USP (Universidade de São Paulo), doutorado em saúde pública pela USP e pós-doutorado na Universidade de Harvard. É professor livre docente da Faculdade de Saúde Pública da USP e diretor do Labdaps (Laboratório de Big Data e Análise Preditiva em Saúde) da FSP/USP.

André Filipe de Moraes Batista é doutor em engenharia da computação pela USP, com graduação e mestrado em ciência da computação com ênfase em inteligência artificial. É professor de ciência de dados no Insper-SP (Instituto de Ensino e Pesquisa).

Parceiros

AfroBiotaBPBESBrazil LAB Princeton UniversityCátedra Josuê de CastroCENERGIA/COPPE/UFRJCEM - Cepid/FAPESPCPTEClimate Policy InitiativeMudanças Climáticas FAPESPGEMAADRCLAS - HarvardIEPSJ-PalLAUTMacroAmb