0081/2025 - Dynamic Evaluation of a COVID-19 Death Prediction Model Using Extreme Gradient Boosting Predictive Model
Modelo preditivo de avaliação dinâmica de morte por COVID-19 usando Extreme Gradient Boosting
Autor:
• José Carlos Prado Junior - Prado Junior, J.C - <jcpradojr@gmail.com>ORCID: orcid.org/0000-0002-8438-0527
Coautor(es):
• Alexandre Evsukoff - Evsukoff, A - <evsukoff@gmail.com>ORCID: orcid.org/0000-0002-7828-0124
• Roberto de Andrade Medronho - Medronho, R.A - <medronho@medicina.ufrj.br>
ORCID: https://orcid.org/0000-0003-4073-3930
Resumo:
Background: Coronavirus disease 2019 (COVID-19), which emerged in December 2019, has become a significant global public health issue. The COVID-19 pandemic has evolved dynamically with the emergence of new variants and increasing of vaccination coverage. Given the high fatality rate of severe COVID-19, disease severity prediction models must incorporate these temporal variations. In this study, we aimed to develop a model to predict COVID-19 mortality in hospitalized patients.Methods: Extreme Gradient Boost model was used to predict COVID-19 mortality upon hospital admission, and the results were correlated with laboratory test results, vaccination status, comorbidities, and clinical signs and symptoms at the time of admission. Clinical dataelectronic medical records, vaccination databases, and severe acute respiratory syndrome notifications were used.
Results: The XGBoost model performed best, with an area under the curve (AUC) of 96,4% at epidemiological week 53 of 2020. The most significant variables for the model were body temperature, blood pressure, respiratory rate, heart rate, urea, magnesium, sodium and C reactive protein levels.
Conclusions: Our study identified key clinical and laboratory variables for predicting COVID-19 mortality. Additionally, we demonstrated how the performance of the models varied throughout the pandemic.
Palavras-chave:
Predictive modeling, COVID-19, Mortality, Machine learning, XGBoost algorithmAbstract:
Contexto: A doença coronavírus 2019 (COVID-19), que surgiu em dezembro de 2019, tornou-se um problema significativo de saúde pública global. A pandemia de COVID-19 evoluiu de forma dinâmica com o surgimento de novas variantes e o aumento da cobertura vacinal. Dada a alta taxa de mortalidade da COVID-19 grave, os modelos de previsão de gravidade da doença precisam incorporar essas variações temporais. Este estudo teve como objetivo desenvolver um modelo para prever a mortalidade por COVID-19 em pacientes hospitalizados.Métodos: O modelo Extreme Gradient Boost (XGBoost) foi utilizado para prever a mortalidade por COVID-19 na admissão hospitalar, e os resultados foram correlacionados com os resultados de exames laboratoriais, status vacinal, comorbidades e sinais e sintomas clínicos no momento da admissão. Dados clínicos de prontuários eletrônicos, bancos de dados de vacinação e notificações de síndrome respiratória aguda grave foram utilizados.
Resultados: O modelo XGBoost obteve o melhor desempenho, com uma área sob a curva (AUC) de 96,4% na semana epidemiológica 53 de 2020. As variáveis mais significativas para o modelo foram temperatura corporal, pressão arterial, taxa respiratória, frequência cardíaca, ureia, magnésio, níveis de sódio e proteína C reativa.
Conclusões: Nosso estudo identificou variáveis clínicas e laboratoriais chave para a previsão de mortalidade por COVID-19. Além disso, demonstramos como o desempenho dos modelos variou ao longo da pandemia










