Uma Nova Abordagem Baseada em PSO e Naive Bayes para Análise de Base de Dados Desbalanceada de Doença de Chagas
DOI:
https://doi.org/10.5540/03.2026.012.01.0347Palavras-chave:
Particle Swarm Optimization, Naive Bayes, Dados Desbalanceados, Doença de ChagasResumo
Este artigo propõe uma abordagem híbrida combinando Otimização por Enxame de Partículas (PSO) e Naive Bayes (NB) para melhorar a classificação de dados desbalanceados relacionados à sobrevida de pacientes com Doença de Chagas. O objetivo é otimizar a seleção de instâncias e variáveis, ajustando hiperparâmetros do NB para aumentar a acurácia e generalização do modelo. A metodologia emprega PSO na etapa de pré-processamento, seguida pela classificação com NB, avaliando desempenho por meio de métricas como Area Under the Receiver Operating Characteristic Curve (AUC-ROC), F1-Score e sensibilidade. Os resultados mostram que a abordagem PSO+NB supera métodos tradicionais, com melhorias estatisticamente significativas (p < 0,05) na classificação de casos minoritários. Os resultados evidenciam que a técnica proposta é eficaz para lidar com desbalanceamento de dados, oferecendo uma ferramenta promissora para auxiliar no diagnóstico em regiões com recursos limitados.
Downloads
Referências
P. Cao, D. Zhao e O. R. Zaïane. “A PSO-Based Cost-Sensitive Neural Network for Imbalanced Data Classification”. Em: Trends and Applications in Knowledge Discovery and Data Mining. PAKDD 2013. Vol. 7867. Lecture Notes in Computer Science. Springer, Berlin, Heidelberg, 2013, Cost–Sensitive Neural Network for Imbalanced Data Classification.
L. N. de Castro. Fundamentals of Natural Computing. 1ª ed. Boca Raton: Taylor & Francis Group, 2007.
M. Clerc e J. Kennedy. “The particle swarm-explosion, stability, and convergence in a multidimensional complex space”. Em: IEEE transactions on Evolutionary Computation 6.1 (2002), pp. 58–73.
T. Fawcett. “An introduction to ROC analysis”. Em: Pattern Recognition Letters 27.8 (2006). ROC Analysis in Pattern Recognition, pp. 861–874. issn: 0167-8655. doi: https://doi.org/10.1016/j.patrec.2005.10.010.
A. M. Ferreira et al. “Two-year death prediction models among patients with Chagas Disease using machine learning-based methods”. Em: PLoS Negl Trop 2 (2022). doi: 10.1371/journal.pntd.0010356.
N. K. Ghanad e S. Ahmadi. “Combination of PSO Algorithm and Naive Bayesian Classification for Parkinson Disease Diagnosis”. Em: Advances in Computer Science: An International Journal 4.4 (2015), pp. 119–125.
J. Kennedy e R. Eberhart. “Particle swarm optimization”. Em: Proceedings of the IEEE International Conference on Neural Networks (1995), pp. 1942–1948. doi: 10.1109/ICNN.1995.488968.
D. S. Moore, G. P. McCabe e B. A. Craig. Introduction to the Practice of Statistics. 7th. New York: W.H. Freeman e Company, 2012. isbn: 9781429240321.
R. E. Neapolitan. Learning Bayesian Networks. Pearson Prentice Hall, 2003.
M. C. P. Nunes et al. “Chagas cardiomyopathy: an update of current clinical knowledge and management: a scientific statement from the American Heart Association”. Em: Circulation 138.12 (2018), e169–e209.
C. C. R. Sady e A. L. P. Ribeiro. “Symbolic features and classification via support vector machine for predicting death in patients with Chagas disease”. Em: Computers in Biology and Medicine 70 (2016), pp. 220–227.
SaMi-Trop. Chagas disease dataset. Acesso em: 7 jul. 2024. 2022. url: http://journals.plos.org/plosntds/article/asset?unique&id=info:doi/10.1371/journal.pntd.0010356.s003.
Y. Shi e Eberhart. “Particle swarm optimization: developments, applications and resources”. Em: Proceedings of the 2001 congress on evolutionary computation (IEEE Cat. No. 01TH8546). Vol. 1. IEEE. 2001, pp. 81–86.
H. H. Tseng et al. “Machine Learning and Imaging Informatics in Oncology”. eng. Em: Oncology 98.6 (2020), pp. 344–362. issn: 0030-2414.
J. Waring, C. Lindvall e R. Umeton. “Automated machine learning: Review of the state-of the-art and opportunities for healthcare”. Em: Artificial Intelligence in Medicine 104 (2020), p. 101822.
J. Wiens e E. S. Shenoy. “Machine learning for healthcare: on the verge of a major shift in healthcare epidemiology”. Em: Clinical Infectious Diseases 66.1 (2018), pp. 149–153.
H. Zhang. “The optimality of naive Bayes”. Em: Proceedings of the Seventeenth International Florida Artificial Intelligence. 2004.