Explorando Redes Neurais para Previsão Epidemiológica
Desempenho da CNN-1D, RNN e MLP
Abstract
A inteligência artificial (IA) consiste atualmente em um grande campo de pesquisa com possibilidades de aplicações em diversas áreas, incluindo a predição do comportamento de séries temporais [1]. A necessidade deste tipo de predições durante a recente pandemia de Covid-19, mostrou a importância de tais ferramentas para crises epidemiológicas, até mesmo para colaborar com a tomada de decisões em relação a distanciamento e isolamento social. Com o intuito de validar e compreender o alcance de algumas redes neurais na predição de séries temporais em cenários epidemiológicos, foram treinadas três redes com uma mesma série temporal de casos novos de Covid-19: uma MLP (Multilayer Perceptron), uma RNN (Recurrent Neural Network) e uma CNN-1D (Convolution Neural Network-1D) para previsão de novos casos. As redes MLP, RNN e CNN possuem arquiteturas diferentes, o que interfere em seu treinamento e portanto, no resultado obtido. A MLP é uma das redes mais básicas, totalmente conectada, porém não captura depências temporais. Já a RNN utiliza conexões recorrentes armazenar informações de estados anteriores e capturar padrões temporais, mas sua capacidade de aprendizado pode ser limitada devido ao desaparecimento do gradiente, mesmo em séries temporais não muito longas, sendo uma rede eficiente em capturar padrões locais. Por fim, a CNN - 1D aplica convoluções sobre a sequência de dados, permitindo a extração eficiente de padrões temporais ao longo da série. Diferente das RNNs, que processam as informações de maneira sequencial, a CNN-1D consegue identificar dependências em diferentes escalas temporais simultaneamente [1] [2]. O conjunto de dados utilizado no estudo corresponde à série temporal de casos novos é na região metropolitana da cidade do Rio de Janeiro - RJ, do período compreendido entre 3 de março de 2020 e 9 de setembro de 2022. Os dados com os quais trabalhamos estão disponíveis em [3]. Para o experimento, a série temporal foi subdividida em 70% para treinamento, 15% para teste e 15% para a validação, sendo as métricas usadas para a análise do desempenho o MSE (Mean Square Error - Erro Quadrático Médio), a RMSE (Root Mean Square Error - Raiz do Erro Quadrático Médio) e o MAE (Mean absolut Error - Erro Absoluto Médio). Como a previsão desta série temporal consiste basicamente em capturar seu comportamento sequencial como esperávamos, a CNN teve o melhor desempenho, uma vez que é uma rede estruturada basicamente para este fim e, se trata de uma rede eficiente na captura de padrões de curto prazo. Os achados deste estudo reforçam a importância de escolher abordagens adequadas ao problema em questão, demonstrando que a CNN-1D é uma alternativa eficiente para a previsão de séries temporais epidemiológicas. Trabalhos futuros podem explorar variantes dessas redes, como LSTM (Long Short-Term Memory) e CNNs híbridas, além de testar abordagens baseadas em transformers, que vêm apresentando resultados promissores na modelagem de sequências.
Downloads
References
I. Goodfellow, Y. Bengio e A. Courville. Deep learning. 1a. ed. Cambridge, MA, USA: MIT press, 2017. isbn: 9780262035613.
D. Hussain, Tahir H., A. A. Khan, S. A. A. Naqvi e A. Jamil. “A deep learning approach for hydrological time-series prediction: A case study of Gilgit river basin”. Em: Earth Science Informatics 13 (2020), pp. 915–927. doi: 10.1007/s12145-020-00477-2.
Superintendência de Vigilância em Saúde. Painel Rio Covid-19. Online. Acessado em 01/07/2023, http://coronavirus.rio/painel.