Previsão de Produção de Açúcar no Estado de São Paulo Utilizando Aprendizado de Máquina

Análise de Interpretabilidade via Shapley Additive Explanations

Autores/as

  • Lucas A. B. Matos UNESP
  • Marilaine Colnago UNESP
  • Wallace Casaca UNESP

Resumen

O Brasil é o maior produtor mundial de cana-de-açúcar, e o estado de São Paulo se destaca nesse cenário, concentrando 50% da área cultivada e sendo responsável por 60% da produção nacional e 30% da produção global [1]. Dada a relevância desse setor para a economia e o mercado global, a utilização de modelos matemáticos e métodos computacionais torna-se essencial para a análise de dados, otimização de processos e suporte a decisões estratégicas, contribuindo para a eficiência e sustentabilidade da produção. Sendo assim, o presente trabalho tem como foco a análise de explicabilidade da previsão da produção de açúcar utilizando o algoritmo Random Forest (RF) e o método SHAP (SHapley Additive exPlanations) para interpretar o impacto de cada variável no modelo. Para a previsão, além das variáveis originais (produção de açúcar, cana-de-açúcar e etanol, períodos de safra, preço de revenda do açúcar e do etanol, preço do açúcar total recuperável (ATR) e valor do açúcar na bolsa de NY), aplicou-se engenharia de atributos para a criação de novas variáveis, bem como Random Search para otimização do modelo [3]. O conjunto de dados (mensais) foi dividido em 80% para treinamento e 20% para teste, abrangendo o período de 31/01/2012 a 31/03/2023. [...]

Descargas

Los datos de descargas todavía no están disponibles.

Citas

D. Chicco, M. J. Warrens e G. Jurman. “The coefficient of determination R-squared is more informative than SMAPE, MAE, MAPE, MSE and RMSE in regression analysis evaluation”. Em: Peerj computer science 7 (2021), e623. doi: 10.7717/peerj-cs.623.

T. Le et al. “Classification and explanation for intrusion detection system based on ensemble trees and SHAP method”. Em: Sensors 22.3 (2022), p. 1154. doi: 10.3390/s22031154.

M. Paula et al. “Predicting Energy Generation in Large Wind Farms: A Data-Driven Study with Open Data and Machine Learning”. Em: Inventions 8.5 (2023), p. 126. doi: 10.3390/inventions8050126.

Publicado

2026-02-13

Número

Sección

Resumos