Identificação e classificação de dígitos manuscritos com auxílio de PCA
Palabras clave:
PCA, reconhecimento de dígitos manuscritos, redução de dimensionalidade, aprendizado de máquinaResumen
O reconhecimento de dígitos manuscritos é um desafio crucial na visão computacional, com aplicações importantes em serviços postais e processamento de documentos. Este relatório propõe uma abordagem usando Análise de Componentes Principais (PCA) para extrair características essenciais das imagens de dígitos, visando aprimorar a eficiência e precisão dos modelos de aprendizado de máquina. O conjunto de dados analisado inclui 5620 imagens de dígitos manuscritos, cada uma em 8×8 pixels em tons de cinza, utilizadas para avaliar algoritmos de reconhecimento. As imagens foram linearizadas para facilitar o processamento dos dados e a aplicação de técnicas analíticas. O PCA é então aplicado para identificar componentes principais descorrelacionadas, ordenadas por sua contribuição para a variância total, reduzindo a dimensionalidade e preservando a informação das características. Portanto, com a redução da quantidade de dados, preservando a informação, auxilia no desempenho de modelos de aprendizado de máquina.
Descargas
Citas
I. T. Jolliffe. Principal component analysis for special types of data. Springer, 2002.
S. K. Joshi e S. Machchhar. “An evolution and evaluation of dimensionality reduction techniques—A comparative study”. Em: 2014 IEEE International Conference on Computational Intelligence and Computing Research. IEEE. 2014, pp. 1–5.
J. VanderPlas. Python data science handbook: Essential tools for working with data. O’Reilly Media, Inc., 2016.