AdditiveClusterKDE: Um algoritmo para clusterização baseado no estimador de densidade kernel multivariado

Autores

  • Dirceu Scaldelai
  • Luiz Carlos Matioli
  • Solange Regina dos Santos

DOI:

https://doi.org/10.5540/03.2021.008.01.0350

Palavras-chave:

Estimador de Densidade Kernel, Clusterização, Otimização.

Resumo

Nesse artigo apresentamos um algoritmo para clusterização baseado na estimativa de densidade kernel multivariada. O algoritmo denominado AdditiveClusterKDE é centrado na múltipla otimização da função do Estimador de Densidade Kernel com kernel Gaussiano multivariado. O algoritmo proposto tem a vantagem de não exigir a priori o número de clusters, além disso, ele é simples, fácil de implementar, bem definido e para em um número finito de etapas, ou seja, sempre converge independentemente do conjunto de dados a ser agrupado. Implementamos o algoritmo no software R e fizemos experimentos numéricos com dados de problemas práticos obtidos na literatura e dados produzidos de forma sintética para uma melhor abrangência das potencialidades do algoritmo. Resultados preliminares indicam que o algoritmo AdditiveClusterKDE é competitivo quando comparado com os algoritmos K-means e PdfCluster.  

Downloads

Não há dados estatísticos.

Biografia do Autor

Dirceu Scaldelai

Depto. de Matemática/Unespar, Campo Mourão, PR

Luiz Carlos Matioli

Depto. de Matemática/UFPR, Curitiba, PR

Solange Regina dos Santos

Depto. de Matemática/Unespar, Campo Mourão, PR

Referências

Asuncion, A. e Newman, D. UCI machine learning repository, url: http://archive.ics.uci.edu/mr, University of Califórnia, Irvine, School of Information and Computer Sciences, 2007.

Azzalini, A., Menardi, G., Clustering via Nonparametric Density Estimation: The R Package pdfCluster. Journal of Statistical Software, 57(11): 1-26, 2014 (to appear), DOI: 10.18637/jss. v057.il 1.

Byrd, R.H., Lu, P., Nocedal,J., Zhu, C. A limited memory algorithm for bound constrained optimization, SI AM Journal on Scientific Computinq, 16(5): 1190-1208, 1995. DOI: 10.1137/0916069.

Gramacki, A. Nonparametric kernel density estimation and its computational aspects. Springer International Publishing, 2018, DOI: 10.1007/978-3-319-71688-6.

Kassambara, A. Practical Guide To Cluster Analysis in R:unsupervised machine learning, la. edição. STHDA, 2017, ISBN:978-1542462709.

Matioli, L. C., Santos, S. R., Kleina, M., Leite, E. A. A new algorithm for clustering based on kernel density estimation, Journal of Applied Statistics, 45(2): 347-366, 2017. DOI: 10.1080/02664763.2016.1277191.

Menardi, G. e Azzalini, A. An advancement in clustering via nonparametric density estimation, Statistics and Computing, 24(5):753-767, 2014. DOI 10.1007/sll222-013-9400-x.

R Core Team. R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing. Vienna, Áustria, 2019. Disponível em https:www.R-project.org/

Rousseeuw, P. J. Silhouettes: a graphical aid to the interpretation and validation of cluster analysis, Journal of computational and applied mathematics, 20: 53-65, 1987 (to appear), DOI: 10.1016/0377-0427(87)90125-7.

Scott, D.W. Multivariate density estimation: theory, practice, and visualization, 2a. edição. John Wiley & Sons. Rice University Houston, Texas, 2015, ISBN:978-0-471-69755-8.

Silverman, B.W. Density Estimation for Statistics and data Analysis, Chapman and Hall, London, New York, 1986, ISBN:0-412-24620-l.

Wand, M.P., Jones, M.C. Kernel smoothing, la. edição. Chapman and Hall/CRC, New York, 1995, ISBN:978-0-412-55270-0.

Downloads

Publicado

2021-12-20

Edição

Seção

Trabalhos Completos