AdditiveClusterKDE: Um algoritmo para clusterização baseado no estimador de densidade kernel multivariado

Dirceu Scaldelai, Luiz Carlos Matioli, Solange Regina dos Santos

Resumo


Nesse artigo apresentamos um algoritmo para clusterização baseado na estimativa de densidade kernel multivariada. O algoritmo denominado AdditiveClusterKDE é centrado na múltipla otimização da função do Estimador de Densidade Kernel com kernel Gaussiano multivariado. O algoritmo proposto tem a vantagem de não exigir a priori o número de clusters, além disso, ele é simples, fácil de implementar, bem definido e para em um número finito de etapas, ou seja, sempre converge independentemente do conjunto de dados a ser agrupado. Implementamos o algoritmo no software R e fizemos experimentos numéricos com dados de problemas práticos obtidos na literatura e dados produzidos de forma sintética para uma melhor abrangência das potencialidades do algoritmo. Resultados preliminares indicam que o algoritmo AdditiveClusterKDE é competitivo quando comparado com os algoritmos K-means e PdfCluster.  


Palavras-chave


Estimador de Densidade Kernel; Clusterização; Otimização.

Texto completo:

PDF

Referências


Asuncion, A. e Newman, D. UCI machine learning repository, url: http://archive.ics.uci.edu/mr, University of Califórnia, Irvine, School of Information and Computer Sciences, 2007.

Azzalini, A., Menardi, G., Clustering via Nonparametric Density Estimation: The R Package pdfCluster. Journal of Statistical Software, 57(11): 1-26, 2014 (to appear), DOI: 10.18637/jss. v057.il 1.

Byrd, R.H., Lu, P., Nocedal,J., Zhu, C. A limited memory algorithm for bound constrained optimization, SI AM Journal on Scientific Computinq, 16(5): 1190-1208, 1995. DOI: 10.1137/0916069.

Gramacki, A. Nonparametric kernel density estimation and its computational aspects. Springer International Publishing, 2018, DOI: 10.1007/978-3-319-71688-6.

Kassambara, A. Practical Guide To Cluster Analysis in R:unsupervised machine learning, la. edição. STHDA, 2017, ISBN:978-1542462709.

Matioli, L. C., Santos, S. R., Kleina, M., Leite, E. A. A new algorithm for clustering based on kernel density estimation, Journal of Applied Statistics, 45(2): 347-366, 2017. DOI: 10.1080/02664763.2016.1277191.

Menardi, G. e Azzalini, A. An advancement in clustering via nonparametric density estimation, Statistics and Computing, 24(5):753-767, 2014. DOI 10.1007/sll222-013-9400-x.

R Core Team. R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing. Vienna, Áustria, 2019. Disponível em https:www.R-project.org/

Rousseeuw, P. J. Silhouettes: a graphical aid to the interpretation and validation of cluster analysis, Journal of computational and applied mathematics, 20: 53-65, 1987 (to appear), DOI: 10.1016/0377-0427(87)90125-7.

Scott, D.W. Multivariate density estimation: theory, practice, and visualization, 2a. edição. John Wiley & Sons. Rice University Houston, Texas, 2015, ISBN:978-0-471-69755-8.

Silverman, B.W. Density Estimation for Statistics and data Analysis, Chapman and Hall, London, New York, 1986, ISBN:0-412-24620-l.

Wand, M.P., Jones, M.C. Kernel smoothing, la. edição. Chapman and Hall/CRC, New York, 1995, ISBN:978-0-412-55270-0.




DOI: https://doi.org/10.5540/03.2021.008.01.0350

Apontamentos

  • Não há apontamentos.


SBMAC - Sociedade de Matemática Aplicada e Computacional
Edifício Medical Center - Rua Maestro João Seppe, nº. 900, 16º. andar - Sala 163 | São Carlos/SP - CEP: 13561-120
 


Normas para publicação | Contato