An Effective VNS Algorithm for k-Medoids Clustering Problem



k-medoids clustering, VNS, mathematical programming


This paper proposes an algorithm based on VNS metaheuristcs for k-medoids clustering, which is a NP-hard optimization problem. The VNS algorithm was applied in fifty data bases (instances) with small, medium, and large sizes, considering the number of clusters between 2 and 7. The obtained results from these experiments show the effectiveness of this approach, comparing it with nine other related clustering algorithms and an optimization formulation. Furthermore, we found that our algorithm obtained the optimal solutions for the vast majority of the cases.


Author Biographies

Jose Andre de Moura Brito, Escola Nacional de Ciências Estatísticas

tem bacharelado em Matemática pela Universidade Federal do Rio de Janeiro (1997), Mestrado em Engenharia de Sistemas e Computação (Otimização) pela Universidade Federal do Rio de Janeiro (1999), Doutorado em Engenharia de Sistemas e Computação (Otimização) pela Universidade Federal do Rio de Janeiro (2004) e Pós-Doutorado em Otimização na UFF (2008).

Gustavo Silva Semaan, Universidade Federal Fluminense

Professor da Universidade Federal Fluminense (UFF) desde 2014. Técnico em Informática pela Universidade Federal de Juiz de Fora (CTU-UFJF) em 2001. Bacharel em Sistemas de Informação pelo Granbery (2006). Mestre (2010) e Doutor (2013) pelo Instituto de Computação (IC) da UFF. Pós-Doutorado em Otimização no Laboratório de Inteligência Computacional (LabIC-IC-UFF) em 2019. Atua no Magistério Superior desde 2008 e com Tecnologia da Informação desde 1999.

Augusto Cesar Fadel , Instituto Brasileiro de Geografia e Estatística

é bacharel em Estatística pela Escola Nacional de Ciências Estatísticas (ENCE) e tem mestrado em Ciência da Computação pela Universidade Federal Fluminense (UFF). Atua como estatístico no Instituto Brasileiro de Geografia e Estatística (IBGE), onde desenvolve atividades relacionadas a controle estatístico de sigilo, visualização de dados e uso de big data em estatísticas oficiais.


