Please use this identifier to cite or link to this item: http://www.monografias.ufop.br/handle/35400000/8281
Title: Um comparativo entre algoritmos de agrupamento de dados para detecção de comunidades.
Authors: Gomes, Vinícius da Silva
metadata.dc.contributor.advisor: Gertrudes, Jadson Castro
metadata.dc.contributor.referee: Freitas, Vander Luis de Souza
Vasconcelos, Ícaro Luiz Lage
Gertrudes, Jadson Castro
Keywords: Aprendizado de máquina
Aprendizado não supervisionado
Agrupamento de dados
Detecção de comunidades
Issue Date: 2025
Citation: GOMES, Vinícius da Silva. Um comparativo entre algoritmos de agrupamento de dados para detecção de comunidades. 2025. 41 f. Monografia (Graduação em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2025.
Abstract: O agrupamento de dados é uma tarefa fundamental do aprendizado de máquina não supervisio- nado, cujo objetivo é organizar um conjunto de dados em grupos com base na similaridade entre os elementos. No contexto de análise de redes complexas, essa técnica é aplicada para a detecção de comunidades, que consiste em identificar subgrupos de nós densamente conectados em um grafo. Este trabalho se dedica a comparar o desempenho de algoritmos de agrupamento na detec- ção de comunidades, com ênfase na avaliação de uma abordagem recente: o framework FOSC (Framework for Optimal Extraction of Clusters from Hierarchies), proposto por (CAMPELLO et al., 2013) e aprimorado por Anjos et al. (2019). Neste estudo, realizamos uma comparação do aprimoramento proposto por Anjos et al. (2019), que utiliza a métrica de modularidade Q no FOSC, contra algoritmos de detecção de comunidade consolidados. Utilizando o benchmark sintético LFR, o trabalho observou se a incorporação do FOSC a esses algoritmos tradicionais melhora a qualidade das comunidades detectadas. Os experimentos mostraram que o FOSC não apresentou melhorias significativas em relação aos algoritmos clássicos, embora também não tenha demonstrado desempenho inferior. Em diferentes configurações, o FOSC mostrou-se competitivo, alcançando valores de NMI próximos aos melhores métodos para baixos valores de µ. Conclui-se que, apesar de não superar os algoritmos tradicionais no benchmark LFR, o FOSC apresenta potencial e merece ser explorado em outros cenários e bases de dados, a fim de avaliar de forma mais ampla sua eficácia na detecção de comunidades.
metadata.dc.description.abstracten: Data clustering is a fundamental task in unsupervised machine learning, whose goal is to organize a dataset into groups based on the similarity among its elements. In the context of complex network analysis, this technique is applied to community detection, which aims to identify subgroups of densely connected nodes within a graph. This work focuses on comparing the performance of clustering algorithms in community detection, with an emphasis on evaluating a recent approach: the FOSC framework (Framework for Optimal Extraction of Clusters from Hierarchies), proposed by (CAMPELLO et al., 2013) and later improved by Anjos et al. (2019). In this study, we compare the enhancement proposed by Anjos et al. (2019), which incorporates modularity Q into FOSC, against well-established community detection algorithms. Using the synthetic LFR benchmark, we investigated whether the integration of FOSC into traditional algorithms improves the quality of the detected communities. The experiments showed that FOSC did not provide significant improvements over classical algorithms, although it did not perform worse either. In different configurations, FOSC proved competitive, achieving NMI values close to the best-performing methods for low values of µ. We conclude that, although FOSC did not clearly outperform traditional algorithms in the LFR benchmark, it shows potential and should be further explored in other scenarios and datasets to better assess its effectiveness in community detection.
URI: http://www.monografias.ufop.br/handle/35400000/8281
metadata.dc.rights.license: Este trabalho está sob uma licença Creative Commons BY-NC-ND 4.0 (https://creativecommons.org/licenses/by-nc-nd/4.0/?ref=chooser-v1).
Appears in Collections:Ciência da Computação

Files in This Item:
File Description SizeFormat 
MONOGRAFIA_ComparativoAlgoritmosAgrupamento.pdf2,11 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.