Tamanho da fonte:
Algoritmos de Clusterização
Última alteração: 2022-01-03
Resumo
A clusterização é uma tecnologia usada no nosso dia a dia. Podemos encontra-lá em sistemas meteorológicos, em aplicativos de mapeamento genético e até em programas de renderização de imagens, no geral é uma ótima ferramenta para agrupar dados, seja de um cliente, um computador, ou o que for necessário para encontrar semelhanças entre esses dados, e assim trazer uma maior eficiência e satisfação caso a clusterização tenha sido utilizada para um cliente específico. Uma pergunta muito frequente sobre este assunto é: “Tudo pode ser clusterizado?” A resposta para esta pergunta é simples, independente do tipo de dado, se ele for quantificável, sim, ele pode ser clusterizado. Afinal o objetivo do cluster é facilitar a realização das estratégias, seja da sua empresa ou uma situação que você está passando, agrupando dados e fazendo uma análise detalhada. Neste projeto foi criado um cluster com o objetivo de analisar dados e mostra-los graficamente, usando vários tipos de dados reais como teste. O gráfico demonstra, em um plano cartesiano, os dados agrupados considerando o seu grau de semelhança, dividindo por cores para facilitar a visualização. Porém, um objetivo “secundário” era também mostrar a diferença de resultados entre diferentes algoritmos de clusterização, como o k-means e dbscan que foram usados neste projeto.
Texto completo:
PDF