Utilizamos cookies e tecnologias semelhantes de acordo com a nossa Política de Privacidade, e ao continuar navegado, você concorda com estas condições.

  • Maringá: (44) 3029-1162

  • Dourados: (67) 3033-8862

Análise de cluster: O que é e como aplicar?

Imagina uma lista digital com milhares de nomes de clientes de uma empresa, mas produzida aleatoriamente, sem nenhuma lógica por trás desta lista. Isso seria pouco produtivo do ponto de vista estratégico comercial, correto? 

Agora se agruparmos esses nomes de forma a colocar homens em um grupo e mulheres em outro, jovens em um grupo, e mais maduros em outro, etc. Se você entendeu a ideia que permeia este exemplo você conseguirá entender com mais facilidade a Análise de Cluster.

O que é Análise de Cluster? 


A Análise de Cluster é um método ao qual permite agrupar sujeitos ou variáveis em grupos com uma ou mais características comuns, não sendo necessário ter informações já dadas sobre a composição desses grupos. Muitas vezes temos conjunto de dados e uma necessidade de agrupar esse conjunto de dados por algum critério de similaridade em vista a algum tipo de conhecimento que a gente deseje aplicar. 

Um exemplo é queremos agrupar fotos de acordo com alguma similaridade, seja com fotos da mesma pessoa, ou fotos de pessoas de um grupo étnico, ou fotos de pessoas de um gênero. As possibilidades são variadas e as funções que elas podem exercer também.

Para realizar esta análise é necessário medir a semelhança, dissemelhança dos sujeitos e variáveis, a partir daí, agrupar. Os conglomerados obtidos a partir disso devem apresentar tanto uma homogeneidade interna (dentro de cada conglomerado), como uma grande heterogeneidade externa (entre conglomerados). 

A Análise de Cluster acaba por incluir vários procedimentos estatísticos que podem ser utilizados para classificar objetos sem preconceitos, ou seja, somente com base nas semelhanças ou não que eles possuem entre si. Isso sem definir previamente critérios de inclusão em qualquer agrupamento.

Assim, ela traz como possibilidade de uso a identificação de uma estrutura presente nos dados, além de impor uma estrutura num conjunto de dados mais ou menos homogêneos que têm de ser separados.

Entendendo o conceito de Agrupamento Hierárquico 


No processo de análise de cluster um dos conhecimentos necessários para termos uma ideia mais clara sobre o tema é o conhecimento de agrupamento hierárquico. É nele que é criada uma estrutura em formato de árvore que vai indicar o número de clusters.

Vamos imaginar então essa árvore hierárquica. Inicia-se esse processo com cada objeto em uma classe por si só e aos poucos os diferentes objetos ou variáveis vão se agrupando, criando nós que são ou dispõem de características mais semelhantes entre si. 

Podemos perceber que enquanto os elementos se agrupam eles se tornam aglomerados cada vez maiores e, sobretudo, passam a conter elementos cada vez mais diferenciados, até que, no último momento os objetos estão unidos em conjunto. 

Quando esses dados finais contém uma estrutura, digamos assim, clara em termos de grupos de objetos que são similares uns aos outros, então essa estrutura se reflete na árvore hierárquica como ramos distintos.

O Dendrograma 

Para visualizar como os agrupamentos são formados em cada passo e para avaliar os níveis de similaridade (ou distância) dos agrupamentos que são formados é utilizado o dendrograma, diagrama que lembra a estrutura de árvore (daí o nome) que serve para exibir os níveis de similaridade (ou distância).
.

Quais as funções da análise de agrupamentos? 


A análise de agrupamentos pode ser realizada para uma série de uso, tais como:

- Classificar pessoas de acordo com a personalidade de cada uma delas.
- Segmentar o cliente de acordo com seus hábitos de consumo, criando assim estratégias comerciais para aumentar o lucro.
- Classificar cidades de acordo com seus aspectos físicos, demográficos, econômicos e humanos para assim criar um mapa mais abrangente daquele estado.
- Identificar grupos de investimento de acordo com perfis de risco.
- Identificar grupos de alunos mais propensos à evasão escolar.
- Segmentar empresas com base em indicadores financeiros (rentabilidade, liquidez, margem).

Essas são somente seis de centenas de possibilidades onde a análise de agrupamentos vai se mostrar importante.

Métodos hierárquicos