var _hmt = _hmt || []; (function() {   var hm = document.createElement("script");   hm.src = "https://hm.baidu.com/hm.js?8c9c5a8618dc4aea3be27b32962e5871";   var s = document.getElementsByTagName("script")[0];    s.parentNode.insertBefore(hm, s); })();
400 050 6600
数据分析师

手机号

验证码

30天自动登录

数据分析用户画像层次聚类的方法及特性

来源:CPDA数据分析师网 / 作者:wyyhhxccjl / 时间:2020-01-31

层次聚类我们在做数据分析工作SPSS中又叫做系统聚类,层次聚类的思路是逐层合并,层次聚类的优点:不需要提前给出相应的类别数,同时也造成了它的缺点是运算速度慢。

 

数据分析层次聚类应用范围,层次聚类使用的条件,使用的场所非常的宽泛,不需要有苛刻的条件。

 

层次聚类的聚类对象的记录,所谓的记录指的是一个人或一个事,他们存在着多种的变量,变量体现的是某一个事物以及某一个人的一方面属性特征的称的数值,比如性别、收入、年龄、身高、体重等等这些都可以归属于变量,我们对这些变量进行聚类,这些变量之间是有一定关联的,性别与收入这两点可能会有连带关系,男性与女性的收入会有一定的变化,年龄与身高也有一定的关联性,不同的年龄有不同的身高等。

 

数据分析层次聚类的对象可以具体到一个人(记录),有可以具体到一些衡量一些人的指标(变量),来进行聚类。

 

层次聚类的数据类型,我们在做层次聚类时的维度叫做数据,这种维度一般会分为两类,类叫做连续性的维度、第二种叫做分类性的。

 

这两种分类是非常好理解的,例如身高有175或者185这种都属于具体的数值这两个数值中间还可以增加另外一个数值,而这些数轴上面就是可以成为连续分布的,就属于连续性的变量,以及收入、年龄都是以数值来表现的,所以数值来表示的大多都属于联系性变量。

 

什么属于分类变量:比如会说以性别来分分为男和女是通过类别来分类的所以叫做分类变量,对于层次聚类来说,不管是连续性的还是分类性的通通都接受。

 

当我们拿到市场细分的这种数据的时候首先来判断它到底是对记录进行聚类,还是对变量进行聚类,在对数据进行分析完之后如果是对记录进行聚类的话,或者对变量进行聚类里面又含有分类变量的话就会选择层次聚类的方法进行对数据的聚类。


Prev article

哪类数据适合使用迭代聚类的方式进行数据分析

Next article

一个数据分析师怎样通过SPSS数据树结果进行解读

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务