数据分析师拿到一组数据之后怎样选择聚类方式
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-01-31
首先尝试层次聚类尝试一下,细分一下目标,通过层次聚类构造出一个树状图,根据树状图大体判断一下分几类相对比较合适的,知道分类明确以后,迭代聚类就可以大体的分成几类了。
到底是层次聚类还是迭代聚类,那种效果好会根据你题目的不同而不同,具体的判断标准就是回到原来市场细分的几个目标,看一看那种聚类可以使得类间的差距可以到达化,类内的差异小化,这样的聚类方式才是比较合适的,适合你的一种。
怎样去衡量类间的距离能达到化,类内的差异小化,使用分析法F统计量=类间的差异除以自由度 类内的差异除以自由度,市场的目标是类间的差异化,类内的差异小化就属于F统计量的这个值,越大越好大到F量的统计值大于F的零界值或者F统计量的伴随慨率p小于阿尔法F算法分析作用就是我们终使用哪一种聚类效果是的。