400 050 6600
数据分析师

手机号

验证码

30天自动登录
当前位置:首页 - Q&A问答

Q&AQ&A问答

数据分析师怎样把箱线图将数据集拆分为四分位数

来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-03-09

什么叫做数据分析中的箱线图

在数据分析中箱线图是能够将数据集拆分为四分位数,在表达箱线图的主体由一个框因此称为箱线图,该框从个四分位数(Q1)到第三个四分位数(Q3)。

 

在我们做出箱线图它所在的框中,在数据集的中位数 Q2处绘制一条垂直线 ,从盒子的正面和背面延伸出两条水平线,称为晶须正面晶须从Q1到数据集中小的非离群值,而背面晶须从Q3到非离群值。




如果我们得到的数据集包含一个或多个离群值的话,CPDA数据分析师会将它们分别绘制为图表上的点,在上面的方框图中,第二个晶须的右侧显示了两个离群值。

 

CPDA数据分析师教你如何解释箱线图

我们这里会为大家讲到怎样读取箱线图的方法,中位数由垂直于盒子中心的垂直线表示,在上面的方框图中,中位数在46之间,约为5

在此之外,箱形图还显示了数据集中两种常见的变异性或分布度量。

 

在范围方面,如果您对所有数据的传播感兴趣,则在箱图中以小值和值之间的水平距离(包括任何异常值)表示。在上面的方框图中,数据值的范围从大约0(小非离群值)到大约16(离群值),因此范围是16。如果忽略离群值,则范围由的相对两端之间的距离表示晶须-在上面的方框图中约有10个。

四分位间距(IQR)。数据集的中间一半在四分位间距范围内。在箱图中,四分位数范围由箱的宽度(Q3减去Q1)表示。在上图中,四分位数范围等于大约7减去3或大约4

,箱线图通常提供有关数据集形状的信息。以下示例显示了一些常见的模式。




上面的每个方框图都说明了不同的 偏斜度 模式。如果大多数观测值集中在量表的低端,则分布偏右。反之亦然。如果分布是对称的,则观测值将在中间值处平均分配,如上中间图所示。

 

Prev article

CPDA数据分析师是如何比较数据集的方法

Next article

数据分析统计中甲点阵图用于类别或组的图形显示

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务