在数据分析统计中一个值相对于一组数据中其他值的位置
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-03-06
数据分析师在对数据进行统计时,经常谈论一个值相对于一组数据中其他值的位置。位置的常见度量是百分位数,四分位数和标准分数(aka,z分数),数据统计中标准分数。
数据分析统计中什么叫做百分位数
比如说我们假设数据集中的元素按从小到大的顺序排列。将一组按顺序排列的元素划分为100个相等部分的值称为百分位数。
百分等级为P i的元素将比集合中所有元素的i percent 具有更大的值。因此,第50个百分位数的观测值将表示为P 50,并且将大于集合中观测值的50%。在第50个百分位数处的观察值将对应 于集合中的中值。
数据分析中什么叫做四分位数
四分位数将等级排序的数据集分为四个相等的部分组成。数据分析师会划分每个部分的值称为,第二和第三四分位数;它们分别由Q 1,Q 2和Q 3表示。下图显示了一组四个数字,分为四分位数。
CPDA数据分析师学员在做数据统计时要注意四分位数和百分位数之间的关系。Q 1对应于P 25,Q 2对应于P 50,Q 3对应于P 75。Q 2 是集合中的中值。
数据统计中标准分数(z得分)
举例说明甲标准分数(又名,一z得分)表示多少标准偏差的元素是从平均值。可以从以下公式计算标准分数。
CPDA数据分析师会通过这个公式得出结论其中z是z分数,X是元素的值,μ是总体的平均值,而σ是标准偏差,这是解释z分数的方法。
如果Z分数小于0表示元素小于平均值。
反之z分数大于0表示元素大于平均值。
Z分数等于0表示元素等于平均值。
z分数等于1表示元素比标准差大1个标准差;z得分等于2,比平均值大2个标准差;等等
Z分数等于-1表示元素比平均值少1个标准差;z分数等于-2,比平均值小2个标准差;等等。