数据分析中单向表是条形图的表格等效形式
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-03-12
对于数据分析来说单向表图形表现得方式就像条形图一样,单向表以频率计数 和/或 相对频率的形式显示分类数据。
数据分析中频率表代表什么
数据分析师在对数据做分析时如果遇到当单向表显示分类变量的特定类别的频率计数时,它称为频率表。
下面,条形图和频率表显示相同的数据。两者都显示频率计数,代表10个旅行社客户的旅行选择。
我们在做数据分析时遇到相对频率表应该怎样对它进行了解
当单向表显示分类变量的特定类别的相对频率(即百分比或比例)时,称为 相对频率表。
下表中的每个表格都汇总了上方条形图中的数据。这两个表都是相对频率表。一张表以比例显示相对频率,另一张表以百分比显示相对频率。
CPDA数据分析师在对数据进行处理时使用双向表和分段条形图来检查两个类别变量之间的关系。
双向表的单元格中的条目可以显示为 频率计数或 相对频率(就像 单向表一样)。或者它们可以图形显示为分段的条形图。
CPDA告诉你两路频率表能对数据分析带来更好的效果
下面的双向图表显示了50位成人(20位男性和30位女性)喜欢的休闲活动。由于表中的条目是频率计数,因此该表是 频率表。

总计”行和“总计”列中的条目称为 边际频率或 边际分布。表格正文中的条目称为联合频率。
如果仅查看“总计”行中的边际频率,则可以得出以下结论:这三个活动具有大致相同的吸引力。然而,联合频率显示出女性强烈偏爱舞蹈。男人之间对舞蹈的兴趣不大。
数据统计中两路相对频率表是什么意思
上表使用频率计数来描述休闲活动的偏好。或者,我们可以使用相对频率(例如百分比或比例)来描述相同的数据。当我们在双向表中使用相对频率时,表项称为 条件频率或条件分布。这是休闲活动表的一个版本,其中表格单元中有比例。

双向表可以显示整个表,行或列的相对频率。上表显示了整个表的相对频率。下表显示了行的相对频率(比例)。

并且,下表显示了列的相对频率(再次是比例)。

每种相对频率表对理解性别与休闲活动偏好之间的关系都有不同的贡献。例如,“行的相对频率”表清楚地显示了每个性别偏爱特定休闲活动的可能性。不难看出,男人喜欢跳舞的可能性是10%。女人喜欢跳舞的概率为53%;男人偏爱运动的概率为50%;等等。
分段条形图在统计中什么时候会用到
我们在做数据分析时当在分段条形图中以图形方式显示关系时,更容易检测到它们。分段条形图对于分类变量的每个级别都有一个条形。每个条形被划分为“段”,以使每个段的长度指示第二个变量中观察值的比例或百分比。

上面的分段条形图使用了我们前面讨论的“行的相对频率”表中的数据,这段数据图在数据分析中可以很好的表明妇女对舞蹈有强烈的偏好,男人很少将舞蹈作为选择,男性喜欢运动,但男性对运动的偏好远胜于电视。