定量和定性数据:重要组合有什么?
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2021-02-01
明智地使用数据是优化流程,发现新机会以及获得或保持竞争优势的关键
但是您是否注意所有数据?您是否有能力处理各种数据?您能否充分利用它可以揭示的见解?您的答案将取决于您是否可以收集和分析定量和定性数据,让我们考虑一下两者之间的差异,以及它们为什么对数据驱动型组织的成功至关重要,挖掘定量数据,常见的是,我们认为数据是显示诸如销售数字,营销数据,薪资总额,财务统计信息以及其他可以客观计算和衡量的其他数据之类的信息的数字,这是定量数据,它是“硬”结构化的数据,可以回答诸如“多少?”之类的问题。或“多久一次?” 它采用有组织的格式(通常为行和列),并存储为关系数据库,其中这些行和列之间存在关系。
可以使用定量数据来计算所有描述性统计数据
通过数值比较和统计推断进行分析,并通过统计分析进行报告,由于定量数据始终是数字,因此将其排序,管理,分析,可视化并进行计算相对简单,电子表格软件(例如Excel,搜索引擎表格或传统的数据库管理系统)都主要处理定量数据。这些程序和系统非常适合根据静态数据生成基本的可视化效果,例如图形和图表,当数据变得庞大且快速变化时,挑战就来了。
为什么定量数据很重要?
定量数据通常被视为您的商业智能和分析程序的基础,因为它可以揭示组织的宝贵见解。这些数字显示了性能,效率,覆盖面,市场份额,收入和支出。这是了解组织运作方式的基本信息,此外定量数据构成了您可以使用回归分析,假设检验和蒙特卡洛模拟等技术自信地推断,估计和预测未来绩效的基础。
这些技术使您能够:
1、查看趋势和因素之间的关系,以便确定可以优化的运营领域
2、将您的数据与假设和假设进行比较,以显示决策如何影响您的企业
3、通过数学建模预测风险和不确定性
因此,使用定量数据,您可以制定战略和战术决策,这将使您的组织受益并推动增长。
定量数据有什么问题?
尽管定量数据有许多用途,但对于数据驱动型组织而言,仍存在两个主要挑战,首先不会以统一,一致的格式创建数据,它是由许多来源以不同方式生成的,为了有效地访问它,您需要对其进行组织和清理,以避免可能会损害数据完整性以及扩展见解准确性的错误,疏忽和重复,解决此问题的方法是确保您的BI和分析平台可以处理本地和云上尽可能多的数据源和形式,以确保您不会忽略或遗漏任何数据,其次更具挑战性的事实是,并非您生成和收集的所有信息都是结构化的定量数据,由于数据来自越来越多的来源,因此定量数据可能只占大多数组织可用的所有数据的20%,如果您将全部精力集中在定量数据上,则会忽略大量有价值的信息,因此您的见识和决策可能会因此而失真,您需要一个可以访问和分析其他80%的定性数据的解决方案。
探索定性数据
定性数据是非结构化的,这意味着它不是预定义的格式,在原始状态下,它具有多种形式:文本,社交媒体评论,电话通话记录,各种日志文件,图像,音频,视频等,定性数据中的信息通常是类别变量,这意味着它描述了数据单元的特征或质量,例如“什么类型”,“哪个类别”,“谁”(或“哪个角色”),这些可以创建上下文和环境的图片,在这些图片和数据中,数据可以帮助您建立对感觉,观点和意图的理解,那是因为定性数据与理解客户,用户或利益相关者的观点有关。与定量数据相比,此类数据通常通过不太严格,可测量的方式收集。例子包括评论,录音,访谈,焦点小组报告等,通常以举报人的自然语言收到,定性数据比定量数据更具主观性,“软性”信息,但是高级分析现在可以识别和分类此信息,并将其转换为发现,从而为组织带来改变游戏规则的见解。
随着数据来源的不断扩散,越来越多的数据是非结构化和定性的
它更加复杂,并且需要更多的存储空间,传统的收集和组织数据方法不能有效地企业,过滤和分析此类数据。需要先进的技术和新的方法,起初看起来非常随机,形式迥异的定性数据需要数据仓库,数据湖和NoSQL数据库来存储和管理它们。
定性数据的好处:开启理解
定性数据可以到达定量数据不能到达的地方。例如,它是情感分析的门户-了解用户,客户和利益相关者的想法和感受以及他们的行为。专注于定性数据的技术(例如内容分析和叙事分析)使您能够:
1、分析文本以在开放式数据中找到常见的主题,例如用户反馈,采访记录和调查,以便您可以确定重要的重点领域
2、更好地解释您对企业,产品,服务,流程或品牌的感受或看法,以帮助确定哪些变更或创新有效
可以访问此信息为您提供了新的见解维度,可以以此为基础制定决策并确定组织的战术和战略方向。使用定性数据,您可以了解意图和行为,从而使预测分析更加准确,并为您提供更全面的见解。您可以分析和学习大量的非结构化数据,以确保您的数据驱动决策尽可能可靠。
例如,耳机,耳塞以及其他音频和无线产品的制造商使用预测和情感分析来更好地了解客户
这使公司的产品开发团队能够在新产品发布之前探索减少退货和保修请求的机会,并获得客户对当前产品的反应,利用这些见解,根据客户的喜好来磨练其新产品,从而可以为其目标市场提供更具吸引力的产品,充分利用定性数据,定性数据避免了传统数据库的严格分类和存储限制,它为信息提供了比结构化,定性数据更多样化,更难以组织的原材料。理解并从中得出模式需要更新,更先进的技术。
涉及机器学习的自然语言处理(NLP)是您的BI和分析平台如何理解非结构化数据的含义
例如电子邮件,评论,反馈和即时消息,它启用了搜索驱动的分析,使您可以处理复杂的NLP,因为您可以使用日常的自然语言询问系统问题,另外即使从分析的角度来看,您要的内容相对复杂,您也可以收到可视化效果并将见解嵌入到外部应用程序中。
由AI和增强分析支持的系统不断学习人们选择如何处理数据
算法可识别数据中的模式,这些模式可使搜索结果更快,更准确,更完整,您还可以将AI分析工具与Amazon Alexa和chatbots之类的其他界面集成,也可以利用这些技术在NLP中令人印象深刻的发展,拥有发现新洞察力的所有潜力,不足为奇的是,有97%的商业表示他们的企业正在对大数据和AI计划进行投资。
更好的结合:使用定性数据和定量数据
但是您是否注意所有数据?您是否有能力处理各种数据?您能否充分利用它可以揭示的见解?您的答案将取决于您是否可以收集和分析定量和定性数据,让我们考虑一下两者之间的差异,以及它们为什么对数据驱动型组织的成功至关重要,挖掘定量数据,常见的是,我们认为数据是显示诸如销售数字,营销数据,薪资总额,财务统计信息以及其他可以客观计算和衡量的其他数据之类的信息的数字,这是定量数据,它是“硬”结构化的数据,可以回答诸如“多少?”之类的问题。或“多久一次?” 它采用有组织的格式(通常为行和列),并存储为关系数据库,其中这些行和列之间存在关系。
可以使用定量数据来计算所有描述性统计数据
通过数值比较和统计推断进行分析,并通过统计分析进行报告,由于定量数据始终是数字,因此将其排序,管理,分析,可视化并进行计算相对简单,电子表格软件(例如Excel,搜索引擎表格或传统的数据库管理系统)都主要处理定量数据。这些程序和系统非常适合根据静态数据生成基本的可视化效果,例如图形和图表,当数据变得庞大且快速变化时,挑战就来了。
为什么定量数据很重要?
定量数据通常被视为您的商业智能和分析程序的基础,因为它可以揭示组织的宝贵见解。这些数字显示了性能,效率,覆盖面,市场份额,收入和支出。这是了解组织运作方式的基本信息,此外定量数据构成了您可以使用回归分析,假设检验和蒙特卡洛模拟等技术自信地推断,估计和预测未来绩效的基础。
这些技术使您能够:
1、查看趋势和因素之间的关系,以便确定可以优化的运营领域
2、将您的数据与假设和假设进行比较,以显示决策如何影响您的企业
3、通过数学建模预测风险和不确定性
因此,使用定量数据,您可以制定战略和战术决策,这将使您的组织受益并推动增长。
定量数据有什么问题?
尽管定量数据有许多用途,但对于数据驱动型组织而言,仍存在两个主要挑战,首先不会以统一,一致的格式创建数据,它是由许多来源以不同方式生成的,为了有效地访问它,您需要对其进行组织和清理,以避免可能会损害数据完整性以及扩展见解准确性的错误,疏忽和重复,解决此问题的方法是确保您的BI和分析平台可以处理本地和云上尽可能多的数据源和形式,以确保您不会忽略或遗漏任何数据,其次更具挑战性的事实是,并非您生成和收集的所有信息都是结构化的定量数据,由于数据来自越来越多的来源,因此定量数据可能只占大多数组织可用的所有数据的20%,如果您将全部精力集中在定量数据上,则会忽略大量有价值的信息,因此您的见识和决策可能会因此而失真,您需要一个可以访问和分析其他80%的定性数据的解决方案。
探索定性数据
定性数据是非结构化的,这意味着它不是预定义的格式,在原始状态下,它具有多种形式:文本,社交媒体评论,电话通话记录,各种日志文件,图像,音频,视频等,定性数据中的信息通常是类别变量,这意味着它描述了数据单元的特征或质量,例如“什么类型”,“哪个类别”,“谁”(或“哪个角色”),这些可以创建上下文和环境的图片,在这些图片和数据中,数据可以帮助您建立对感觉,观点和意图的理解,那是因为定性数据与理解客户,用户或利益相关者的观点有关。与定量数据相比,此类数据通常通过不太严格,可测量的方式收集。例子包括评论,录音,访谈,焦点小组报告等,通常以举报人的自然语言收到,定性数据比定量数据更具主观性,“软性”信息,但是高级分析现在可以识别和分类此信息,并将其转换为发现,从而为组织带来改变游戏规则的见解。
随着数据来源的不断扩散,越来越多的数据是非结构化和定性的
它更加复杂,并且需要更多的存储空间,传统的收集和组织数据方法不能有效地企业,过滤和分析此类数据。需要先进的技术和新的方法,起初看起来非常随机,形式迥异的定性数据需要数据仓库,数据湖和NoSQL数据库来存储和管理它们。
定性数据的好处:开启理解
定性数据可以到达定量数据不能到达的地方。例如,它是情感分析的门户-了解用户,客户和利益相关者的想法和感受以及他们的行为。专注于定性数据的技术(例如内容分析和叙事分析)使您能够:
1、分析文本以在开放式数据中找到常见的主题,例如用户反馈,采访记录和调查,以便您可以确定重要的重点领域
2、更好地解释您对企业,产品,服务,流程或品牌的感受或看法,以帮助确定哪些变更或创新有效
可以访问此信息为您提供了新的见解维度,可以以此为基础制定决策并确定组织的战术和战略方向。使用定性数据,您可以了解意图和行为,从而使预测分析更加准确,并为您提供更全面的见解。您可以分析和学习大量的非结构化数据,以确保您的数据驱动决策尽可能可靠。
例如,耳机,耳塞以及其他音频和无线产品的制造商使用预测和情感分析来更好地了解客户
这使公司的产品开发团队能够在新产品发布之前探索减少退货和保修请求的机会,并获得客户对当前产品的反应,利用这些见解,根据客户的喜好来磨练其新产品,从而可以为其目标市场提供更具吸引力的产品,充分利用定性数据,定性数据避免了传统数据库的严格分类和存储限制,它为信息提供了比结构化,定性数据更多样化,更难以组织的原材料。理解并从中得出模式需要更新,更先进的技术。
涉及机器学习的自然语言处理(NLP)是您的BI和分析平台如何理解非结构化数据的含义
例如电子邮件,评论,反馈和即时消息,它启用了搜索驱动的分析,使您可以处理复杂的NLP,因为您可以使用日常的自然语言询问系统问题,另外即使从分析的角度来看,您要的内容相对复杂,您也可以收到可视化效果并将见解嵌入到外部应用程序中。
由AI和增强分析支持的系统不断学习人们选择如何处理数据
算法可识别数据中的模式,这些模式可使搜索结果更快,更准确,更完整,您还可以将AI分析工具与Amazon Alexa和chatbots之类的其他界面集成,也可以利用这些技术在NLP中令人印象深刻的发展,拥有发现新洞察力的所有潜力,不足为奇的是,有97%的商业表示他们的企业正在对大数据和AI计划进行投资。
更好的结合:使用定性数据和定量数据
定量数据是您的BI和分析的基础,它提供了坚实的基础,您可以在此基础上构建对企业至关重要的数据可视化和见解,有了这个基础,定性数据可以使您进一步进行分析,从快速增长的资源中获得更多的了解,并从更多角度利用数据来推动决策,您必须能够使用两种数据,才能获得全面的见解,它们可以共同帮助为改变游戏规则的枢纽和创新奠定基础,从而使您的组织始终处于领先地位。
商业联合会数据分析专业委员会