400 050 6600
数据分析师

手机号

验证码

30天自动登录
当前位置:首页 - Q&A问答

Q&AQ&A问答

如何能够很好的利用人力数据源?

来源:CPDA数据分析师网 / 作者:数据君 / 时间:2021-04-02

通过对这些数据进行社会心理分析
可以深入了解如何改善客户参与度,例如如果客户在查看产品时显示出幸福的迹象,但在查看价格后却表现出失望,则零售商理论上可以立即提供折扣或促销以达成交易,折扣或促销的金额可以根据零售商对客户过去购买方式的了解来计算,重要的是要注意,我们不知道有任何零售商在使用这样的系统-但是可能性令人着迷,另一个应用程序可能是在安全服务中,用躯体监视代替了目前对人类情感和呼吸,温度和汗水等微妙的物理提示视而不见的皱纹和监视机制,这些信息可能有助于识别具有恶意意图的人,这些生理指标可以通过传感器和照相机进行测量,并通过将每个人视为一个节点的网络进行通信,当分析这些信息时,可以确定节点显示出与恐惧,焦虑,仇恨或破坏相关的生理指标所构成的潜在威胁,然后可以通过隔离和其他策略来主动消除这些威胁。

研究中正在探索的人类生理数据的其他应用包括
记录受试者对某种刺激的情感反应以评估用户体验,实时分析生理数据以监测人的健康状况(例如,在日常活动中,在医院等环境中)随着物联网的曙光和一个日益相互联系的世界,我们目前能够捕获许多新颖的数据元素,这些元素为人类生活提供了深刻的见识,但是即使有了这些进步,我们所能捕捉到的只是行动,捕获有关人类情感的数据并使其可量化和可测量的能力(捕获人类数据源)将把分析提高到一个全新的水平,当然在此分析变得司空见惯之前,需要探讨无数的隐私和法律问题,您能在企业中看到这种类型的分析咨询的潜力 吗?

稀有事件建模:小数定律
罕见事件是频率低,严重性高的问题,可能会产生深远的影响,例如保险欺诈,重大股票市场崩溃和疾病流行,预测和模拟此类事件很困难,但可能非常有价值,主要的挑战通常是缺乏历史数据和通用统计技术的不适用性,大多数分析工作的两个基本要求是已知事件的可用性和对事件特征的理解,在罕见事件的情况下,我们通常都没有,这些问题迫使决策科学家不得不发挥创造力并探索非常规的分析方法。

考虑保险欺诈
保险公司是分析的丰富用户,对索赔的严重性进行分类已成为一项相当简单的分析活动,那是因为有很多关于索赔严重性的数据,然而由于欺诈的发生率要低得多,因此确定欺诈性索赔是另一回事,由于用于算法预测严重性的数据点比用于算法预测欺诈的数据点多,因此数据集不平衡。

我们该如何解决呢?有三种方法可以处理不平衡的数据集:

数据级别: 数据级别的方法涉及重新采样以减少类不平衡,两种常用的采样技术包括过采样和欠采样,过度采样会随机复制少数类别的样本,而欠采样会随机丢弃多数类别的样本,以修改类别分布,两种技术都有缺点:过度采样可能会导致过度拟合,因为它会精确复制少数样本,而欠采样可能会丢弃潜在有用的多数样本。因此,数据级方法往往是不可行的选择,与算法和集成方法相比,其性能略有变化。

算法级别: 算法级别的方法利用了经过修改的机器学习算法,以适应不平衡的数据。它通过为各个类别分配权重,引入偏差和惩罚常数来补偿偏斜,处理不平衡的算法方法示例包括一类学习,成本敏感型学习,基于识别的方法和基于内核的学习,例如支持向量机,单独应用算法方法不是方法,因为数据的大小以及事件与非事件之间的不平衡比通常很高,因此我们建议重点研究将采样方法与算法方法结合起来的新技术。

集成方法: 集成方法涉及专家混合方法。这些方法结合了算法和数据方法,以在学习阶段为每个班级合并不同的误分类成本,两种的集成学习算法,试图通过对错误分类的样本进行加权来提高分类器的准确性,样本随机抽取并替换的过程。

集成方法依赖于组合大量相对较弱和简单的模型来获得更强的整体预测
这种机器学习集成技术突出的例子是随机森林,神经网络集成和梯度提升机,它们已经在不同领域中找到了许多成功的应用。诸如随机森林和神经网络之类的集成技术依赖于集成模型的简单平均,基于集成形成的建设性策略。增强的主要思想是按顺序向集合中添加新模型,适用于一组实际的实际应用,并在准确性和泛化方面提供出色的结果。

关于针对罕见事件的大数据分析方法,存在两种思想流派 

一种是企业应开发高度进化的模型来帮助预测和预防这些事件,另一种则是开发系统性的机制来抵消这些事件的影响,例如一家航空公司可以从应对自然灾害的机队重组中受益,而一家制药机构可以选择维持高安全性库存以应对疫情暴发。


免费客服热线:400-050-6600

商业联合会数据分析专业委员会


 


Prev article

重新思考数据治理的理由是什么?

Next article

在数据和直觉之间寻求适当的平衡?

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务