了解什么是机器学习以及它可以做什么?
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-07-23
什么是ML?
机器学习是一种计算机编程技术,它使用统计概率使计算机能够“学习”而不进行显式编程。简而言之,机器学习基于对外部信息的了解来“学习”。机器学习根据与之交互的数据做出决策,并使用统计概率确定每个结果。这些统计数据受到人脑建模的各种算法的支持。这样,它所做的每个预测都将得到从先前经验中获得的可靠的事实,数学证据的支持。
机器学习的一个很好的例子是日出的例子
如果计算机不知道太阳系和我们的行星的内部工作原理,就无法得知太阳每天都会升起。或者,计算机可以通过观察和记录一段时间内的相关事件来了解太阳每天都在升起,计算机连续365天在同一时间目睹日出后,它将很有可能计算出在三百六十六天太阳将再次升起,也就是说,当然,在第二天太阳不会升起的可能性仍然很小,因为到目前为止收集的统计数据永远不会有100%的概率。
机器学习分为三种类型:
1.有监督的机器学习
在有监督的机器学习中,计算机学习将输入映射到所需目标输出的一般规则。监督式机器学习也称为预测建模,可以用于对看不见或未来的数据进行预测,例如根据品牌(输入)和其他输入(年龄,里程等)预测汽车(输出)的市场价值。
2.无监督机器学习
在无监督机器学习中,该算法将独自留在其输入中查找结构并发现数据中的隐藏模式。这也称为“功能学习”,例如营销自动化程序可以根据受众特征和所学的购买习惯来定位受众。
3.强化机器学习
在强化机器学习中,计算机程序与动态环境进行交互,在动态环境中计算机必须执行某个目标,例如驾驶车辆或与对手玩游戏,该程序在导航问题空间时会获得奖励和惩罚方面的反馈,并学会确定在此情况下的行为。
使ML以数据质量工作
机器学习取决于数据,成功的ML需要高质量的数据,数据越可靠,准确,和全面,结果就会越好,但是典型的问题包括数据丢失,数据值不一致,自相关等会影响数据集的统计属性,并干扰算法所做的假设,在机器学习计划的初阶段,与您的团队一起实施数据质量标准至关重要。