var _hmt = _hmt || []; (function() {   var hm = document.createElement("script");   hm.src = "https://hm.baidu.com/hm.js?8c9c5a8618dc4aea3be27b32962e5871";   var s = document.getElementsByTagName("script")[0];    s.parentNode.insertBefore(hm, s); })();
400 050 6600
数据分析师

手机号

验证码

30天自动登录

鲜为人知的人工智能秘密:无监督学习的真正含义

来源:CPDA数据分析师网 / 作者:数据君 / 时间:2021-07-20

这些误解中的许多原因都归因于这些形式的统计AI的名称

例如,有些人认为仅将机器学习用作反馈循环就是强化学习。其他人则认为,无人监督的全自动机器学习应用程序就是无监督学习的例子,但是这些类别的真正区别在于训练数据。通过强化学习,没有培训数据,代理与环境互动,并根据奖惩来学习,监督学习需要(主要是人类)标记的训练数据来教授模型以预测所需的结果。

 

无监督学习涉及训练没有标签的数据,其中“系统试图在您的数据中找到一组稳定的集群”

因此,数据组成了自己的类别,这种无监督学习的主要价值主张(用于机器学习模型,基于发现的结果来对数据进行探索和分类,而不是人类施加的分层)对于从通用数据发现到有针对性的用例(例如精密医学)而言,都是非常有用的,正确实施后,它会产生高度特定的分析见解,而这些见解很容易被遗漏。

 

聚类技术是无监督学习的典型形式

降维是无监督学习的另一个方面,也适用于有监督学习,群集使机器学习系统可以根据数据的相似性将数据分组。在某些情况下,人们可能没有意识到数据中的这些相似之处,这就是为什么群集是一种出色的数据发现技术的原因,例如企业可以使用聚类方法用各种源数据填充知识图,或对记录进行重复数据删除以确保数据质量,影响聚类的一些实用的措施包括。

 

1K-Means: 这种聚类算法部分基于空间,需要将三维空间中的所有数据都划分为……,这种技术的潜在局限性是人类必须决定想要多少个集群,就像你是上帝,你已经知道。但是,其他聚类技术克服了这一限制,让软件确定稳定的聚类数可以地说明数据的可变性。

 

2、拓扑分析:拓扑数据分析是一种现代聚类方法,它的集群通常比K-Means的集群更小且数量更多,该技术对于为整个生产环境设计全面的数字双胞胎至关重要。在医疗保健中也很有用,糖尿病通常被描述为糖尿病12或普通糖尿病,在一个特定的用例中,对2型糖尿病和真正衰竭的患者进行拓扑分析会导致这些患者中有22个类群

 

3、附加学习:聚类在图设置中真正有价值,在图设置中,组织可以将单个聚类输入回图中,以检测聚类中的聚类以获得高度特定的发现。在某些医疗保健环境中使用此做法,以促进个性化医疗,部分是通过为具有某种特定医疗状况(例如糖尿病)的每个患者提供群集标识符。这是您可以开始进行精密医学的方式,您可以将人们置于事物的簇中,并查看该簇的治疗效果是否优于该簇。

 

降维的基本原则适用于监督学习和无监督学习

我可以使用更少的变量,还是可以将变量合并在一起,这样就不需要400个变量,但是我只能使用三个, 这种方法的主要目标是减少输入数量,并且仍获得相同的预测质量,主成分分析是降维的无监督学习形式,其中数据科学家筛选一系列值以通过分析其数据中的相关性来预测其他值。

 

此计算过程非常昂贵需要“查看整个数据集中每个变量之间的每个相关性……然后在数据中找到它们所谓的因素”

因素是影响机器学习模型输出的输入数据属性,不仅支持将数据集聚类为因子,而且还减少了其中的变量数量,因此“对于每个因子,您都可以找到解释大部分可变性的重要变量,磨练这些变量对于建立具有准确预测的模型至关重要,人们可以解构特定因素,并“从100个变量变为2010个可以解释一切的变量。

 

聚类是许多无监督学习方法的核心,即使它们涉及降维

例如,组织可以利用聚类来找到客户数据中的相似性,以智能地将广告定向到那些组,通过将群集标识符分配给各个业务概念(例如特定的患者或客户),在群集中查找群集以及根据结果个性化下一步操作来优化这种形式的无监督学习,需要细化的,精通关系的设置,通过对那些结果执行分析,这些环境对于充分理解分析的输出是必不可少的。

 

由于对无监督学习的误解可能会暂时持续下去,因此重要的是要理解统计AI的这一要素究竟是什么

无监督学习并不仅仅意味着没有人会忽视机器学习的结果,该术语并不是“循环人类”概念的同义词,“循环人类”概念终应涉及到统计AI的所有方面,无监督学习是机器学习的一种,其中学习不是基于(主要是人为的)标记的训练数据示例,而是

Prev article

新的深度学习模型将图像分割带到边缘设备

Next article

CPDA数据分析师认证培训,2021大升级7月重磅来袭

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务