var _hmt = _hmt || []; (function() {   var hm = document.createElement("script");   hm.src = "https://hm.baidu.com/hm.js?8c9c5a8618dc4aea3be27b32962e5871";   var s = document.getElementsByTagName("script")[0];    s.parentNode.insertBefore(hm, s); })();
400 050 6600
数据分析师

手机号

验证码

30天自动登录

机器学习算法加深您的Python ML知识

来源:CPDA数据分析师网 / 作者:数据君 / 时间:2021-04-30

标题听起来像是另一本有关机器学习算法的入门书
机器学习算法可以到达初学者指南不会带您到的地方,如果您具有数学和编程技能,那么它可以是加深使用Python的机器学习知识的绝佳指南。

给您的机器学习引擎上油
机器学习算法从基础知识的快速浏览开始,用来解释关键概念的可访问定义,这些概念包括监督学习,无监督学习和半监督学习以及强化学习,在机器学习与描述性,预测性和描述性分析之间建立了极大的类比,机器学习概述还包含一些隐藏的瑰宝,包括计算神经科学入门以及一些关于大数据和机器学习陷阱的很好的预防措施,也就是说,机器学习概述不会涉及太多细节,对于新手来说将很难理解,对于本书的读者来说,它可以刷新和巩固您对机器学习的理解,而不是教您基础知识。

机器学习算法将在此简要概述的基础上构建并进入更高级的概念
例如损失函数,数据生成过程,独立且分布均匀的变量,过拟合和过拟合,不同的分类策略,以及信息论的要素,同样对于那些已经在机器学习算法和线性代数上有实际经验的人来说,定义是平滑的并且很容易理解,在探索不同算法之前,该书涵盖了一些更关键的概念,例如特征工程和数据准备,在这里您将重新访问主要的Python机器学习库的一些关键类和功能,如果您已经对Python有扎实的知识,那么您会发现这部分对单次编码,训练测试拆分,插补归一化等进行了令人愉快的回顾,第三章有很多很棒的东西,其中包括的和易访问的定义之一,即主成分分析和机器学习算法中的特征相关性,您还将看到入门书籍中未涵盖的一些更高级的技术,例如非负矩阵分解。

您将在这里学习机器学习算法
丰富的机器学习算法、聚类,通常机器学习算法结构良好,名副其实,有关于回归,分类,支持向量机,决策树和聚类的知识紧随其后的是有关推荐系统和自然语言处理应用程序的几章,以对深度学习和人工神经网络的非常简要的概述作为结尾。

Python中的原理机器学习算法
包括入门书籍中未涵盖的详细信息,例如回归深入介绍了异常值和减轻其影响的方法,分类章节对在线算法中的被动攻击性分类和回归进行了很好的讨论,一章对半监督向量机进行了全面(但复杂)的讨论,决策树这一章很好地介绍了DT的特定敏感性,例如类不平衡,以及一些有关调整树以实现性能的实用技巧,聚类部分确实很出色,它涵盖了三个完整的章节,从基础知识(k近邻和k均值)开始,并经过了更高级的聚类(DBSCAN,BIRCH和双聚类)和可视化技术(树状图),您还将全面了解如何衡量结果的有效性,并确定算法是否锁定了正确数量的簇和正确的簇分布。

对每种机器学习算法背后的数学公式进行了详尽的讨论
您需要扎实的线性代数以及微分和积分微积分的基础知识来完全理解这一点,如果您需要磨练机器学习的数学技能,函数库而没有对其进行解释,因此您也需要了解它们,关于机器学习算法的令人愉快的事情之一就是本章的摘要,在仔细研究了每种机器学习算法的数学和Python编码的精髓之后,简要回顾了每种技术在哪里应用,也有许多对相关论文的引用,它们对本书中讨论的主题进行了更深入的介绍,围绕研究的炒作所掩盖。

机器学习算法以机器学习流水线的完整总结以及在本书中介绍的不同Python工具之间进行选择的一些关键技巧作为结尾

1、现实世界中的例子不足
2、深层神经网络

除了研究论文和理论还应该设置关于Python机器学习的例子
这些示例将带您进入现实世界中的应用程序,并可能在本书中逐步积累,不幸的是,在这方面,机器学习算法还有些不足,一方面示例大多是通用的,在scikit-learn中使用了数据生成功能,例如make_blobs,make_circles和make_classification,这些功能很好,可以显示Python机器学习的某些方面,但不足以使您了解如何在现实生活中使用这些技术,在这些情况下,您必须处理噪声,离群值,不良数据以及需要处理的功能,归一化和分类。

代码使用普通的Python脚本
而不是的格式(公平地说,这没什么大不了的),为了简洁起见,只重点介绍了重要部分,但有时很难导航示例文件,这本书确实涵盖了一些实际示例,其中一个在章节中包含机翼数据,另一个在章节中包含路透社语料库,推荐系统还包括一些不错的用例,仅此而已,没有具体的示例,通常看起来像是包含代码片段的完全不同的参考手册,这使得在掌握Python机器学习的扎实经验之前变得尤为重要。

另一个对我没有真正吸引力的是关于深度学习的两章
机器学习算法很好地概述了深度学习,并讨论了卷积神经网络,递归神经网络和其他关键体系结构,但是问题在于,有关Python机器学习的入门书籍已经涵盖了这些概念以及更多内容,因此大多数在本书中走得这么远而不放下手的人都不会在这里找到新的东西。

Python机器学习之旅的中途

那么这本书在使用Python学习机器学习的路线图中处于什么位置?它既不是初学者级别,也不是超高级的,或动手机器学习或在线课程,我建议您学习机器学习算法,否则您将无法充分利用它所提供的丰富内容。


Prev article

想要发挥机器学习的商业价值我们应该从何入手?

Next article

Microsoft Excel数据科学和机器学习简介

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务