var _hmt = _hmt || []; (function() {   var hm = document.createElement("script");   hm.src = "https://hm.baidu.com/hm.js?8c9c5a8618dc4aea3be27b32962e5871";   var s = document.getElementsByTagName("script")[0];    s.parentNode.insertBefore(hm, s); })();
400 050 6600
数据分析师

手机号

验证码

30天自动登录

Microsoft Excel数据科学和机器学习简介

来源:CPDA数据分析师网 / 作者:数据君 / 时间:2021-04-30

掌握机器学习是一个困难的过程
您需要从扎实的线性代数和微积分知识入手,掌握Python等编程语言,并精通数据科学和机器学习库,而且如果您想创建集成和扩展的机器学习系统,则必须学习诸如云平台,自然并不是每个人都需要成为机器学习工程师,但是几乎每个经营系统地进行收集和处理的业务或组织的人都可以从数据科学和机器学习的一些知识中受益,幸运的是有几门课程提供了有关机器学习和深度学习的高级概述,而又没有太深入地介绍数学和编码,但是以我的经验,对数据科学和机器学习有一个很好的了解需要对算法有一定的实践经验。在这方面,Microsoft Excel是一个非常有价值且经常被忽视的工具。

通过excel书籍封面学习数据挖掘
通过Excel学习数据挖掘,逐步理解机器学习方法的方法,对大多数人来说,MS Excel是一个电子表格应用程序,它以表格格式存储数据并执行非常基本的数学运算,但是实际上,Excel是可以解决复杂问题的强大计算工具,Excel还具有许多功能,可让您直接在工作簿中创建机器学习模型,虽然多年来我一直在使用Excel的数学工具,但直到选择了通过Excel学习数据挖掘,了解机器的分步方法,我才开始欣赏它在学习和应用数据科学和机器学习中的用途。

通过Excel学习数据挖掘一步一步地介绍了机器学习的基础知识
并展示了如何使用基本的Excel函数和应用程序的一些高级工具来实现许多算法,尽管Excel绝不会取代Python机器学习,但它是学习AI基础知识和解决许多基本问题而无需编写代码的绝佳窗口。

使用Excel进行线性回归机器学习
线性回归是一种简单的机器学习算法,在分析数据和预测结果方面有许多用途,当数据以表格格式整齐地排列时,线性回归特别有用,Excel具有多项功能,使您可以从电子表格中的表格数据创建回归模型,数据图表工具是直观的工具之一,它是强大的数据可视化功能,例如散点图在笛卡尔平面上显示数据的值,但是除了显示数据的分布之外,Excel的图表工具还可以创建机器学习模型,该模型可以预测数据值的变化,可根据您的数据创建回归模型,您可以将趋势线设置为几种回归算法之一,包括线性,多项式,对数和指数,您还可以配置图表以显示机器学习模型的参数,您可以将其用于预测新观察的结果。

您可以将多个趋势线添加到同一图表
这样可以轻松快速地测试和比较数据上不同机器学习模型的性能。

1、excel数据科学机器学习-趋势线
2、Excel的趋势线功能可以根据您的数据创建回归模型。

除了探索图表工具之外
通过Excel学习数据挖掘还将带您完成其他几个过程,这些过程可以帮助开发更高级的回归模型,这些包括诸如LINEST和LINREG公式之类的公式,它们可以根据您的训练数据计算机器学习模型的参数,作者还将带您逐步使用Excel的基本公式创建线性回归模型。这是本书中反复出现的主题,您将看到机器学习模型的数学公式,学习其背后的基本推理,并通过在多个单元格和单元格数组中组合值和公式逐步创建模型,尽管这可能不是进行生产级数据科学工作的有效方法,但它无疑是学习机器学习算法工作原理的一种非常好的方法。

其他使用Excel的机器学习算法
除了回归模型,您还可以将Excel用于其他机器学习算法,通过Excel学习数据挖掘提供了丰富的监督和非监督机器学习算法,包括k均值聚类,k近邻,朴素贝叶斯分类和决策树,该过程有时会有些混乱,但是如果您按计划进行,那么逻辑很容易就位。例如,在k-means聚类一章中,您将在多个工作表中使用大量Excel公式和功能(INDEX,IF,AVERAGEIF,ADDRESS等),以计算聚类中心并对其进行优化。这不是进行群集的一种非常有效的方法,当群集在每个连续的工作表中逐渐完善时,您就可以跟踪和研究它们,从教育的角度来看,这种体验与编程书籍大不相同,在编程书籍中,您提供了数据点的机器学习库功能,并且可以输出群集及其属性。

用Excel进行k均值聚类
在Excel上进行k均值聚类时,您可以在连续的工作表上遵循聚类的细化,在决策树一章中,您将完成计算熵并为机器学习模型的每个分支选择特征的过程,同样该过程很慢且需要人工,但是在机器学习算法的幕后看是一种有益的体验,在本书的许多章节中,您都将使用求解器工具来小化损失函数,在这里您将看到Excel的局限性,因为即使是带有十几个参数的简单模型也可能会使计算机的爬网速度变慢,尤其是当数据样本的大小为几百行时,但是当您要微调机器学习模型的参数时,求解器是一个功能特别强大的工具。

excel求解器机器学习
1、Excel的求解器工具可微调模型的参数并使损失函数小化
2、使用Excel进行深度学习和自然语言处理

通过Excel学习数据挖掘表明
Excel甚至可以使用高级的机器学习算法,有一章专门研究了深度学习模型的精心创建。首先,您将创建一个包含少于十二个参数的单层人工神经网络,然后您将扩展该概念,以创建具有隐藏层的深度学习模型,计算非常缓慢且效率低下,但它可以正常工作,并且组成部分相同,单元格值,公式和强大的求解器工具。

使用Microsoft Excel进行深度学习
使用Microsoft Excel进行深度学习可让您深入了解深度神经网络的运行方式,使用Excel创建基本的自然语言处理(NLP)应用程序,以创建情感分析机器学习模型,您将使用公式创建“单词袋”模型,对酒店评论进行预处理和标记化,然后根据肯定和否定关键字的密度对它们进行分类,在此过程中,您将学到很多有关当代AI如何处理语言以及与人类处理书面和口头语言有何不同的知识。

Excel作为机器学习工具
无论您是在公司中制定C级决策,在人力资源部门工作还是在管理供应链和制造工厂,如果您要与数据科学家和AI人员一起工作,那么机器学习的基础知识都将非常重要,同样如果您是报道AI新闻的记者,或是代表使用机器学习的公司工作的PR机构,则在不知道其工作原理的情况下撰写该技术是一个坏主意(我将撰写一篇单独的文章,介绍许多糟糕的AI我每天收到的音高),我认为“通过Excel学习数据挖掘”是一本平稳而快速的阅读书,它将帮助您获得重要的知识。

除了学习基础知识之外

Excel还可以作为您丰富的机器学习工具的强大补充,虽然它不适用于处理大数据集和复杂的算法,但可以帮助可视化和分析较小批量的数据,您从快速的Excel挖掘中获得的结果可以为选择正确的方向和机器学习算法提供相关的见解,以解决当前的问题。


Prev article

机器学习算法加深您的Python ML知识

Next article

大数据可以说已经被驯服了

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务