机器学习可以做什么和不能做什么?

Q&AQ&A问答

机器学习可以做什么和不能做什么?

来源：CPDA数据分析师网 / 作者：数据君 / 时间：2020-09-09

尽管这两个渠道上的一批机器学习产品可能会减轻业务环境中数据科学的痛苦

但专家警告说，无论新工具的预测能力如何，机器学习都无法解决两个问题1、解决特定业务用例的独特问题2、以及首先清理数据，以便在机器学习工作流程中有价值，机器学习技巧上下文去年，新的机器学习市场进入者专注于围绕映射机器学习算法需要理解的上下文来加速流程，以预测给定业务情况下的需求，例如，如果语音翻译机器学习产品正在侦听客户服务呼叫，以便更快地帮助呼叫操作员显示适当的基于解决方案的内容，那么机器学习产品的项工作就是创建一个本体了解客户的呼叫上下文：产品代码，行业特定语言，品牌商品和其他特殊词汇。

终的机器学习算法具有更高的准确性

而终用户无需先将整个业务特定数据输入产品中就能使其工作，为银行和IT等行业创建了自己的基于垂直方向的特定机器学习引擎，以便他们的机器学习翻译服务可以将正确的短语模型应用于正确的情况，开发这些产品的人们认识到，即使是精确的现成机器学习产品，也需要大量定制和数据科学相关工作才能成为任何给定业务用例中的有效工具。

一代的机器学习工具旨在加速机器学习和预测分析路径中的下一个瓶颈

加快总体数据科学的数据建模过程，并解决特定问题，特定垂直行业的痛点，机器学习的数据建模数据建模阶段通常需要数据科学家迭代多个数据模型并针对历史数据集运行它们，以便确定准确的预测模型，该过程非常缓慢且繁琐，在等待机器学习模型测试完成时寻找了如何利用停机时间来解决生产力问题的方法（出人意料的是，健身是填补时间的一种方式：俯卧撑，伸展运动，或批处理足够的数据建模工作，以便有时间离开办公室去攀岩都是很受欢迎的回应。）

在数据科学中，创建模型是一个迭代过程

您创建模型，运行它们，将结果与历史准确性进行比较，然后将准确的模型投入生产，因此通常包括三个步骤：训练，调整和测试。我们所做的就是将其合并为一个，对于数据科学家来说，这可能是一个巨大的节省时间，并减少了数据模型的上市时间。

版本中的新功能提供了自动建模工具

自行进行所有迭代数据建模，直到出现具有一致精度的单个数据模型为止，在任何，我们的客户可能已经生产了数百或数千个模型，与拥有早期版本软件的现有客户共同创建的，自动建模功能已针对包括欺诈检测，确定和降低保险费率在内的商业案例进行了测试，并在用于客户细分和评分的营销应用程序中进行了测试。

机器学习以了解何时运行数据模型

在预测实际运行的大规模机器学习数据模型实验的计算资源成本，随着数据模型使用不断增长的数据量，需要使用机器学习来了解建模过程的成本将帮助企业确定正确的收益在哪里，我们的模型管理工具记录了所有内容：我完成了哪些流程？随着数据科学过程的发展，特定模型的性能如何？我们称此为基本模型质量，您希望能够看到数据模型应用程序一直使用的资源，直到CPU发生变化为止。

计算和数据科学可以齐头并进

看到一个模型视图，哪个模型效果，每个模型使用了多少资源，机器学习服务内容，加速Web应用程序的机器学习产品，优化了如何在Web浏览器和移动设备中加载HTML和JavaScript代码，可确定收集和分析所需交付的代码/内容所需的样本数量，以实现性能。该方法也可以水平扩展，并且在资源增加时，资源的扩展将类似于增加额外的硬件容量，根据客户的Web应用程序使用情况来整理数据，然后开始研究如何提高性能，一旦算法对一些实际请求进行了采样，它就会变得越来越聪明，并且可以注意到终用户的行为模式何时发生变化。

利用了数据技术堆栈以及他们自己创建的工具

我们使用了许多现有的解决方案，例如R但是对于生产实现，我们终构建了一些解决方案，由于特定的用例，并且它是我们分布式体系结构的核心部分，因此我们围绕自身技术进行了研究，作为服务的一部分，我们确实将在我们的解决方案中采用现有的开源技术。

系统基本上具有完整的代理，它将在服务和终用户的浏览器之间发送和接收数据

还将与客户的后端Web服务器基础结构进行通信，计算层从终用户的浏览器接收配置文件信息，并进行所有分析和学习，正确的代码优化，它就会将其传递给完整的代理层，以便将来的请求受益于预先发送什么代码以及仅需要发送什么代码的知识。

Prev article

数据管理的状态–为什么数据仓库项目失败

返回列表

Next article

数据安全的致命缺陷？