为什么下一个大型数据库决策可能是图表
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2021-02-02
图形数据库是一种通用的数据库管理系统
其中数据关系被视为一等公民。虽然听起来不错,但这是什么意思呢?让我们分解一下,图形数据库存储单个数据点(例如键值对或文档),但它也存储它们之间的数据关系。实际上,这些关系至关重要,一个图形数据库“此事关系之多,如果没有超过,数据本身,这导致了一个误解,图数据库只对社会有益的想法是一个普遍的误解,三年前这种说法更加普遍,这是一个特别危险的神话,因为它是部分正确的!社交数据非常适合图数据库,是的选择,甚至不一定是合适的选择,对于许多人来说,这只是直观的选择,
愉快地承担了通用数据库的角色
也许是这样,图数据库“通用工作负载是非典型的”,并且这是一个(错误的)观念,但这并不是说它们是利基市场,这种以关系为中心的数据视图带来了许多好处,其中明显的好处是性能,当您拥有高度连接的数据集时(例如,在欺诈检测系统,推荐引擎或身份管理应用程序中),图形数据库的运行速度将比关系数据库快得多。
图形数据库可以轻松地比关系数据库快一百万倍
这种说法听起来太神奇了,当我退缩时尽管数据大小增加了1000倍,但性能基本上提高了1000倍,换句话说即使数据库大小增加,图形数据库也可以加快横向速度并保持性能,这种类型的性能改进是“红色药丸”,它允许图形数据库帮助解决以下问题:
1、实时跟踪和制止欺诈行为,而不仅仅是在事后发现欺诈行为
2、根据当前会话和历史数据提供丰富的实时建议(例如,阿迪达斯使用Neo4j根据当前会话行为提供高度定制的内容,以使其在线页面“更具粘性”并增加销售)
3、提供客户的360度视角
4、使用的网络拓扑来做出关键的操作决策(例如,eBay和其他知名包裹递送提供商将受益于该图实时检测和更改路线连接的能力)
5、通过实时身份和访问管理立即招揽新客户
6、一张图统治所有人
通常如何使用图形数据库
毕竟,还有许多其他NoSQL数据库或多或少适用于相同类型的问题,其中一些(如文档数据库)旨在成为满足大多数数据需求的一站式服务,一刀切的全能数据库时代已经结束,终大多数具有适当规模和范围的应用程序将使用多个数据库,数据架构师的作用将是查看其大型数据集(因为所有数据集很大或很大),并标识数据和工作负载中的形状,对于表格部分,将其放在关系数据库中,对于简单大量的键值对高瘦表将其放入键值存储,对于那些混乱,不断变化或高度连接的零件,请将其放入图形数据库中。
换句话说,图数据库无法做到这一切,全部完成数据库实际上是一个坏主意。
即我们将进入数据库的“多语言持久性”时代
在这种情况下,任何体面的企业都将针对不同种类的数据使用各种不同的数据存储技术,这就是显影剂疲劳,学习20个不同的数据库来处理20种不同类型的数据听起来很不错,但实际上这是不切实际的,我们终得到了Oracle,Microsoft SQL Server,MySQL和Postgres(以及IBM DB2,用于数量减少的人群),决定终止NoSQL技能指数所表明的那样,在NoSQL领域我们正在着手 于一些通用的NoSQL数据库(尤其是MongoDB和Cassandra)而图数据库扮演着越来越重要的角色,尽管仍然是专门的。
不满足于成为大型数据故事的一小部分
平等正如他告诉我的那样,为您的项目提供个数据库的概念,大多数项目将从小规模开始,然后从一个数据库开始,我们越来越看到在这种情况下使用Neo4j,因此首先是平等的“数据库之王。”这是一个乐观的观点,但是可信吗?当然可以可靠地声称 其生产部署是任何其他图形数据库的五到十倍,但是图形数据库真的可以像文档或宽列NoSQL数据库那样具有通用性吗?
总的来说我相信将比MongoDB和Cassandra这样的系统得到更广泛的采用
那里有很多数据库可以存储和检索孤立的数据元素,无论它们是键值对还是文档或行。但是,尽管图形数据库也可以做到这一点,愿望远不止是翻转磁盘上的位:我们希望了解数据并通过数据中的连接实时提供见解,尽管有些人会质疑通用图形数据库的概念,但问题的一部分似乎是对图形的固定,到目前为止,我们一直在强调纯图形用例因为我们希望人们了解它与所有其他数据库的不同之处,而且其中一些用例非常强大且与众不同,它们基本上其他任何技术都无法解决,这是发展市场的惊人基础。
建立在图形上的未来?
其中数据关系被视为一等公民。虽然听起来不错,但这是什么意思呢?让我们分解一下,图形数据库存储单个数据点(例如键值对或文档),但它也存储它们之间的数据关系。实际上,这些关系至关重要,一个图形数据库“此事关系之多,如果没有超过,数据本身,这导致了一个误解,图数据库只对社会有益的想法是一个普遍的误解,三年前这种说法更加普遍,这是一个特别危险的神话,因为它是部分正确的!社交数据非常适合图数据库,是的选择,甚至不一定是合适的选择,对于许多人来说,这只是直观的选择,
愉快地承担了通用数据库的角色
也许是这样,图数据库“通用工作负载是非典型的”,并且这是一个(错误的)观念,但这并不是说它们是利基市场,这种以关系为中心的数据视图带来了许多好处,其中明显的好处是性能,当您拥有高度连接的数据集时(例如,在欺诈检测系统,推荐引擎或身份管理应用程序中),图形数据库的运行速度将比关系数据库快得多。
图形数据库可以轻松地比关系数据库快一百万倍
这种说法听起来太神奇了,当我退缩时尽管数据大小增加了1000倍,但性能基本上提高了1000倍,换句话说即使数据库大小增加,图形数据库也可以加快横向速度并保持性能,这种类型的性能改进是“红色药丸”,它允许图形数据库帮助解决以下问题:
1、实时跟踪和制止欺诈行为,而不仅仅是在事后发现欺诈行为
2、根据当前会话和历史数据提供丰富的实时建议(例如,阿迪达斯使用Neo4j根据当前会话行为提供高度定制的内容,以使其在线页面“更具粘性”并增加销售)
3、提供客户的360度视角
4、使用的网络拓扑来做出关键的操作决策(例如,eBay和其他知名包裹递送提供商将受益于该图实时检测和更改路线连接的能力)
5、通过实时身份和访问管理立即招揽新客户
6、一张图统治所有人
通常如何使用图形数据库
毕竟,还有许多其他NoSQL数据库或多或少适用于相同类型的问题,其中一些(如文档数据库)旨在成为满足大多数数据需求的一站式服务,一刀切的全能数据库时代已经结束,终大多数具有适当规模和范围的应用程序将使用多个数据库,数据架构师的作用将是查看其大型数据集(因为所有数据集很大或很大),并标识数据和工作负载中的形状,对于表格部分,将其放在关系数据库中,对于简单大量的键值对高瘦表将其放入键值存储,对于那些混乱,不断变化或高度连接的零件,请将其放入图形数据库中。
换句话说,图数据库无法做到这一切,全部完成数据库实际上是一个坏主意。
即我们将进入数据库的“多语言持久性”时代
在这种情况下,任何体面的企业都将针对不同种类的数据使用各种不同的数据存储技术,这就是显影剂疲劳,学习20个不同的数据库来处理20种不同类型的数据听起来很不错,但实际上这是不切实际的,我们终得到了Oracle,Microsoft SQL Server,MySQL和Postgres(以及IBM DB2,用于数量减少的人群),决定终止NoSQL技能指数所表明的那样,在NoSQL领域我们正在着手 于一些通用的NoSQL数据库(尤其是MongoDB和Cassandra)而图数据库扮演着越来越重要的角色,尽管仍然是专门的。
不满足于成为大型数据故事的一小部分
平等正如他告诉我的那样,为您的项目提供个数据库的概念,大多数项目将从小规模开始,然后从一个数据库开始,我们越来越看到在这种情况下使用Neo4j,因此首先是平等的“数据库之王。”这是一个乐观的观点,但是可信吗?当然可以可靠地声称 其生产部署是任何其他图形数据库的五到十倍,但是图形数据库真的可以像文档或宽列NoSQL数据库那样具有通用性吗?
总的来说我相信将比MongoDB和Cassandra这样的系统得到更广泛的采用
那里有很多数据库可以存储和检索孤立的数据元素,无论它们是键值对还是文档或行。但是,尽管图形数据库也可以做到这一点,愿望远不止是翻转磁盘上的位:我们希望了解数据并通过数据中的连接实时提供见解,尽管有些人会质疑通用图形数据库的概念,但问题的一部分似乎是对图形的固定,到目前为止,我们一直在强调纯图形用例因为我们希望人们了解它与所有其他数据库的不同之处,而且其中一些用例非常强大且与众不同,它们基本上其他任何技术都无法解决,这是发展市场的惊人基础。
建立在图形上的未来?
但这不是终的结果,这种策略使人们想到今天的图形数据库可能仅在处理高度连接的数据时才有用,事实是它已被用作全球事务,运营业务应用程序的主要数据存储,Neo4j解决了很多问题,因为它是一个图形数据库,但这并不意味着它只能解决“图形问题”,Neo4j成为了各种通用数据库还没有呢,图形数据库虽然有些小众,但它们正在添加功能(在OrientDB的情况下转向多模型)以使其更具通用性,尽管如此,很高兴看到Neo4j将领先的图形数据库超越其图形根源,这可能会促使所有NoSQL数据库在更高程度上强调数据关系,这将是一件非常好的事情。
商业联合会数据分析专业委员会