数据海啸袭击医疗保健
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-06-24
大数据促进健康
大数据是用于监视和保护公共健康的重要工具,从数百万人收集医疗数据,将其匿名化然后汇总在一起作为分析的基础,大量的数据使得有可能基于算法模型得出具有统计学意义的发现,这些算法模型可以预测哪些人群面临某些疾病的风险。
有几个例子说明了美国如何利用大数据来改善医疗质量
收集遗传信息,生物样本以及有关其医疗状况的其他信息,以预防和改善疾病的治疗,疾病控制中心正在开发模型,以识别人群中有肥胖风险的人群,从而允许在早期就进行医学干预,医学数据库已使用大数据来确定糖尿病患者比其他人群罹患精神疾病的风险更高。
由于医疗技术互联网的进步,医学数据对于研究来说更加丰富
大多数设备都连接到计算机网络以收集和传输医疗数据,通常监视患者,执行实验室测试或捕获医学图像的医疗设备会将结果上传到中央数据中心进行分析,此外越来越多的人配备了可穿戴设备,以监控他们的心率,糖水平,UVA暴露等。因此,预计到2025年,医疗保健数据的增长将比制造业,金融服务或媒体的增长快,复合年增长率(CAGR)为36%。
挖掘大数据的技术复杂性
依赖海量数据集的算法可能需要大量的计算能力,模型的准确性与它可以快速可靠地提取和处理的数据量直接相关,传统数据仓库或其他数据存储经常会碰到资源壁垒,或者只是花费太长时间来访问和执行数据分析,添加更多的软件节点或硬件服务器以处理更多的数据并不总是可行或有效的,添加更多软件会增加数据管理的复杂性,而不能保证结果,在硬件方面,添加其他基于CPU的服务器具有局限性,可能会耗尽数据中心可用的财务资源,有限的空间,电源和冷却资源。
有些解决方案是专为分段和分析海量数据存储而设计的
在GPU处理器上运行的数据加速平台可以利用并行处理来显着增加可分析的数据量,同时加快分析速度并程度地减少对大量昂贵服务器的需求,这种类型的架构还可以减少得出结论的时间,从而可以挽救生命,一位癌症研究人员将运行在GPU上的数据库加速器归因于通过使数据分析运行速度提高100倍来缩短癌症研究的年限。
当许多传统的大数据平台 进行扩展以处理为医学研究而收集的大量数据集时它们可能变得非常昂贵
但是可以将计算资源与存储脱钩,因此公司可以仅扩展存储,仅扩展计算或同时扩展两者,从而在降低资源需求的同时大大提高了性能,这种共享数据架构使医学研究人员可以更轻松,更经济高效地进行扩展,以使用相同的资源提取和分析大量数据。
公共政策和医疗保健组织变得越来越以数据为主导
随着涌入新的数据点以支持全面而复杂的研究,组织管理数据的能力将直接影响其见解的智慧,设计用于更快,更节省资源的处理以及更好,更快的医学数据分析的更智能体系结构可以导致更快的医学突破,从而减少各种疾病的传播。
免费客服热线:400-050-6600
商业联合会数据分析专业委员会