专栏名称: 迪答数据
大数据(flink,kafka,spark,hadoop),程序语言(java,scala,Python),用户画像,数据分析,资源分享......这里有技术,但不只技术;点点滴滴,些许用处,滴滴答答,终能穿石。
今天看啥  ›  专栏  ›  迪答数据

如何保障数据质量

迪答数据  · 公众号  ·  · 2024-05-25 18:39
    

文章预览

一、概述 大数据时代,数据资产及其价值利用能力逐渐成为构成企业核心竞争力的关键要素;然而,大数据应用必须建立在质量可靠的数据之上才有意义,建立在低质量甚至错误数据之上的应用有可能与其初心南辕北辙背道而驰。因此, 数据质量正是企业应用数据的瓶颈,高质量的数据可以决定数据应用的上限,而低质量的数据则必然拉低数据应用的下限。 数据质量,主要从四个方面进行评估,即完整性、准确性、一致性和及时性,本文将会结合业务流程和数据处理流程,对这个四个方面进行详细的分析和讲解。 二、 四大关注点 本节,先简单地聊一下数据质量需要关注的四个点:即完整性、准确性、一致性和及时性。这四个关注点,会在我们的数据处理流程的各个环节有所体现。 (1)完整性 完整性是指数据的记录和信息是否完整,是否存在 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览