专栏名称: 大数据范式
技术、人生、架构、成长、大厂、副业。资料库,宝藏库,资源库,福利库,知识库。
今天看啥  ›  专栏  ›  大数据范式

数据治理指南手册(文档)

大数据范式  · 公众号  ·  · 2024-09-09 11:26

文章预览

上一篇: 数据仓库建设项目方案(文档) 下一篇: BI项目需求分析书模板(文档) 数据治理指南 数据治理指南 不同行业有不同的评估数据质量的标准。对于 Hive 数仓来说,数据质量可以从完整性、准确性、一致性和及时性共四个角度进行评估。 完整性 完整性是指数据的记录和信息是否完整,是否存在数据缺失情况。数据缺失主要包括记录的缺失和具体某个字段信息的缺失,两者都会造成统计结果不准确。 完整性是数据质量最基础的保障。例如,某个稳定业务的数据量每天约为100万条记录,某天突然下降了1万条,则可能是出现了记录缺失。例如,某科高考成绩表中,每个考卷分数都对应一个准考证号,当准考证号字段的空值数大于0时,则可能是出现了信息缺失。 准确性 准确性是指数据中记录的信息和数据是否准确、是否存在异常或者错误的 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览