首页 > 试题广场 >

谈谈你对ETL过程中数据清洗的认识

[问答题]
谈谈你对ETL过程中数据清洗的认识
1、梳理业务,建立数据模型,构建主数据。
2、数据查漏补缺,无效非法数据替换标记处理。
3、数据格式规范化。
4、过滤冗余重复数据。
发表于 2020-11-16 17:31:05 回复(0)
数据清洗包括一下内容:
数据补缺:对空数据、缺失数据进行数据补缺操作,无法处理的做标记。
数据替换:对无效数据进行数据的替换。
格式规范化:将源数据抽取的数据格式转换成为便于进入仓库处理的目标数据格式。
主外键约束:通过建立主外键约束,对非法数据进行数据替换或导出到错误文件重新处理。
发表于 2019-04-08 23:44:10 回复(0)