大家都在看
什么是结构化数据和非结构化数据?什么是数据清洗?
最佳答案
(1)所谓的结构化数据,指的是存储在数据库中的数据。这种数据常见于企业ERP、财务系统、医疗HIS数据库、教育一卡通、政府行政审批以及其他核心数据库等应用中。这些应用通常需要高效存储方案,数据备份,数据共享,以及数据容灾等方面的支持。(2)非结构化数据则是指那些字段长度可变,且每个字段的记录可能包含可重复或不可重复的子字段的数据。这类数据不仅适用于处理结构化数据,如数字和符号,也更适合处理非结构化数据,如文本、图像、音频、视频和超媒体等。(3)数据清洗是数据处理过程中的最后一步,它涉及发现并纠正数据文件中的错误。这包括检查数据的一致性,处理无效值和缺失值等。与问卷审核不同,数据清洗通常是由计算机自动完成的,而不是人工操作。数据清洗的原理是利用技术手段,如数理统计、数据挖掘或预定义的清洗规则,从数据中检测和消除错误数据、不完整数据和重复数据,以提升数据质量。审计人员在制定业务知识和清洗规则时,需要依赖自身的积累和综合判断能力。因此,审计人员应按照以下标准来评价审计数据的质量:准确性、完整性、一致性、唯一性和效性。
声明:知趣百科所有作品均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请在页面底部查找“联系我们”的链接,并通过该渠道与我们取得联系以便进一步处理。