ISBN/价格: | 978-7-5606-5460-7:CNY22.00 |
---|---|
作品语种: | chi |
出版国别: | CN 610000 |
题名责任者项: | 数据清洗基础与实践/.主编谢东亮, 黄天春 |
出版发行项: | 西安:,西安电子科技大学出版社:,2019.08 |
载体形态项: | 130页:;+图:;+26cm |
丛编项: | 高等学校大数据系列教材 |
提要文摘: | 本书分为两篇, 共九章, 系统地讲解了数据清洗的理论与实践。第一篇为基础篇, 其中第一章介绍数据清洗的基本概念、数据标准化以及数据仓库的概念等; 第二章介绍数据格式类型与数据编码, 从文件以及文本的格式、文档的归档与压缩、字符编码与数据转换方面做了介绍;第三章对最常用的文本与电子表格数据清洗做了介绍;第四章介绍了数据清洗的基本技术、方法与工具;第五章从文本、Web文件、数据库数据的抽取方面做了介绍; 第六章介绍了数据的转换与加载和数据的质量评估。第二篇为实战篇, 其中第七章介绍了五种常用的数据清洗工具; 第八章专门讲解了如何对Web的数据进行采集及预处理; 第九章介绍了从RDBMS数据源中获取数据及进行数据的脱敏、清洗等操作。 |
题名主题: | 数据处理 高等学校 教材 |
中图分类: | TP274 |
个人名称等同: | 谢东亮 主编 |
个人名称等同: | 黄天春 主编 |
记录来源: | CN CDT 20201030 |