ISBN/价格: | 978-7-121-42169-3:CNY69.00 |
---|---|
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | 大数据技术及应用/.严宣辉 ... [等] 编著 |
出版发行项: | 北京:,电子工业出版社:,2021 |
载体形态项: | xii, 345页:;+图:;+26cm |
丛编项: | 新工科·数据科学与大数据系列 |
提要文摘: | 本书共9章,围绕大数据的基本概念和大数据处理的主要环节编写。第1章介绍大数据的基础知识,包括大数据的基本概念、价值和作用等;第2章介绍大数据实验环境构建,主要内容包括在Windows系统中安装Linux虚拟机及构建Hadoop集群的方法等;第3章介绍数据采集与预处理,主要内容包括常用数据采集工具的使用方法及数据预处理的方法等;第4章介绍Hadoop分布式文件系统,首先介绍了Hadoop的发展历史、优势、生态系统和核心组件等,然后以HDFS为重点,介绍了其体系结构和特点,并详细介绍了HDFS的交互式命令;第5章介绍HBase基础与应用;第6章介绍Hive基础与应用;第7章介绍分布式计算框架MapReduce;第8章介绍数据分析与挖掘;第9章介绍数据可视化,主要内容包括数据可视化的常用方法及常用工具等。 |
题名主题: | 数据处理 |
中图分类: | TP274 |
个人名称等同: | 严宣辉 编著 |
个人名称等同: | 张仕 编著 |
个人名称等同: | 赖会霞 编著 |
记录来源: | CN 广东新华发行集团股份有限公司 20211028 |