欢迎访问学兔兔,学习、交流 分享 !

返回首页 |
当前位置: 首页 > 书籍手册>计算机与网络 >大数据技术与应用丛书 大数据项目实战 黑马程序员 编著 2020年版

大数据技术与应用丛书 大数据项目实战 黑马程序员 编著 2020年版

收藏
  • 大小:28.52 MB
  • 语言:中文版
  • 格式: PDF文档
  • 类别:计算机与网络
  • 更新日期:2024-04-23
推荐:升级会员 无限下载,节约时间成本!
关键词:黑马   实战   数据   项目   程序员
资源简介
大数据技术与应用丛书 大数据项目实战
作者:黑马程序员 编著
出版时间: 2020年版
丛编项: 大数据技术与应用丛书
内容简介
  《大数据项目实战/大数据技术与应用丛书》讲解了一个大数据综合项目——招聘网站职位分析。全书共分为6章,内容分别是项目概述、搭建大数据集群环境、数据采集、数据预处理、数据分析与数据可视化。《大数据项目实战/大数据技术与应用丛书》附有配套资源,包括源代码、教学设计、教学课件等资源。同时为了帮助初学者更好地学习《大数据项目实战/大数据技术与应用丛书》内容,还提供了在线答疑,欢迎读者关注。《大数据项目实战/大数据技术与应用丛书》适用于高等院校本、专科计算机相关专业大数据项目实训课程的教学,书中的具体项目,有助于读者综合运用大数据课程知识及各种工具软件,实现大数据分析全流程操作。
目录
第1章 项目概述
1.1 项目需求和目标
1.2 预备知识
1.3 项目架构设计及技术选取
1.4 开发环境和开发工具介绍
1.5 项目开发流程
小结
第2章 搭建大数据集群环境
2.1 安装准备
2.1.1 虚拟机安装与克隆
2.1.2 虚拟机网络配置
2.1.3 SSH服务配置
2.2 Hadoop集群搭建
2.2.1 JDK安装
2.2.2 Hadoop安装
2.2.3 Hadoop集群配置
2.2.4 Hadoop集群测试
2.2.5 通过UI界面查看Hadoop运行状态
2.3 Hive安装
2,3.1 Hive的安装模式
2.3.2 Hive的安装
2.4 Sqoop安装
小结
第3章 数据采集
3.1 知识概要
3.1.1 数据源分类
3.1.2 HTTP请求过程
3.1.3 认识HttpClient
3.2 分析与准备
3.2.1 分析网页数据结构
3.2.2 数据采集环境准备
3.3 采集网页数据
3.3.1 创建响应结果JavaBean类
3.3.2 封装HTTP请求的工具类
3.3.3 封装存储在HDFS的工具类
3.3.4 实现网页数据采集
小结
第4章 数据预处理
4.1 分析预处理数据
4.2 设计数据预处理方案
4.3 实现数据的预处理
4.3.1 数据预处理环境准备
4.3.2 创建数据转换类
4.3.3 创建实现Map任务的Mapper类
4.3.4 创建并执行MapReduce程序
4.4 将数据预处理程序提交到集群中运行
小结
第5章 数据分析
5.1 数据分析概述
5.2 Hive数据仓库
5.2.1 什么是Hive
5.2.2 设计Hive数据仓库
5.2.3 实现数据仓库
5.3 分析数据
5.3.1 职位区域分析
5.3.2 职位薪资分析
5.3.3 公司福利分析
5.3.4 职位技能要求分析
小结
……
第6章 数据可视化
下载地址