图书介绍
Hadoop高级数据分析 使用Hadoop生态系统设计和构建大数据系统PDF|Epub|txt|kindle电子书版本网盘下载
![Hadoop高级数据分析 使用Hadoop生态系统设计和构建大数据系统](https://www.shukui.net/cover/65/34595713.jpg)
- (美)Kerry Koitzsch著;王建峰,王瑛琦,于金峰译 著
- 出版社: 北京:清华大学出版社
- ISBN:9787302487302
- 出版时间:2018
- 标注页数:227页
- 文件大小:23MB
- 文件页数:238页
- 主题词:数据处理软件
PDF下载
下载说明
Hadoop高级数据分析 使用Hadoop生态系统设计和构建大数据系统PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第Ⅰ部分 概念3
第1章 概述:用Hadoop构建数据分析系统3
1.1构建DAS的必要性4
1.2 Hadoop Core及其简史4
1.3 Hadoop生态系统概述5
1.4 AI技术、认知计算、深度学习以及BDA6
1.5自然语言处理与BDAS6
1.6 SQL与NoSQL查询处理6
1.7必要的数学知识7
1.8设计及构建BDAS的循环过程7
1.9如何利用Hadoop生态系统实现BDA10
1.10“图像大数据”(IABD)基本思想10
1.10.1使用的编程语言12
1.10.2 Hadoop生态系统的多语言组件12
1.10.3 Hadoop生态系统架构13
1.11有关软件组合件与框架的注意事项13
1.12 Apache Lucene、 Solr及其他:开源搜索组件14
1.13建立BDAS的架构15
1.14你需要了解的事情15
1.15 数据可视化与报表17
1.15.1使用Eclipse IDE作为开发环境18
1.15.2本书未讲解的内容19
1.16本章小结21
第2章 Scala及Python进阶23
2.1动机:选择正确的语言定义应用23
2.2 Scala概览24
2.3 Python概览29
2.4错误诊断、调试、配置文件及文档31
2.4.1 Python的调试资源32
2.4.2 Python文档33
2.4.3 Scala的调试资源33
2.5编程应用与示例33
2.6本章小结34
2.7参考文献34
第3章 Hadoop及分析的标准工具集35
3.1库、组件及工具集:概览35
3.2在评估系统中使用深度学习方法38
3.3使用Spring框架及Spring Data44
3.4数字与统计库:R、Weka及其他44
3.5分布式系统的OLAP技术44
3.6用于分析的Hadoop工具集:Apache Mahout及相关工具45
3.7 Apache Mahout的可视化46
3.8 Apache Spark库与组件46
3.8.1可供选择的不同类型的shell46
3.8.2 Apache Spark数据流47
3.8.3 Sparkling Water与H2O机器学习48
3.9组件使用与系统建立示例48
3.10封包、测试和文档化示例系统50
3.11本章小结51
3.12参考文献51
第4章 关系、NoSQL及图数据库53
4.1图查询语言:Cypher及Gremlin55
4.2 Cypher示例55
4.3 Gremlin示例56
4.4图数据库:Apache Neo4J58
4.5关系数据库及Hadoop生态系统59
4.6 Hadoop以及UA组件59
4.7本章小结63
4.8参考文献64
第5章 数据管道及其构建方法65
5.1基本数据管道66
5.2 Apache Beam简介67
5.3 Apache Falcon简介68
5.4数据源与数据接收:使用Apache Tika构建数据管道68
5.5计算与转换70
5.6结果可视化及报告71
5.7本章小结74
5.8参考文献74
第6章 Hadoop、Lucene、Solr与高级搜索技术75
6.1 Lucene/Solr生态系统简介75
6.2 Lucene查询语法76
6.3使用Solr的编程示例79
6.4使用ELK栈(Elasticsearch、Logstash、Kibana)85
6.5 Solr与Elasticsearch:特点与逻辑93
6.6应用于Elasticsearch和Solr的Spnng Data组件95
6.7使用LingPipe和GATE实现定制搜索99
6.8本章小结108
6.9参考文献108
第Ⅱ部分 架构及算法111
第7章 分析技术及算法概览111
7.1算法类型综述111
7.2统计/数值技术112
7.3贝叶斯技术113
7.4本体驱动算法114
7.5混合算法:组合算法类型115
7.6代码示例116
7.7本章小结119
7.8参考文献119
第8章 规则引擎、系统控制与系统编排121
8.1规则系统oss Drools介绍121
8.2基于规则的软件系统控制124
8.3系统协调与oss Drools125
8.4分析引擎示例与规则控制126
8.5本章小结129
8.6参考文献129
第9章 综合提升:设计一个完整的分析系统131
9.1本章小结136
9.2参考文献136
第Ⅲ部分 组件与系统139
第10章 数据可视化:可视化与交互分析139
10.1简单的可视化139
10.2 Angular JS和Friends简介143
10.3使用JHipster集成Spring XD和Angular JS143
10.4使用d3.js、sigma.js及其他工具152
10.5本章小结153
10.6参考文献153
第Ⅳ部分 案例研究与应用157
第11章 生物信息学案例研究:分析显微镜载玻片数据157
11.1生物信息学介绍157
11.2自动显微镜简介159
11.3代码示例:使用图像填充HDFS162
11.4本章小结165
11.5参考文献165
第12章 贝叶斯分析组件:识别信用卡诈骗167
12.1贝叶斯分析简介167
12.2贝叶斯组件用于信用卡诈骗检测169
12.3本章小结172
12.4参考文献172
第13章 寻找石油:使用Apache Mahout分析地理数据173
13.1基于领域的Apache Mahout推理介绍173
13.2智能制图系统和Hadoop分析179
13.3本章小结180
13.4参考文献180
第14章 “图像大数据”系统:一些案例研究181
14.1图像大数据简介181
14.2使用HIPI系统的第一个代码示例184
14.3 BDA图像工具包利用高级语言功能187
14.4究竟什么是图像数据分析?187
14.5交互模块和仪表板189
14.6添加新的数据管道和分布式特征查找189
14.7示例:分布式特征查找算法190
14.8 IABD工具包中的低级图像处理程序194
14.9术语194
14.10本章小结195
14.11参考文献195
第15章 构建通用数据管道199
15.1示例系统的体系架构和描述199
15.2如何获取和运行示例系统200
15.3管道构建的五大策略200
15.3.1从数据源和接收装置工作200
15.3.2由中间向外发展200
15.3.3基于企业集成模式(EIP)的开发200
15.3.4基于规则的消息管道开发201
15.3.5控制+数据(控制流)管道202
15.4本章小结202
15.5参考文献203
第16章 大数据分析的总结与展望205
16.1总结205
16.2大数据分析的现状206
16.3“孵化项目”和“初期项目”208
16.4未来Hadoop及其后续思考209
16.5不同观点:目前Hadoop的替代方案211
16.6在“未来Hadoop”中使用机器学习和深度学习技术211
16.7数据可视化和BDA的前沿领域212
16.8结束语212
附录A 设置分布式分析环境215
附录B 获取、安装和运行示例分析系统227