图书介绍

Hadoop高级数据分析使用Hadoop生态系统设计和构建大数据系统PDF|Epub|txt|kindle电子书版本网盘下载

（美）Kerry Koitzsch著；王建峰，王瑛琦，于金峰译著
出版社：北京：清华大学出版社
ISBN：9787302487302
出版时间：2018
标注页数：227页
文件大小：23MB
文件页数：238页
主题词：数据处理软件

PDF下载

点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示：（请使用BT下载软件FDM进行下载）软件下载地址页直链下载[便捷但速度慢] [在线试读本书] [在线获取解压码]

点击复制MD5值：5891bfc6b4b25ae4918d1209ee35bf5a

下载说明

Hadoop高级数据分析使用Hadoop生态系统设计和构建大数据系统PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

点击复制85GB完整离线版磁力链接到迅雷FDM等BT下载工具进行下载详情点击-查看共享计划

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台）。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用！后期资源热门了。安装了迅雷也可以迅雷进行下载！

（文件页数要大于标注页数，上中下等多册电子书除外）

注意：本站所有压缩包均有解压码： 点击下载压缩包解压工具

图书目录

第Ⅰ部分概念3

第1章概述：用Hadoop构建数据分析系统3

1.1构建DAS的必要性4

1.2 Hadoop Core及其简史4

1.3 Hadoop生态系统概述5

1.4 AI技术、认知计算、深度学习以及BDA6

1.5自然语言处理与BDAS6

1.6 SQL与NoSQL查询处理6

1.7必要的数学知识7

1.8设计及构建BDAS的循环过程7

1.9如何利用Hadoop生态系统实现BDA10

1.10“图像大数据”（IABD）基本思想10

1.10.1使用的编程语言12

1.10.2 Hadoop生态系统的多语言组件12

1.10.3 Hadoop生态系统架构13

1.11有关软件组合件与框架的注意事项13

1.12 Apache Lucene、 Solr及其他：开源搜索组件14

1.13建立BDAS的架构15

1.14你需要了解的事情15

1.15 数据可视化与报表17

1.15.1使用Eclipse IDE作为开发环境18

1.15.2本书未讲解的内容19

1.16本章小结21

第2章 Scala及Python进阶23

2.1动机：选择正确的语言定义应用23

2.2 Scala概览24

2.3 Python概览29

2.4错误诊断、调试、配置文件及文档31

2.4.1 Python的调试资源32

2.4.2 Python文档33

2.4.3 Scala的调试资源33

2.5编程应用与示例33

2.6本章小结34

2.7参考文献34

第3章 Hadoop及分析的标准工具集35

3.1库、组件及工具集：概览35

3.2在评估系统中使用深度学习方法38

3.3使用Spring框架及Spring Data44

3.4数字与统计库：R、Weka及其他44

3.5分布式系统的OLAP技术44

3.6用于分析的Hadoop工具集：Apache Mahout及相关工具45

3.7 Apache Mahout的可视化46

3.8 Apache Spark库与组件46

3.8.1可供选择的不同类型的shell46

3.8.2 Apache Spark数据流47

3.8.3 Sparkling Water与H2O机器学习48

3.9组件使用与系统建立示例48

3.10封包、测试和文档化示例系统50

3.11本章小结51

3.12参考文献51

第4章关系、NoSQL及图数据库53

4.1图查询语言：Cypher及Gremlin55

4.2 Cypher示例55

4.3 Gremlin示例56

4.4图数据库：Apache Neo4J58

4.5关系数据库及Hadoop生态系统59

4.6 Hadoop以及UA组件59

4.7本章小结63

4.8参考文献64

第5章数据管道及其构建方法65

5.1基本数据管道66

5.2 Apache Beam简介67

5.3 Apache Falcon简介68

5.4数据源与数据接收：使用Apache Tika构建数据管道68

5.5计算与转换70

5.6结果可视化及报告71

5.7本章小结74

5.8参考文献74

第6章 Hadoop、Lucene、Solr与高级搜索技术75

6.1 Lucene/Solr生态系统简介75

6.2 Lucene查询语法76

6.3使用Solr的编程示例79

6.4使用ELK栈（Elasticsearch、Logstash、Kibana）85

6.5 Solr与Elasticsearch：特点与逻辑93

6.6应用于Elasticsearch和Solr的Spnng Data组件95

6.7使用LingPipe和GATE实现定制搜索99

6.8本章小结108

6.9参考文献108

第Ⅱ部分架构及算法111

第7章分析技术及算法概览111

7.1算法类型综述111

7.2统计/数值技术112

7.3贝叶斯技术113

7.4本体驱动算法114

7.5混合算法：组合算法类型115

7.6代码示例116

7.7本章小结119

7.8参考文献119

第8章规则引擎、系统控制与系统编排121

8.1规则系统oss Drools介绍121

8.2基于规则的软件系统控制124

8.3系统协调与oss Drools125

8.4分析引擎示例与规则控制126

8.5本章小结129

8.6参考文献129

第9章综合提升：设计一个完整的分析系统131

9.1本章小结136

9.2参考文献136

第Ⅲ部分组件与系统139

第10章数据可视化：可视化与交互分析139

10.1简单的可视化139

10.2 Angular JS和Friends简介143

10.3使用JHipster集成Spring XD和Angular JS143

10.4使用d3.js、sigma.js及其他工具152

10.5本章小结153

10.6参考文献153

第Ⅳ部分案例研究与应用157

第11章生物信息学案例研究：分析显微镜载玻片数据157

11.1生物信息学介绍157

11.2自动显微镜简介159

11.3代码示例：使用图像填充HDFS162

11.4本章小结165

11.5参考文献165

第12章贝叶斯分析组件：识别信用卡诈骗167

12.1贝叶斯分析简介167

12.2贝叶斯组件用于信用卡诈骗检测169

12.3本章小结172

12.4参考文献172

第13章寻找石油：使用Apache Mahout分析地理数据173

13.1基于领域的Apache Mahout推理介绍173

13.2智能制图系统和Hadoop分析179

13.3本章小结180

13.4参考文献180

第14章 “图像大数据”系统：一些案例研究181

14.1图像大数据简介181

14.2使用HIPI系统的第一个代码示例184

14.3 BDA图像工具包利用高级语言功能187

14.4究竟什么是图像数据分析？187

14.5交互模块和仪表板189

14.6添加新的数据管道和分布式特征查找189

14.7示例：分布式特征查找算法190

14.8 IABD工具包中的低级图像处理程序194

14.9术语194

14.10本章小结195

14.11参考文献195

第15章构建通用数据管道199

15.1示例系统的体系架构和描述199

15.2如何获取和运行示例系统200

15.3管道构建的五大策略200

15.3.1从数据源和接收装置工作200

15.3.2由中间向外发展200

15.3.3基于企业集成模式（EIP）的开发200

15.3.4基于规则的消息管道开发201

15.3.5控制＋数据（控制流）管道202

15.4本章小结202

15.5参考文献203

第16章大数据分析的总结与展望205

16.1总结205

16.2大数据分析的现状206

16.3“孵化项目”和“初期项目”208

16.4未来Hadoop及其后续思考209

16.5不同观点：目前Hadoop的替代方案211

16.6在“未来Hadoop”中使用机器学习和深度学习技术211

16.7数据可视化和BDA的前沿领域212

16.8结束语212

附录A 设置分布式分析环境215

附录B 获取、安装和运行示例分析系统227

图书介绍

Hadoop高级数据分析 使用Hadoop生态系统设计和构建大数据系统PDF|Epub|txt|kindle电子书版本网盘下载

PDF下载

下载说明

Hadoop高级数据分析 使用Hadoop生态系统设计和构建大数据系统PDF格式电子书版下载

图书目录

热门推荐

Hadoop高级数据分析使用Hadoop生态系统设计和构建大数据系统PDF|Epub|txt|kindle电子书版本网盘下载

Hadoop高级数据分析使用Hadoop生态系统设计和构建大数据系统PDF格式电子书版下载