图书介绍

Hadoop高级数据分析 使用Hadoop生态系统设计和构建大数据系统PDF|Epub|txt|kindle电子书版本网盘下载

Hadoop高级数据分析 使用Hadoop生态系统设计和构建大数据系统
  • (美)Kerry Koitzsch著;王建峰,王瑛琦,于金峰译 著
  • 出版社: 北京:清华大学出版社
  • ISBN:9787302487302
  • 出版时间:2018
  • 标注页数:227页
  • 文件大小:23MB
  • 文件页数:238页
  • 主题词:数据处理软件

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

Hadoop高级数据分析 使用Hadoop生态系统设计和构建大数据系统PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第Ⅰ部分 概念3

第1章 概述:用Hadoop构建数据分析系统3

1.1构建DAS的必要性4

1.2 Hadoop Core及其简史4

1.3 Hadoop生态系统概述5

1.4 AI技术、认知计算、深度学习以及BDA6

1.5自然语言处理与BDAS6

1.6 SQL与NoSQL查询处理6

1.7必要的数学知识7

1.8设计及构建BDAS的循环过程7

1.9如何利用Hadoop生态系统实现BDA10

1.10“图像大数据”(IABD)基本思想10

1.10.1使用的编程语言12

1.10.2 Hadoop生态系统的多语言组件12

1.10.3 Hadoop生态系统架构13

1.11有关软件组合件与框架的注意事项13

1.12 Apache Lucene、 Solr及其他:开源搜索组件14

1.13建立BDAS的架构15

1.14你需要了解的事情15

1.15 数据可视化与报表17

1.15.1使用Eclipse IDE作为开发环境18

1.15.2本书未讲解的内容19

1.16本章小结21

第2章 Scala及Python进阶23

2.1动机:选择正确的语言定义应用23

2.2 Scala概览24

2.3 Python概览29

2.4错误诊断、调试、配置文件及文档31

2.4.1 Python的调试资源32

2.4.2 Python文档33

2.4.3 Scala的调试资源33

2.5编程应用与示例33

2.6本章小结34

2.7参考文献34

第3章 Hadoop及分析的标准工具集35

3.1库、组件及工具集:概览35

3.2在评估系统中使用深度学习方法38

3.3使用Spring框架及Spring Data44

3.4数字与统计库:R、Weka及其他44

3.5分布式系统的OLAP技术44

3.6用于分析的Hadoop工具集:Apache Mahout及相关工具45

3.7 Apache Mahout的可视化46

3.8 Apache Spark库与组件46

3.8.1可供选择的不同类型的shell46

3.8.2 Apache Spark数据流47

3.8.3 Sparkling Water与H2O机器学习48

3.9组件使用与系统建立示例48

3.10封包、测试和文档化示例系统50

3.11本章小结51

3.12参考文献51

第4章 关系、NoSQL及图数据库53

4.1图查询语言:Cypher及Gremlin55

4.2 Cypher示例55

4.3 Gremlin示例56

4.4图数据库:Apache Neo4J58

4.5关系数据库及Hadoop生态系统59

4.6 Hadoop以及UA组件59

4.7本章小结63

4.8参考文献64

第5章 数据管道及其构建方法65

5.1基本数据管道66

5.2 Apache Beam简介67

5.3 Apache Falcon简介68

5.4数据源与数据接收:使用Apache Tika构建数据管道68

5.5计算与转换70

5.6结果可视化及报告71

5.7本章小结74

5.8参考文献74

第6章 Hadoop、Lucene、Solr与高级搜索技术75

6.1 Lucene/Solr生态系统简介75

6.2 Lucene查询语法76

6.3使用Solr的编程示例79

6.4使用ELK栈(Elasticsearch、Logstash、Kibana)85

6.5 Solr与Elasticsearch:特点与逻辑93

6.6应用于Elasticsearch和Solr的Spnng Data组件95

6.7使用LingPipe和GATE实现定制搜索99

6.8本章小结108

6.9参考文献108

第Ⅱ部分 架构及算法111

第7章 分析技术及算法概览111

7.1算法类型综述111

7.2统计/数值技术112

7.3贝叶斯技术113

7.4本体驱动算法114

7.5混合算法:组合算法类型115

7.6代码示例116

7.7本章小结119

7.8参考文献119

第8章 规则引擎、系统控制与系统编排121

8.1规则系统oss Drools介绍121

8.2基于规则的软件系统控制124

8.3系统协调与oss Drools125

8.4分析引擎示例与规则控制126

8.5本章小结129

8.6参考文献129

第9章 综合提升:设计一个完整的分析系统131

9.1本章小结136

9.2参考文献136

第Ⅲ部分 组件与系统139

第10章 数据可视化:可视化与交互分析139

10.1简单的可视化139

10.2 Angular JS和Friends简介143

10.3使用JHipster集成Spring XD和Angular JS143

10.4使用d3.js、sigma.js及其他工具152

10.5本章小结153

10.6参考文献153

第Ⅳ部分 案例研究与应用157

第11章 生物信息学案例研究:分析显微镜载玻片数据157

11.1生物信息学介绍157

11.2自动显微镜简介159

11.3代码示例:使用图像填充HDFS162

11.4本章小结165

11.5参考文献165

第12章 贝叶斯分析组件:识别信用卡诈骗167

12.1贝叶斯分析简介167

12.2贝叶斯组件用于信用卡诈骗检测169

12.3本章小结172

12.4参考文献172

第13章 寻找石油:使用Apache Mahout分析地理数据173

13.1基于领域的Apache Mahout推理介绍173

13.2智能制图系统和Hadoop分析179

13.3本章小结180

13.4参考文献180

第14章 “图像大数据”系统:一些案例研究181

14.1图像大数据简介181

14.2使用HIPI系统的第一个代码示例184

14.3 BDA图像工具包利用高级语言功能187

14.4究竟什么是图像数据分析?187

14.5交互模块和仪表板189

14.6添加新的数据管道和分布式特征查找189

14.7示例:分布式特征查找算法190

14.8 IABD工具包中的低级图像处理程序194

14.9术语194

14.10本章小结195

14.11参考文献195

第15章 构建通用数据管道199

15.1示例系统的体系架构和描述199

15.2如何获取和运行示例系统200

15.3管道构建的五大策略200

15.3.1从数据源和接收装置工作200

15.3.2由中间向外发展200

15.3.3基于企业集成模式(EIP)的开发200

15.3.4基于规则的消息管道开发201

15.3.5控制+数据(控制流)管道202

15.4本章小结202

15.5参考文献203

第16章 大数据分析的总结与展望205

16.1总结205

16.2大数据分析的现状206

16.3“孵化项目”和“初期项目”208

16.4未来Hadoop及其后续思考209

16.5不同观点:目前Hadoop的替代方案211

16.6在“未来Hadoop”中使用机器学习和深度学习技术211

16.7数据可视化和BDA的前沿领域212

16.8结束语212

附录A 设置分布式分析环境215

附录B 获取、安装和运行示例分析系统227

热门推荐