图书介绍
数据科学导论PDF|Epub|txt|kindle电子书版本网盘下载
![数据科学导论](https://www.shukui.net/cover/28/31961818.jpg)
- 杨旭,汤海京,丁刚毅编著 著
- 出版社: 北京:北京理工大学出版社
- ISBN:9787568231152
- 出版时间:2017
- 标注页数:226页
- 文件大小:46MB
- 文件页数:243页
- 主题词:数据管理
PDF下载
下载说明
数据科学导论PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第一部分 引论3
第1章 引论3
1.1 序言3
1.2 数据科学简述3
1.2.1 数据科学的定义3
1.2.2 数据科学的由来4
1.2.3 数据科学的研究范畴5
1.2.4 数据科学的学习意义6
1.3 本书结构6
第二部分 大数据及其产生根源11
第2章 数据11
2.1 数据的定义11
2.1.1 数据的定义11
2.1.2 其他相关概念11
2.2 数据简史12
第3章 大数据的概念和特征19
3.1 大数据的概念19
3.2 大数据的4V特性20
3.2.1 体量(Volume)20
3.2.2 多样性(Variety)22
3.2.3 价值/真实性(Value/Veracity)23
3.2.4 速度(Velocity)24
3.2.5 对4V特性的体会24
第4章 大数据的产生根源25
4.1 大数据的产生根源25
4.1.1 大数据时代出现的技术基础25
4.1.2 大数据时代出现的数据基础25
4.2 大数据简史26
4.3 大数据时代的挑战28
4.3.1 数据规模30
4.3.2 数据的多样性和异构性31
4.3.3 数据的不可靠问题31
4.3.4 数据的实时性要求31
4.3.5 数据隐私问题31
4.3.6 人机协作问题31
4.3.7 数据的访问与共享31
4.3.8 数据运用的合理性32
4.3.9 小结32
第三部分 大数据研究的重要性35
第5章 大数据研究的现状35
5.1 政府篇35
5.1.1 联合国的大数据研究35
5.1.2 美国的大数据研究36
5.1.3 欧盟的大数据研究37
5.2 企业篇39
5.2.1 谷歌39
5.2.2 IBM39
5.2.3 百度41
5.2.4 阿里巴巴41
5.2.5 腾讯42
第6章 关联分析44
6.1 啤酒与尿布44
6.1.1 案例详析44
6.1.2 购物篮分析法45
6.1.3 商品间相关性分析47
6.1.4 外界因素的影响51
6.1.5 思维启示52
6.2 亚马逊的个性化推荐54
6.2.1 案例详析54
6.2.2 亚马逊的推荐方式55
6.2.3 推荐算法57
6.3 潘多拉音乐组计划61
6.3.1 案例详析61
6.3.2 标签的运用64
6.4 塔吉特的大数据营销67
6.4.1 案例详析67
6.4.2 思维启示——数据应用已经渗入生活的方方面面68
第7章 趋势预测70
7.1 “搜索+比价”70
7.1.1 Farecast案例详析70
7.1.2 Decide案例详析72
7.1.3 思维启示75
7.2 Twitter与对冲基金75
7.2.1 案例详析75
7.2.2 思维启示:数据可以预测趋势与规律77
7.3 疾病预测77
7.3.1 谷歌流感趋势77
7.3.2 其他案例81
7.3.3 思维启示81
7.4 电影票房预测83
7.4.1 案例详析83
7.4.2 工作模式84
7.4.3 思维启示:简单的就是最好的87
7.5 奥斯卡预测88
7.5.1 案例详析88
7.5.2 思维启示:大数据可以做预测90
第8章 决策支持92
8.1 《纸牌屋》92
8.1.1 案例详析92
8.1.2 大数据的运用方式93
8.1.3 思维启示93
8.2 美国总统大选96
8.2.1 案例详析96
8.2.2 大数据的运用方式96
8.2.3 思维启示99
第9章 模式创新100
9.1 大数据与反恐100
9.1.1 美国“棱镜”计划100
9.1.2 加拿大的“棱镜门”102
9.1.3 思维启示103
9.2 利用大数据打击犯罪105
9.2.1 “先知”系统105
9.2.2 “犯罪数据分析和趋势预测系统”106
9.3 大数据与破案107
9.3.1 《源代码》107
9.4 大数据的其他运用方式108
9.4.1 大数据与纽约沙井盖维护108
9.4.2 大数据帮助寻根问祖109
第四部分 数据科学的研究方式117
第10章 数据密集型研究方法117
10.1 范式和范式的演化过程117
10.1.1 范式的定义117
10.1.2 范式的演变过程118
10.2 第四范式兴起的社会根源120
10.2.1 数据洪流的到来120
10.2.2 科学界对海量数据的关注121
10.2.3 关联数据运动122
10.2.4 政府数据开放运动123
10.3 对第四范式的分析124
10.3.1 科学数据与科学研究的问题124
10.3.2 解决方案124
10.4 数据科学研究的一般流程125
第11章 数据的获取和预处理127
11.1 数据的获取127
11.1.1 数据的类型127
11.1.2 网络爬虫技术129
11.2 数据预处理的目的136
11.3 数据清洗137
11.3.1 填补空缺值137
11.3.2 平滑噪声数据138
11.4 数据集成142
11.4.1 多信息源的匹配142
11.4.2 冗余数据的处理143
11.5 数据变换145
11.5.1 数据规范化145
11.6 数据归约146
11.6.1 数据立方体聚集147
11.6.2 维归约148
11.6.3 特征值归约150
第12章 数据的存储与管理151
12.1 数据的存储151
12.1.1 数据存储的发展151
12.1.2 大数据对存储带来的挑战155
12.1.3 云存储方式156
12.2 数据的管理157
12.2.1 数据管理的发展阶段157
12.2.2 大数据时代数据管理的特点160
12.2.3 非关系型数据161
12.2.4 开源的NoSQL数据库软件161
第13章 数据的处理165
13.1 Hadoop165
13.1.1 Hadoop的起源165
13.1.2 优点165
13.1.3 架构166
13.1.4 MapReduce流程167
13.2 Spark168
13.2.1 概述168
13.2.2 Spark的特点169
13.2.3 编程模型169
13.2.4 运行和调度170
第14章 数据的可视化173
14.1 概述173
14.2 可视化工具174
14.2.1 Excel174
14.2.2 Raphael174
14.2.3 Visual.ly175
14.2.4 Crossfilter175
14.2.5 Polymaps175
14.2.6 Kartograph176
14.2.7 Processing176
14.2.8 R177
14.2.9 Weka177
14.2.10 Gephi178
第五部分 数据与未来183
第15章 大数据与智慧城市183
15.1 概述183
15.1.1 智慧城市的定义183
15.1.2 智慧城市产生背景184
15.2 大数据与智慧城市186
15.2.1 智慧城市的基本特征与层次构成186
15.2.2 智慧城市建设中所应用的数据科学技术188
15.3 智慧城市案例190
15.3.1 韩国191
15.3.2 日本192
15.3.3 美国192
15.3.4 爱沙尼亚196
15.3.5 荷兰198
15.3.6 英国199
15.3.7 巴西200
第16章 大数据与智慧医疗205
16.1 概述205
16.2 智慧医疗的范畴205
16.2.1 临床操作205
16.2.2 付款/定价207
16.2.3 研发208
16.2.4 新的商业模式209
16.2.5 公众健康209
16.2.6 给我们的思维模式启示210
16.3 大数据与智慧医疗210
16.3.1 大数据服务心脏病患者210
16.3.2 “魔毯”病人的监控211
16.3.3 大数据监测脑外伤病人恢复211
16.3.4 大数据帮助实现个性化用药和诊断212
16.4 可穿戴技术213
16.4.1 可穿戴技术的概念213
16.4.2 可穿戴设备简析214
16.4.3 可穿戴设备与智慧医疗218
16.4.4 思维启示——可穿戴设备的缺陷218
第17章 大数据与未来生活221
17.1 数据科学家221
17.1.1 数据科学家的定义221
17.1.2 数据科学家的从业前景221
17.2 对未来数据科学发展的探讨224
17.2.1 数据不是万能224
17.2.2 提防进入数据误区225