图书介绍
国外计算机科学经典教材 数据挖掘 概念、模型、方法和算法 第2版PDF|Epub|txt|kindle电子书版本网盘下载
- (美)坎塔尔季奇著;王晓海,吴志刚译 著
- 出版社: 北京:清华大学出版社
- ISBN:9787302307143
- 出版时间:2013
- 标注页数:403页
- 文件大小:28MB
- 文件页数:414页
- 主题词:数据采集-教材
PDF下载
下载说明
国外计算机科学经典教材 数据挖掘 概念、模型、方法和算法 第2版PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 数据挖掘的概念1
1.1 概述1
1.2 数据挖掘的起源3
1.3 数据挖掘过程4
1.4 大型数据集7
1.5 数据仓库10
1.6 数据挖掘的商业方面:为什么数据挖掘项目会失败13
1.7 本书结构安排15
1.8 复习题16
1.9 参考书目17
第2章 数据准备19
2.1 原始数据的表述19
2.2 原始数据的特性23
2.3 原始数据的转换24
2.3.1 标准化24
2.3.2 数据平整25
2.3.3 差值和比率25
2.4 丢失数据26
2.5 时间相关数据27
2.6 异常点分析30
2.7 复习题35
2.8 参考书目38
第3章 数据归约41
3.1 大型数据集的维度41
3.2 特征归约43
3.2.1 特征选择44
3.2.2 特征提取48
3.3 Relief算法50
3.4 特征排列的熵度量51
3.5 主成分分析53
3.6 值归约55
3.7 特征离散化:ChiMerge技术58
3.8 案例归约61
3.9 复习题63
3.10 参考书目64
第4章 从数据中学习67
4.1 学习机器68
4.2 统计学习原理72
4.3 学习方法的类型75
4.4 常见的学习任务77
4.5 支持向量机80
4.6 kNN:最近邻分类器90
4.7 模型选择与泛化92
4.8 模型的评估95
4.9 90%准确的情形100
4.9.1 保险欺诈检测101
4.9.2 改进心脏护理102
4.10 复习题103
4.11 参考书目104
第5章 统计方法107
5.1 统计推断107
5.2 评测数据集的差异109
5.3 贝叶斯定理112
5.4 预测回归114
5.5 方差分析118
5.6 对数回归120
5.7 对数-线性模型121
5.8 线性判别分析124
5.9 复习题126
5.10 参考书目128
第6章 决策树和决策规则131
6.1 决策树132
6.2 C4.5算法:生成决策树134
6.3 未知属性值139
6.4 修剪决策树142
6.5 C4.5算法:生成决策规则143
6.6 CART算法和Gini指标146
6.7 决策树和决策规则的局限性148
6.8 复习题150
6.9 参考书目153
第7章 人工神经网络155
7.1 人工神经元的模型156
7.2 人工神经网络的结构159
7.3 学习过程161
7.4 使用ANN完成的学习任务164
7.4.1 模式联想164
7.4.2 模式识别164
7.5 多层感知机166
7.6 竞争网络和竞争学习172
7.7 SOM174
7.8 复习题178
7.9 参考书目180
第8章 集成学习183
8.1 集成学习方法论184
8.2 多学习器组合方案187
8.3 bagging和boosting188
8.4 AdaBoost算法189
8.5 复习题190
8.6 参考书目193
第9章 聚类分析195
9.1 聚类的概念195
9.2 相似度的度量198
9.3 凝聚层次聚类203
9.4 分区聚类206
9.5 增量聚类208
9.6 DBSCAN算法211
9.7 BIRCH算法213
9.8 聚类验证215
9.9 复习题215
9.10 参考书目218
第10章 关联规则221
10.1 购物篮分析222
10.2 Apriori算法223
10.3 从频繁项集中得到关联规则225
10.4 提高Apriori算法的效率226
10.5 FP增长方法227
10.6 关联分类方法229
10.7 多维关联规则挖掘231
10.8 复习题232
10.9 参考书目236
第11章 Web挖掘和文本挖掘237
11.1 Web挖掘237
11.2 Web内容、结构与使用挖掘238
11.3 HITS和LOGSOM算法240
11.4 挖掘路径遍历模式245
11.5 PageRank算法247
11.6 文本挖掘249
11.7 潜在语义分析252
11.8 复习题255
11.9 参考书目257
第12章 数据挖掘高级技术259
12.1 图挖掘259
12.2 时态数据挖掘270
12.2.1 态数据表示271
12.2.2 序列之间的相似性度量274
12.2.3 时态数据模型276
12.2.4 数据挖掘277
12.3 空间数据挖掘(SDM)281
12.4 分布式数据挖掘(DDM)284
12.5 关联并不意味着存在因果关系290
12.6 数据挖掘的隐私、安全及法律问题295
12.7 复习题299
12.8 参考书目300
第13章 遗传算法303
13.1 遗传算法的基本原理304
13.2 用遗传算法进行优化305
13.2.1 编码方案和初始化306
13.2.2 适合度估计306
13.2.3 选择307
13.2.4 交叉308
13.2.5 突变308
13.3 遗传算法的简单例证310
13.3.1 表述310
13.3.2 初始群体311
13.3.3 评价311
13.3.4 交替312
13.3.5 遗传算子312
13.3.6 评价(第二次迭代)313
13.4 图式314
13.5 旅行推销员问题316
13.6 使用遗传算法的机器学习318
13.6.1 规则交换320
13.6.2 规则概化320
13.6.3 规则特化321
13.6.4 规则分割321
13.7 遗传算法用于聚类321
13.8 复习题323
13.9 参考书目324
第14章 模糊集和模糊逻辑327
14.1 模糊集327
14.2 模糊集的运算332
14.3 扩展原理和模糊关系335
14.4 模糊逻辑和模糊推理系统339
14.5 多因子评价342
14.6 从数据中提取模糊模型344
14.7 数据挖掘和模糊集349
14.8 复习题350
14.9 参考书目352
第15章 可视化方法353
15.1 感知和可视化353
15.2 科学可视化和信息可视化354
15.3 平行坐标359
15.4 放射性可视化361
15.5 使用自组织映射进行可视化363
15.6 数据挖掘的可视化系统365
15.7 复习题368
15.8 参考书目369
附录A 数据挖掘工具371
附录B 数据挖掘应用393