图书介绍
SPSS Modeler数据挖掘方法及应用 第2版PDF|Epub|txt|kindle电子书版本网盘下载
![SPSS Modeler数据挖掘方法及应用 第2版](https://www.shukui.net/cover/8/35083821.jpg)
- 薛薇,陈欢歌编著 著
- 出版社: 北京:电子工业出版社
- ISBN:9787121222030
- 出版时间:2014
- 标注页数:258页
- 文件大小:75MB
- 文件页数:269页
- 主题词:统计分析-软件包-高等学校-教材
PDF下载
下载说明
SPSS Modeler数据挖掘方法及应用 第2版PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 数据挖掘和SPSS Modeler概述1
1.1数据挖掘的产生背景1
1.1.1海量数据的分析需求催生数据挖掘1
1.1.2应用对理论的挑战催生数据挖掘3
1.2什么是数据挖掘5
1.2.1数据挖掘的概念6
1.2.2数据挖掘能做什么7
1.2.3数据挖掘得到的知识形式8
1.2.4数据挖掘的算法分类10
1.3 SPSS Modeler软件概述12
1.3.1 SPSS Modeler的窗口13
1.3.2数据流的基本管理和执行15
1.3.3数据流的其他管理17
1.3.4从一个示例看SPSS Modeler的使用19
第2章 SPSS Modeler数据的读入26
2.1变量的类型26
2.1.1从数据挖掘角度看变量类型26
2.1.2从数据存储角度看变量类型27
2.2读入数据27
2.2.1读自由格式的文本文件27
2.2.2读Excel电子表格数据31
2.2.3读SPSS格式文件32
2.2.4读数据库文件33
2.3生成实验方案数据34
2.4合并数据36
2.4.1数据的纵向合并36
2.4.2数据的横向合并39
第3章 SPSS Modeler变量的管理42
3.1变量说明42
3.1.1取值范围和缺失值的说明43
3.1.2变量取值有效性检查和修正44
3.1.3变量角色的说明45
3.2变量值的重新计算46
3.2.1 CLEM表达式46
3.2.2变量值重新计算示例49
3.3变量类别值的调整50
3.4生成新变量52
3.5变量值的离散化处理55
3.5.1常用的分箱方法55
3.5.2变量值的离散化处理示例58
3.6生成样本集分割变量61
3.6.1样本集分割的意义和常见方法61
3.6.2生成样本集分割变量的示例62
第4章 SPSS Modeler样本的管理64
4.1样本的排序64
4.2样本的条件筛选65
4.3样本的随机抽样65
4.4样本的浓缩处理66
4.5样本的分类汇总67
4.6样本的平衡处理68
4.7样本的其他管理69
4.7.1数据转置69
4.7.2数据的重新组织71
第5章 SPSS Modeler数据的基本分析73
5.1数据质量的探索73
5.1.1数据的基本描述与质量探索74
5.1.2离群点和极端值的修正76
5.1.3缺失值的替补77
5.1.4数据质量管理的其他功能78
5.2基本描述分析79
5.2.1计算基本描述统计量79
5.2.2绘制散点图81
5.3变量分布的探索83
5.4两分类变量相关性的研究85
5.4.1两分类变量相关性的图形分析85
5.4.2两分类变量相关性的数值分析88
5.5两总体的均值比较92
5.5.1两总体均值比较的图形分析92
5.5.2独立样本的均值检验93
5.5.3配对样本的均值检验96
5.6变量重要性的分析99
5.6.1变量重要性分析的一般方法99
5.6.2变量重要性分析的应用示例101
第6章 分类预测:SPSS Modeler的决策树104
6.1决策树算法概述104
6.1.1什么是决策树104
6.1.2决策树的几何理解105
6.1.3决策树的核心问题106
6.2 SPSS Modeler的C5.0算法及应用108
6.2.1信息熵和信息增益108
6.2.2 C5.0的决策树生长算法110
6.2.3 C5.0的剪枝算法113
6.2.4 C5.0的推理规则集115
6.2.5 C5.0的基本应用示例118
6.2.6 C5.0的损失矩阵和Boosting技术121
6.2.7 C5.0的模型评价125
6.2.8 C5.0的其他话题:推理规则、交叉验证和未剪枝的决策树127
6.3 SPSS Modeler的分类回归树及应用128
6.3.1分类回归树的生长过程129
6.3.2分类回归树的剪枝过程131
6.3.3损失矩阵对分类树的影响133
6.3.4分类回归树的基本应用示例133
6.3.5分类回归树的交互建模137
6.3.6分类回归树的模型评价138
6.4 SPSS Modeler的CHAID算法及应用145
6.4.1 CHAID分组变量的预处理和选择策略145
6.4.2 Exhaustive CHAID算法147
6.4.3 CHAID的剪枝147
6.4.4 CHAID的应用示例147
6.5 SPSS Modeler的QUEST算法及应用149
6.5.1 QUEST算法确定最佳分组变量和分割点的方法150
6.5.2 QUEST算法的应用示例151
6.6决策树算法评估的图形比较152
6.6.1不同模型的误差对比152
6.6.2不同模型收益的对比153
第7章 分类预测:SPSS Modeler的人工神经网络156
7.1人工神经网络算法概述156
7.1.1人工神经网络的概念和种类156
7.1.2人工神经网络中的节点和意义157
7.1.3人工神经网络建立的一般步骤160
7.2 SPSS Modeler的B-P反向传播网络161
7.2.1感知机模型162
7.2.2 B-P反向传播网络的特点164
7.2.3 B-P反向传播算法166
7.2.4 B-P反向传播网络的其他问题168
7.3 SPSS Modeler的B-P反向传播网络的应用171
7.3.1基本操作说明171
7.3.2计算结果说明173
7.3.3提高模型预测精度175
7.4 SPSS Modeler的径向基函数网络及应用175
7.4.1径向基函数网络中的隐节点和输出节点175
7.4.2径向基函数网络的学习过程176
7.4.3径向基函数网络的应用示例177
第8章 分类预测:SPSS Modeler的统计方法179
8.1 SPSS Modeler的Logistic回归分析及应用179
8.1.1二项Logistic回归方程179
8.1.2二项Logistic回归方程系数的含义181
8.1.3二项Logistic回归方程的检验183
8.1.4二项Logistic回归分析的应用示例186
8.1.5多项Logistic回归分析的应用示例192
8.2 SPSS Modeler的判别分析及应用193
8.2.1距离判别法194
8.2.2 Fisher判别法195
8.2.3贝叶斯判别法198
8.2.4判别分析的应用示例199
第9章 探索内部结构:SPSS Modeler的关联分析207
9.1简单关联规则及其有效性207
9.1.1简单关联规则的基本概念208
9.1.2简单关联规则的有效性和实用性209
9.2 SPSS Modeler的Apriori算法及应用213
9.2.1产生频繁项集213
9.2.2依据频繁项集产生简单关联规则214
9.2.3 Apriori算法的应用示例215
9.3 SPSS Modeler的GRI算法及应用219
9.3.1 GRI算法基本思路219
9.3.2 GRI算法的具体策略220
9.3.3 GRI算法的应用示例221
9.4 SPSS Modeler的序列关联及应用223
9.4.1序列关联中的基本概念223
9.4.2 Sequence算法224
9.4.3序列关联的时间约束227
9.4.4序列关联分析的应用示例228
第10章 探索内部结构:SPSS Modeler的聚类分析231
10.1聚类分析的一般问题231
10.1.1聚类分析的提出231
10.1.2聚类分析的算法231
10.2 SPSS Modeler的K-Means聚类及应用232
10.2.1 K-Means对“亲疏程度”的测度232
10.2.2 K-Means聚类过程233
10.2.3 K-Means聚类的应用示例235
10.3 SPSS Modeler的两步聚类及应用238
10.3.1两步聚类对“亲疏程度”的测度239
10.3.2两步聚类过程240
10.3.3聚类数目的确定241
10.3.4两步聚类的应用示例242
10.4 SPSS Modeler的Kohonen网络聚类及应用244
10.4.1 Kohonen网络的聚类机理244
10.4.2 Kohonen网络的聚类过程246
10.4.3 Kohonen网络聚类的示例248
10.5基于聚类分析的离群点探索及应用252
10.5.1多维空间基于聚类的诊断方法253
10.5.2多维空间基于聚类的诊断方法应用示例255
参考文献258