图书介绍
大数据、数据挖掘与智慧运营PDF|Epub|txt|kindle电子书版本网盘下载
![大数据、数据挖掘与智慧运营](https://www.shukui.net/cover/59/34516112.jpg)
- 梁栋,张兆静,彭木根编著 著
- 出版社: 北京:清华大学出版社
- ISBN:9787302483373
- 出版时间:2017
- 标注页数:403页
- 文件大小:66MB
- 文件页数:418页
- 主题词:数据处理
PDF下载
下载说明
大数据、数据挖掘与智慧运营PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 大数据、数据挖掘与智慧运营综述1
1.1 数据挖掘的发展史2
1.1.1 数据挖掘的定义与起源2
1.1.2 数据挖掘的早期发展3
1.1.3 数据挖掘的算法前传4
1.1.4 数据挖掘的第一个里程碑8
1.1.5 最近十年的发展与应用11
1.2 数据挖掘的主要流程与金字塔模型13
1.2.1 数据挖掘的任务14
1.2.2 数据挖掘的基本步骤16
1.2.3 数据挖掘的架构——云计算17
1.2.4 “金字塔”模型20
1.3 数据挖掘对智慧运营的意义22
1.3.1 “互联网+”时代的来临及其对运营商的冲击和挑战22
1.3.2 大数据时代的来临及其对运营商的挑战和机遇24
1.3.3 电信运营商运营发展面临的主要瓶颈26
1.3.4 电信运营商发展的“三条曲线”27
1.3.5 智慧运营与大数据变现29
1.3.6 数据挖掘对于提升智慧运营效率的意义30
1.4 大数据时代已经来临31
1.4.1 大数据的定义31
1.4.2 大数据的“4V”特征32
1.4.3 结构化数据与非结构化数据33
1.5 非结构化数据挖掘的研究进展34
1.5.1 文本挖掘34
1.5.2 模式识别36
1.5.3 语音识别40
1.5.4 视频识别44
1.5.5 其他非结构化数据挖掘48
1.6 数据挖掘与机器学习、深度学习、人工智能及云计算50
1.6.1 机器学习51
1.6.2 深度学习53
1.6.3 人工智能55
1.6.4 云计算56
1.7 现有数据挖掘的主要分析软件与系统61
1.7.1 Hadoop61
1.7.2 Storm63
1.7.3 Spark65
1.7.4 SPASS(SPSS)66
1.7.5 SAS68
参考文献70
第2章 数据统计与数据预处理73
2.1 数据属性类型74
2.1.1 数据属性定义74
2.1.2 离散属性74
2.1.3 连续属性75
2.2 数据的统计特性77
2.2.1 中心趋势度量77
2.2.2 数据散布度量78
2.2.3 数据相关性82
2.3 数据预处理87
2.3.1 数据预处理概述87
2.3.2 数据预处理的主要任务88
2.3.3 数据清理89
2.3.4 数据集成91
2.3.5 数据规约94
2.3.6 数据变换和离散化97
2.4 数据字段的衍生100
2.4.1 数据字段的拆分101
2.4.2 统计特征的构造101
2.4.3 数据域的变换102
2.5 SPSS软件中的数据预处理案例103
2.5.1 缺失值的实操处理103
2.5.2 噪声数据的实操处理104
2.5.3 主成分分析的实操处理105
参考文献107
第3章 聚类分析109
3.1 概述110
3.2 聚类算法的评估113
3.3 基于划分的聚类:K-means117
3.3.1 基于划分的聚类算法概述117
3.3.2 K-means聚类算法原理118
3.3.3 K-means算法的优势与劣势120
3.3.4 K-means算法优化121
3.3.5 SPSS软件中的K-means算法应用案例123
3.4 基于层次化的聚类:BIRCH134
3.4.1 基于层次化的聚类算法概述134
3.4.2 BIRCH算法的基本原理135
3.4.3 BIRCH算法的优势与劣势136
3.5 基于密度的聚类:DBSCAN137
3.5.1 基于密度的聚类算法概述137
3.5.2 DBSCAN算法的基本原理137
3.5.3 DBSCAN算法的优势与劣势140
3.6 基于网格的聚类:CLIQUE140
3.6.1 基于网格的聚类算法概述140
3.6.2 CLIQUE算法的基本原理141
3.6.3 CLIQUE算法的优势与劣势142
参考文献143
第4章 分类分析145
4.1 分类分析概述146
4.2 分类分析的评估148
4.3 决策树分析152
4.3.1 决策树算法的基本原理152
4.3.2 CHAID决策树160
4.3.3 ID3决策树167
4.3.4 C4.5 决策树171
4.3.5 CART决策树175
4.3.6 决策树中的剪枝问题179
4.3.7 决策树在SPSS中的应用180
4.4 最近邻分析(KNN)185
4.4.1 KNN算法的基本原理185
4.4.2 KNN算法流程186
4.4.3 KNN算法的若干问题187
4.4.4 KNN分类器的特征188
4.4.5 KNN算法在SPSS中的应用188
4.5 贝叶斯分析191
4.5.1 贝叶斯定理191
4.5.2 朴素贝叶斯分类192
4.5.3 贝叶斯网络195
4.6 神经网络199
4.6.1 感知器200
4.6.2 多重人工神经网络201
4.6.3 人工神经网络的特点203
4.7 支持向量机204
4.7.1 支持向量机简介204
4.7.2 最大边缘超平面205
4.7.3 数据线性可分的情况206
4.7.4 数据非线性可分的情况209
4.7.5 支持向量机的特征210
参考文献210
第5章 回归分析213
5.1 回归分析概述214
5.2 一元线性回归214
5.2.1 一元线性回归的基本原理215
5.2.2 一元线性回归性能评估216
5.2.3 SPSS软件中一元线性回归应用案例216
5.3 多元线性回归222
5.3.1 多元线性回归基本原理223
5.3.2 自变量选择方法223
5.3.3 SPSS软件中的多元线性回归应用案例224
5.4 非线性回归230
5.4.1 非线性回归基本原理231
5.4.2 幂函数回归分析231
5.4.3 指数回归分析232
5.4.4 对数回归分析232
5.4.5 多项式回归分析233
5.4.6 非线性模型线性化和曲线回归234
5.5 逻辑回归235
5.5.1 逻辑回归基本原理235
5.5.2 二元逻辑回归238
5.5.3 多元逻辑回归238
5.5.4 SPSS软件中的逻辑回归应用案例238
参考文献242
第6章 关联分析245
6.1 关联分析概述246
6.2 关联分析的评估指标247
6.2.1 支持度247
6.2.2 置信度248
6.2.3 算法复杂度248
6.3 Apriori算法249
6.3.1 频繁项集的定义与产生249
6.3.2 先验原理251
6.3.3 基于支持度的计数与剪枝252
6.3.4 候选项集生成253
6.3.5 基于置信度的剪枝259
6.3.6 Apriori算法规则生成259
6.4 FP-tree算法261
6.4.1 频繁模式树261
6.4.2 FP-tree算法频繁项集的产生263
6.4.3 FP-tree算法规则生成263
6.4.4 算法性能对比与评估264
6.5 SPSS Modeler关联分析实例265
参考文献269
第7章 增强型数据挖掘算法271
7.1 增强型数据挖掘算法概述272
7.1.1 组合方法的优势272
7.1.2 构建组合分类器的方法272
7.2 随机森林273
7.2.1 随机森林的原理273
7.2.2 随机森林的优缺点276
7.2.3 随机森林的泛化误差276
7.2.4 输入特征的选择方法277
7.3 Bagging算法277
7.4 AdaBoost算法280
7.4.1 AdaBoost算法简介281
7.4.2 AdaBoost算法原理281
7.4.3 AdaBoost算法的优缺点285
7.5 提高不平衡数据的分类准确率286
7.5.1 不平衡数据286
7.5.2 不平衡数据的处理方法——数据层面288
7.5.3 不平衡数据的处理方法——算法层面292
7.6 迁移学习295
7.6.1 迁移学习的基本原理295
7.6.2 迁移学习的分类296
7.6.3 迁移学习与数据挖掘298
7.6.4 迁移学习的发展301
参考文献302
第8章 数据挖掘在运营商智慧运营中的应用305
8.1 概述306
8.2 单个业务的精准营销——合约机外呼营销307
8.2.1 总结历史营销规律308
8.2.2 预测潜在客户群体321
8.2.3 客户群体细分327
8.2.4 制定层次化、个性化精准营销方案328
8.3 多种互联网业务的精准推送329
8.3.1 根据历史营销规律总结单个业务的历史营销规律329
8.3.2 预测潜在客户群体、预测单个业务的潜在客户群体及多个业务的联合建模341
8.3.3 制定多业务层次化个性化联合精准营销方案342
8.3.4 落地效果评估343
8.4 套餐精准适配344
8.4.1 痛点344
8.4.2 挖掘潜在客户群体346
8.4.3 探寻强相关字段349
8.4.4 多元线性回归建模350
8.4.5 制定层次化、个性化精准营销方案351
8.4.6 落地效果评估与模型调优352
8.5 客户保有353
8.5.1 总结客户流失的历史规律354
8.5.2 细分潜在流失客户群体357
8.5.3 客户保有效益建模与最优决策359
8.5.4 落地效果评估361
8.6 投诉预警363
8.6.1 客户投诉现象分析363
8.6.2 挖掘潜在客户群体366
8.6.3 制定个性化关怀方案368
8.7 网络质量栅格化呈现368
8.7.1 栅格化呈现的基本原理369
8.7.2 覆盖栅格化370
8.7.3 基于流量聚簇的网络优化策略372
8.8 无线室内定位376
8.8.1 传统室内定位方法376
8.8.2 基于Wi-Fi信号的指纹定位算法378
8.8.3 基于数据挖掘算法的改进定位方法379
参考文献383
第9章 面向未来大数据的数据挖掘与机器学习发展趋势385
9.1 大数据时代数据挖掘与机器学习面临的新挑战386
9.2 IEEE ICDM会议数据挖掘与机器学习的最新研究进展395
9.3 “计算机奥运会”——Sort Benchmark400
参考文献402