图书介绍
数据挖掘与数据化运营实战 思路、方法、技巧与应用PDF|Epub|txt|kindle电子书版本网盘下载
![数据挖掘与数据化运营实战 思路、方法、技巧与应用](https://www.shukui.net/cover/43/31088689.jpg)
- 卢辉著 著
- 出版社: 北京:机械工业出版社
- ISBN:9787111426509
- 出版时间:2013
- 标注页数:258页
- 文件大小:65MB
- 文件页数:278页
- 主题词:数据采集
PDF下载
下载说明
数据挖掘与数据化运营实战 思路、方法、技巧与应用PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 什么是数据化运营1
1.1现代营销理论的发展历程2
1.1.1从4P到4C2
1.1.2从4C到3P3C3
1.2数据化运营的主要内容5
1.3为什么要数据化运营7
1.4数据化运营的必要条件8
1.4.1企业级海量数据存储的实现8
1.4.2精细化运营的需求10
1.4.3数据分析和数据挖掘技术的有效应用11
1.4.4企业决策层的倡导与持续支持11
1.5数据化运营的新现象与新发展12
1.6关于互联网和电子商务的最新数据14
第2章 数据挖掘概述15
2.1数据挖掘的发展历史16
2.2统计分析与数据挖掘的主要区别16
2.3数据挖掘的主要成熟技术以及在数据化运营中的主要应用18
2.3.1决策树18
2.3.2神经网络19
2.3.3回归21
2.3.4关联规则22
2.3.5聚类23
2.3.6贝叶斯分类方法24
2.3.7支持向量机25
2.3.8主成分分析26
2.3.9假设检验27
2.4互联网行业数据挖掘应用的特点28
第3章 数据化运营中常见的数据分析项目类型30
3.1目标客户的特征分析31
3.2目标客户的预测(响应、分类)模型32
3.3运营群体的活跃度定义33
3.4用户路径分析34
3.5交叉销售模型35
3.6信息质量模型37
3.7服务保障模型39
3.8用户(买家、卖家)分层模型40
3.9卖家(买家)交易模型44
3.10信用风险模型44
3.11商品推荐模型45
3.11.1商品推荐介绍45
3.11.2关联规则45
3.11.3协同过滤算法50
3.11.4商品推荐模型总结54
3.12数据产品55
3.13决策支持56
第4章 数据化运营是跨专业、跨团队的协调与合作57
4.1数据分析团队与业务团队的分工和定位58
4.1.1提出业务分析需求并且能胜任基本的数据分析58
4.1.2提供业务经验和参考建议60
4.1.3策划和执行精细化运营方案60
4.1.4跟踪运营效果、反馈和总结61
4.2数据化运营是真正的多团队、多专业的协同作业62
4.3实例示范数据化运营中的跨专业、跨团队协调合作62
第5章 分析师常见的错误观念和对治的管理策略67
5.1轻视业务论68
5.2技术万能论69
5.3技术尖端论71
5.4建模与应用两段论72
5.5机器万能论73
5.6幸福的家庭都是相似的,不幸的家庭各有各的不幸74
第6章 数据挖掘项目完整应用案例演示76
6.1项目背景和业务分析需求的提出77
6.2数据分析师参与需求讨论78
6.3制定需求分析框架和分析计划79
6.4抽取样本数据、熟悉数据、数据清洗和摸底81
6.5按计划初步搭建挖掘模型81
6.6与业务方讨论模型的初步结论,提出新的思路和模型优化方案83
6.7按优化方案重新抽取样本并建模,提炼结论并验证模型84
6.8完成分析报告和落地应用建议86
6.9制定具体的落地应用方案和评估方案86
6.10业务方实施落地应用方案并跟踪、评估效果86
6.11落地应用方案在实际效果评估后,不断修正完善88
6.12不同运营方案的评估、总结和反馈88
6.13项目应用后的总结和反思89
第7章 数据挖掘建模的优化和限度90
7.1数据挖掘模型的优化要遵循有效、适度的原则91
7.2如何有效地优化模型92
7.2.1从业务思路上优化92
7.2.2从建模的技术思路上优化94
7.2.3从建模的技术技巧上优化95
7.3如何思考优化的限度96
7.4模型效果评价的主要指标体系96
7.4.1评价模型准确度和精度的系列指标97
7.4.2 ROC曲线99
7.4.3 KS值100
7.4.4 Lift值102
7.4.5模型稳定性的评估104
第8章 常见的数据处理技巧105
8.1数据的抽取要正确反映业务需求106
8.2数据抽样107
8.3分析数据的规模有哪些具体的要求108
8.4如何处理缺失值和异常值109
8.4.1缺失值的常见处理方法109
8.4.2异常值的判断和处理111
8.5数据转换112
8.5.1生成衍生变量113
8.5.2改善变量分布的转换113
8.5.3分箱转换114
8.5.4数据的标准化115
8.6筛选有效的输入变量115
8.6.1为什么要筛选有效的输入变量116
8.6.2结合业务经验进行先行筛选116
8.6.3用线性相关性指标进行初步筛选117
8.6.4 R平方118
8.6.5卡方检验119
8.6.6 IV和WOE120
8.6.7部分建模算法自身的筛选功能121
8.6.8降维的方法122
8.6.9最后的准则122
8.7共线性问题123
8.7.1如何发现共线性123
8.7.2如何处理共线性123
第9章 聚类分析的典型应用和技术小窍门125
9.1聚类分析的典型应用场景126
9.2主要聚类算法的分类127
9.2.1划分方法127
9.2.2层次方法128
9.2.3基于密度的方法128
9.2.4基于网格的方法129
9.3聚类分析在实践应用中的重点注意事项129
9.3.1如何处理数据噪声和异常值129
9.3.2数据标准化130
9.3.3聚类变量的少而精131
9.4聚类分析的扩展应用132
9.4.1聚类的核心指标与非聚类的业务指标相辅相成132
9.4.2数据的探索和清理工具132
9.4.3个性化推荐的应用133
9.5聚类分析在实际应用中的优势和缺点134
9.6聚类分析结果的评价体系和评价指标135
9.6.1业务专家的评估135
9.6.2聚类技术上的评价指标136
9.7一个典型的聚类分析课题的案例分享137
9.7.1案例背景137
9.7.2基本的数据摸底137
9.7.3基于用户样本的聚类分析的初步结论138
第10章 预测响应(分类)模型的典型应用和技术小窍门140
10.1神经网络技术的实践应用和注意事项141
10.1.1神经网络的原理和核心要素141
10.1.2神经网络的应用优势143
10.1.3神经网络技术的缺点和注意事项143
10.2决策树技术的实践应用和注意事项144
10.2.1决策树的原理和核心要素144
10.2.2 CHAID算法145
10.2.3 CART算法145
10.2.4 ID3算法146
10.2.5决策树的应用优势146
10.2.6决策树的缺点和注意事项147
10.3逻辑回归技术的实践应用和注意事项148
10.3.1逻辑回归的原理和核心要素148
10.3.2回归中的变量筛选方法150
10.3.3逻辑回归的应用优势151
10.3.4逻辑回归应用中的注意事项151
10.4多元线性回归技术的实践应用和注意事项152
10.4.1线性回归的原理和核心要素152
10.4.2线性回归的应用优势153
10.4.3线性回归应用中的注意事项153
10.5模型的过拟合及对策154
10.6一个典型的预测响应模型的案例分享156
10.6.1案例背景156
10.6.2基本的数据摸底156
10.6.3建模数据的抽取和清洗158
10.6.4初步的相关性检验和共线性排查159
10.6.5潜在自变量的分布转换160
10.6.6自变量的筛选161
10.6.7响应模型的搭建与优化162
10.6.8冠军模型的确定和主要的分析结论162
10.6.9基于模型和分析结论基础上的运营方案164
10.6.10模型落地应用效果跟踪反馈165
第11章 用户特征分析的典型应用和技术小窍门166
11.1用户特征分析所适用的典型业务场景167
11.1.1寻找目标用户167
11.1.2寻找运营的抓手168
11.1.3用户群体细分的依据169
11.1.4新品开发的线索和依据169
11.2用户特征分析的典型分析思路和分析技术170
11.2.1 3种划分的区别170
11.2.2 RFM171
11.2.3聚类技术的应用172
11.2.4决策树技术的应用173
11.2.5预测(响应)模型中的核心自变量173
11.2.6假设检验的应用174
11.3特征提炼后的评价体系174
11.4用户特征分析与用户预测模型的区别和联系175
11.5用户特征分析案例176
第12章 运营效果分析的典型应用和技术小窍门177
12.1为什么要做运营效果分析178
12.2统计技术在数据化运营中最重要最常见的应用179
12.2.1为什么要进行假设检验179
12.2.2假设检验的基本思想179
12.2.3 T检验概述180
12.2.4两组独立样本T检验的假设和检验181
12.2.5两组独立样本的非参数检验182
12.2.6配对差值的T检验183
12.2.7配对差值的非参数检验184
12.2.8方差分析概述186
12.2.9单因素方差分析187
12.2.10多个样本组的非参数检验190
12.2.11卡方检验190
12.2.12控制变量的方法191
12.2.13 AB Test192
第13章 漏斗模型和路径分析193
13.1网络日志和布点194
13.1.1日志布点195
13.1.2日志采集195
13.1.3日志解析195
13.1.4日志分析195
13.2漏斗模型与路径分析的主要区别和联系196
13.3漏斗模型的主要应用场景197
13.3.1运营过程的监控和运营效率的分析与改善197
13.3.2用户关键路径分析198
13.3.3产品优化198
13.4路径分析的主要应用场景198
13.5路径分析的主要算法199
13.5.1社会网络分析方法199
13.5.2基于序列的关联分析200
13.5.3最朴素的遍历方法201
13.6路径分析案例的分享203
13.6.1案例背景203
13.6.2主要的分析技术介绍203
13.6.3分析所用的数据概况203
13.6.4主要的数据结论和业务解说203
13.6.5主要分析结论的落地应用跟踪206
第14章 数据分析师对业务团队数据分析能力的培养208
14.1培养业务团队数据分析意识与能力的重要性209
14.2数据分析师在业务团队数据分析意识能力培养中的作用210
14.3数据分析师如何培养业务团队的数据分析意识和能力210
14.4数据分析师培养业务团队数据分析意识能力的案例分享212
14.4.1案例背景212
14.4.2过程描述212
14.4.3本项目的效果跟踪214
第15章 换位思考216
15.1为什么要换位思考217
15.2从业务方的角度换位思考数据分析与挖掘218
15.3从同行的角度换位思考数据分析挖掘的经验教训220
第16章 养成数据分析师的品质和思维模式222
16.1态度决定一切223
16.1.1信念223
16.1.2信心224
16.1.3热情225
16.1.4敬畏226
16.1.5感恩227
16.2商业意识是核心228
16.2.1为什么商业意识是核心228
16.2.2如何培养商业意识229
16.3一个基本的方法论230
16.4大胆假设,小心求证231
16.5 2080原理233
16.6结构化思维233
16.7优秀的数据分析师既要客观,又要主观234
第17章 条条大道通罗马236
17.1为什么会条条大道通罗马237
17.2条条大道有侧重238
17.3自觉服从和积极响应239
17.3.1自觉服从239
17.3.2积极响应240
17.4具体示例242
第18章 数据挖掘实践的质量保障流程和制度243
18.1一个有效的质量保障流程制度244
18.1.1业务需求的收集245
18.1.2评估小组评估需求的优先级246
18.1.3课题组的成立及前期摸底247
18.1.4向业务方提交正式课题(项目)计划书247
18.1.5数据分析挖掘的课题展开248
18.1.6向业务方提交结论报告及业务落地应用建议248
18.1.7课题(项目)的落地应用和效果监控反馈248
18.2质量保障流程制度的重要性249
18.3如何支持与强化质量保障流程制度250
第19章 几个经典的数据挖掘方法论251
19.1 SEMMA方法论252
19.1.1数据取样253
19.1.2数据探索253
19.1.3数据调整253
19.1.4模式化254
19.1.5评价254
19.2 CRISP-DM方法论254
19.2.1业务理解255
19.2.2数据理解256
19.2.3数据准备256
19.2.4模型搭建256
19.2.5模型评估256
19.2.6模型发布256
19.3 Tom Khabaza的挖掘9律256