图书介绍
数据预处理 数据归约的统计方法研究及应用PDF|Epub|txt|kindle电子书版本网盘下载
- 刘云霞著 著
- 出版社: 厦门:厦门大学出版社
- ISBN:9787561538258
- 出版时间:2011
- 标注页数:130页
- 文件大小:5MB
- 文件页数:148页
- 主题词:数据处理
PDF下载
下载说明
数据预处理 数据归约的统计方法研究及应用PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第一章 绪论1
第一节 选题的研究背景和研究意义1
第二节 相关背景知识2
一、数据挖掘的发展概况3
二、数据归约的主要内容5
三、数据归约的重要作用6
第三节 国内外研究现状7
一、属性离散化方法研究的现状7
二、属性排序和属性子集选择方法研究的现状9
第四节 本书的研究内容及创新点11
一、本书的研究内容和结构11
二、本书的创新点12
第二章 缺失值的填补与异常值的探测14
第一节 缺失值的填补11
一、单一填补法和多重填补法15
二、基于距离的填补方法17
三、贝叶斯填补方法18
第二节 异常值的探测20
一、异常值及形成原因20
二、异常值的探测方法21
三、异常值探测的步骤及应用29
第三节 移动通讯用户消费行为的分析31
一、单个属性异常值探测的应用及分析32
二、多个属性的异常值探测方法的应用及分析35
第三章 数据挖掘中元组的归约39
第一节 面向属性归纳39
一、面向属性归纳39
二、面向属性归纳的步骤41
三、面向属性归纳的算法42
第二节 连续属性离散化方法及分类43
一、离散化方法的分类43
二、典型离散化的过程及结果评价45
三、相关的离散化方法46
第三节 基于可辨识矩阵的连续属性离散化方法52
一、基于可辨识矩阵离散化方法的基本思路52
二、基于可辨识矩阵离散化方法的框架55
三、基于可辨识矩阵离散化方法的统计模拟56
第四节 基于似然比假设检验的连续属性离散化方法58
一、基于似然比假设检验的离散化方法59
二、基于似然比假设检验离散化方法的步骤60
三、基于似然比假设检验离散化方法的验证61
四、两种离散化方法结果的比较63
第四章 属性重要性的排序64
第一节 有监督属性重要性的排序64
一、粗糙集理论中属性重要性的排序方法64
二、信息论和决策树中属性重要性的排序方法66
三、神经网络中属性重要性的排序方法69
四、三种方法的比较71
第二节 单向有序列联资料的属性重要性的排序72
一、单向有序列联表73
二、以秩效应为标准的方法75
三、改进秩和法75
四、改进秩和法对一份调查问卷的分析77
五、以秩效应为标准的方法和改进秩和法的比较80
第三节 基于因子分析的无监督属性重要性的排序82
一、基于因子分析的属性重要性排序方法82
二、基于因子分析的属性重要性排序方法的步骤84
三、基于因子分析排序方法的框架85
四、基于因子分析属性重要性排序方法的验证86
五、值得注意的问题和局限性88
第五章 属性的提取与属性子集的选择90
第一节 属性的提取90
一、小、波变换91
二、投影寻踪92
三、多维标度94
四、多元统计分析方法97
五、几种属性提取方法的比较98
第二节 属性子集的选择99
一、属性子集选择方法的两个组成部分99
二、属性子集选择方法的两种模式102
三、基于各学科知识的属性子集选择方法102
四、关于模式识别中基于距离的评价函数的思考105
第三节 逐步向前无监督属性子集的选择方法108
一、逐步选择方法的不足108
二、逐步向前无监督属性子集选择方法的思路109
三、逐步向前无监督属性子集选择方法的基本框架110
四、统计模拟及方法验证111
五、逐步向前无监督属性子集选择方法的合理性和局限性113
第六章 全书的总结117
第一节 全书的主要工作117
第二节 尚需研究的问题118
参考文献119
后记128
攻读博士学位期间发表的论文130