图书介绍
知识发现PDF|Epub|txt|kindle电子书版本网盘下载
![知识发现](https://www.shukui.net/cover/6/34219481.jpg)
- 史忠植著 著
- 出版社: 北京:清华大学出版社
- ISBN:7302050619
- 出版时间:2002
- 标注页数:402页
- 文件大小:25MB
- 文件页数:418页
- 主题词:
PDF下载
下载说明
知识发现PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
前言1
第1章 绪论1
1.1 知识1
1.2 知识发现2
1.3 知识发现的任务4
1.3.1 数据总结4
1.3.2 概念描述5
1.3.3 分类5
1.3.6 偏差分析6
1.3.5 相关性分析6
1.3.4 聚类6
1.3.7 建模7
1.4 知识发现的方法7
1.4.1 统计方法7
1.4.2 机器学习9
1.4.3 神经计算11
1.4.4 可视化12
1.5 知识发现的对象13
1.5.1 数据库13
1.5.2 文本14
1.5.4 空间数据15
1.5.3 Web信息15
1.5.5 图像和视频数据16
1.6 知识发现与创新17
第2章 决策树21
2.1 归纳学习21
2.2 决策树学习21
2.3 CLS学习算法23
2.4 ID3学习算法24
2.4.1 信息论简介24
2.4.2 信息论在决策树学习中的意义及应用25
2.4.4 ID3算法应用举例26
2.4.3 ID3算法26
2.5 决策树的改进算法28
2.5.1 二叉树判定算法28
2.5.2 按信息比值进行估计的方法29
2.5.3 按分类信息估值29
2.5.4 按划分距离估值的方法30
2.6 决策树的评价31
2.7 简化决策树32
2.7.1 简化决策树的动机33
2.7.2 决策树过大的原因33
2.7.3 控制树的大小34
2.7.4 修改测试属性空间36
2.7.5 改进测试属性选择方法38
2.7.6 对数据进行限制40
2.7.7 改变数据结构41
2.8 连续型属性离散化44
2.9 基于偏置变换的决策树学习算法BSDT45
2.9.1 偏置的形式化46
2.9.2 表示偏置变换47
2.9.3 算法描述48
2.9.4 过程偏置变换49
2.9.6 经典范例库维护算法TCBM51
2.9.5 基于偏置变换的决策树学习算法BSDT51
2.9.7 偏置特征抽取算法52
2.9.8 改进的决策树生成算法GSD53
2.9.9 实验结果55
2.10 归纳学习中的问题56
第3章 关联规则57
3.1 关联规则挖掘概述57
3.1.1 关联规则的意义和度量57
3.1.2 经典的挖掘算法59
3.2 广义模糊关联规则的挖掘61
3.4 任意多表间关联规则的并行挖掘64
3.3 挖掘关联规则的数组方法64
3.4.1 问题的形式描述65
3.4.2 单表内大项集的并行计算65
3.4.3 任意多表间大项集的生成67
3.4.4 跨表间关联规则的提取68
3.5 基于分布式系统的关联规则的挖掘算法68
3.5.1 候选集的生成69
3.5.2 候选数据集的局部剪枝71
3.5.3 候选数据集的全局剪枝73
3.5.4 合计数轮流检测75
3.5.5 分布式挖掘关联规则的算法76
3.6.1 汉语词性标注78
3.6 词性标注规则的挖掘算法与应用78
3.6.2 问题的描述79
3.6.3 挖掘算法80
3.6.4 试验结果83
第4章 基于范例的推理85
4.1 概述85
4.2 过程模型86
4.3 范例的表示88
4.3.1 语义记忆单元89
4.3.2 记忆网89
4.4 范例的索引91
4.5 范例的检索92
4.6 相似性关系93
4.6.1 语义相似性94
4.6.2 结构相似性94
4.6.3 目标特征94
4.6.4 个体相似性95
4.6.5 相似性计算95
4.7 范例的复用96
4.8 范例的保存98
4.9 基于例示的学习99
4.9.1 基于例示学习的任务99
4.9.2 IBI算法100
4.9.3 降低存储要求102
4.10 范例工程104
4.11 范例约简算法106
4.12 中心渔场预报专家系统109
4.12.1 问题分析与范例表示109
4.12.2 相似性度量111
4.12.3 索引与检索111
4.12.4 基于框架的修正112
4.12.5 实验结果114
5.1.2 模糊聚类的一般模型116
5.1.1 聚类结果的表示116
5.1 概述116
第5章 模糊聚类116
5.2 传递闭包法117
5.2.1 模糊相似系数的标定117
5.2.2 传递闭包法120
5.2.3 动态直接聚类法120
5.2.4 最大树法121
5.3 FCMBP聚类法122
5.3.1 问题背景122
5.3.2 Fuzzy等价标准型124
5.3.3 置换等价类与平移等价类的记数公式128
5.3.4 Xn的结构129
5.3.5 模糊最优等价阵的存在性130
5.3.6 最优模糊等价阵的算法步骤131
5.3.7 基于FCMBP模糊聚类的语音识别135
5.4 系统聚类法136
5.5 C-均值聚类法137
5.6 聚类有效性140
5.7 聚类方法的比较141
第6章 粗糙集143
6.1 概述143
6.1.2 新型的隶属关系145
6.1.1 知识的分类观点145
6.1.3 概念的边界观点146
6.2 知识的约简147
6.2.1 一般约简147
6.2.2 相对约简147
6.2.3 知识的依赖性148
6.3 决策逻辑149
6.3.1 决策表的公式化定义149
6.3.2 决策逻辑语言150
6.3.3 决策逻辑语言的语义151
6.3.4 决策逻辑的推演152
6.3.6 决策规则和决策算法153
6.3.5 规范表达形式153
6.3.7 决策规则中的一致性和不分明性154
6.4 决策表的约简154
6.4.1 属性的依赖性155
6.4.2 一致决策表的约简155
6.4.3 非一致决策表的约简160
6.5 粗糙集的扩展模型163
6.5.1 可变精度粗糙集模型164
6.5.2 相似模型165
6.5.3 基于粗糙集的非单调逻辑165
6.6 粗糙集的实验系统166
6.5.4 与其他数学工具的结合166
6.7 粗糙集的展望168
第7章 贝叶斯网络169
7.1 概述169
7.1.1 贝叶斯网络的发展历史169
7.1.2 贝叶斯方法的基本观点170
7.1.3 贝叶斯网络在数据挖掘中的应用170
7.2 贝叶斯概率基础172
7.2.1 概率论基础172
7.2.2 贝叶斯概率174
7.3 贝叶斯学习理论176
7.3.1 几种常用的先验分布选取方法177
7.3.2 计算学习机制179
7.3.3 贝叶斯问题求解181
7.4 简单贝叶斯学习模型183
7.4.1 简单贝叶斯学习模型183
7.4.2 简单贝叶斯模型的提升185
7.4.3 提升简单贝叶斯分类的计算复杂性187
7.5 贝叶斯网络的建造187
7.5.1 贝叶斯网络的结构及建立方法187
7.5.2 学习贝叶斯网络的概率分布188
7.5.3 学习贝叶斯网络的网络结构190
7.6 贝叶斯潜在语义模型193
7.7 半监督文本挖掘算法196
7.7.1 网页聚类196
7.7.2 对含有潜在类别主题词的文档的类别标注197
7.7.3 基于简单贝叶斯模型学习标注和未标注样本198
8.1.1 经验风险203
8.1.2 VC维203
8.1 统计学习问题203
第8章 支持向量机203
8.2 学习过程的一致性204
8.2.1 学习一致性的经典定义204
8.2.2 学习理论的重要定理204
8.2.3 VC熵205
8.3 结构风险最小归纳原理206
8.4 支持向量机208
8.4.1 线性可分208
8.4.2 线性不可分209
8.5.2 径向基函数211
8.5.3 多层感知机211
8.5.1 多项式核函数211
8.5 核函数211
8.5.4 动态核函数212
8.6 基于分类超曲面的海量数据分类方法213
8.6.1 Jordan曲线定理213
8.6.2 SVM直接方法基本思想214
8.6.3 实现算法215
8.6.4 实验结果分析215
第9章 隐马尔科夫模型219
9.1 马尔科夫过程219
9.2 隐马尔科夫模型220
9.3 似然概率和前反向算法221
9.3.1 前向算法222
9.3.2 反向算法222
9.3.3 Viterbi算法223
9.3.4 计算期望223
9.4 学习算法224
9.4.1 EM算法224
9.4.2 梯度下降225
9.4.3 Viterbi学习226
9.5 基于状态驻留时间的分段概率模型226
9.5.1 SDSPM模型的构成227
10.1.2 神经网络的学习方法230
10.1.1 基本的神经网络模型230
第10章 神经网络230
10.1 概述230
10.2 人工神经元及感知机模型232
10.2.1 基本神经元232
10.2.2 感知机模型233
10.3 前向神经网络234
10.3.1 前向神经网络模型234
10.3.2 多层前向神经网络的误差反向传播(BP)算法235
10.3.3 BP算法的苦干改进237
10.4 径向基函数神经网络241
10.4.2 正规化问题242
10.4.1 插值问题242
10.4.3 RBF网络学习方法244
10.5 反馈神经网络247
10.5.1 离散Hopfield网络247
10.5.2 连续Hopfield网络253
10.5.3 Hopfield网络应用255
10.5.4 双向联想记忆模型256
10.6 随机神经网络257
10.6.1 模拟退火算法257
10.6.2 玻尔兹曼机260
10.7.2 网络自组织算法263
10.7 自组织特征映射神经网络263
10.7.1 网络的拓扑结构263
10.7.3 有教师学习264
第11章 进化和遗传算法265
11.1 概述265
11.2 基本遗传算法267
11.2.1 基本遗传算法的构成要素267
11.2.2 基本遗传算法的一般框架268
11.3 遗传算法的数学理论270
11.3.1 模式定理271
11.3.2 积木块假设273
11.3.4 隐并行性274
11.3.3 遗传算法欺骗问题274
11.4 遗传算法的基本实现技术275
11.4.1 编码方法275
11.4.2 适应度函数278
11.4.3 选择算子280
11.4.4 交叉算子282
11.4.5 变异算子284
11.4.6 约束条件的处理方法285
11.5 遗传算法的高级实现技术285
11.5.1 反转操作285
11.5.3 小生境遗传算法286
11.5.2 变长度染色体遗传算法286
11.5.4 混合遗传算法287
11.5.5 改进遗传算法290
11.6 并行遗传算法291
11.7 遗传算法应用292
11.7.1 优化神经网络连接权值292
11.7.2 用遗传算法优化神经网络连接结构293
第12章 知识发现平台MSMiner295
12.1 概述295
12.2.1 数据仓库含义297
12.2 数据仓库297
12.2.2 元数据298
12.2.3 OLAP299
12.2.4 数据仓库和数据挖掘技术的结合299
12.3 MSMiner的体系结构300
12.3.1 数据挖掘模型300
12.3.2 系统功能301
12.3.3 体系结构302
12.4 元数据管理303
12.4.1 MSMiner元数据的内容303
12.4.3 MSMiner元数据对象模型304
12.4.2 MSMiner元数据库304
12.5 数据仓库管理器307
12.5.1 MSMiner数据仓库的基本结构308
12.5.2 主题309
12.5.3 数据抽取和集成310
12.5.4 数据抽取和集成的元数据313
12.5.5 数据仓库建模及OLAP的实现314
12.6 算法库管理318
12.6.1 数据挖掘算法的元数据318
12.6.2 可扩展性的实现319
12.6.3 挖掘算法的接口规范320
12.7.1 面向对象的数据挖掘任务模型322
12.7 数据挖掘任务规划322
12.7.2 数据挖掘任务模型的处理326
12.8 关系数据库知识发现查询语言KDSQL328
12.8.1 知识对象328
12.8.2 知识发现查询语言定义329
12.8.3 扩充的CREATE命令语句330
12.8.4 扩充的SELECT命令语句332
第13章 Web知识发现334
13.1 概述334
13.2 Web知识发现的任务336
13.2.1 Web知识发现任务的分类336
13.2.2 Web内容发现337
13.3 Web知识发现方法338
13.2.3 Web结构挖掘338
13.3.1 文本的特征表示339
13.3.2 TFIDF向量表示法340
13.3.3 特征子集的选取342
13.4 模型质量评价343
13.5 文本分析功能344
13.5.1 名字提取345
13.5.2 术语提取346
13.5.3 缩写词识别器346
13.6.1 一般特征项的提取347
13.5.4 其他提取器347
13.6 文本特征的提取347
13.6.2 专有特征项的提取348
13.7 基于文本挖掘的汉语词性自动标注研究351
13.8 文本分类352
13.9 文本聚类356
13.9.1 层次凝聚法356
13.9.2 平面划分法357
13.9.3 简单贝叶斯聚类算法358
13.9.5 分级聚类359
13.9.6 基于概念的文本聚类359
13.9.4 k-最近邻参照聚类算法359
13.10 文本摘要361
13.11 用户兴趣挖掘362
第14章 生物信息知识发现364
14.1 概述364
14.2 基因的基本结构366
14.3 生物信息数据库与查询367
14.3.1 基因和基因组数据库367
14.3.2 蛋白质数据库369
14.3.3 功能数据库370
14.4.1 序列两两比对371
14.4 序列比对371
14.4.2 多序列比对373
14.5 核酸与蛋白质结构和功能的预测分析374
14.5.1 核酸序列的预测方法374
14.5.2 针对蛋白质的预测方法375
14.6 基因组序列信息分析377
14.7 功能基因组相关信息分析380
14.7.1 大规模基因表达谱分析380
14.7.2 基因组水平蛋白质功能综合预测381
14.8 Internet资源和公共数据库382
参考文献387
索引398