图书介绍
基于索引行聚类的英语动词型式自动识别与提取研究PDF|Epub|txt|kindle电子书版本网盘下载
![基于索引行聚类的英语动词型式自动识别与提取研究](https://www.shukui.net/cover/65/34537101.jpg)
- 于涛著 著
- 出版社: 北京:外语教学与研究出版社
- ISBN:9787513596596
- 出版时间:2017
- 标注页数:240页
- 文件大小:29MB
- 文件页数:264页
- 主题词:英语-动词-研究
PDF下载
下载说明
基于索引行聚类的英语动词型式自动识别与提取研究PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
绪论1
0.1 研究背景1
0.2 本研究的理论及实践意义4
0.2.1 理论意义4
0.2.2 实践意义6
0.3 本研究概述9
0.3.1 研究目的9
0.3.2 研究问题及研究对象9
0.3.3 研究步骤10
0.3.3.1 语料及预处理11
0.3.3.2 特征集的建立及其转换11
0.3.3.3 权重计算13
0.3.3.4 索引行聚类14
0.3.3.5 型式提取15
0.4 本书结构15
0.5 小结16
第一章 型式与型式语法17
1.1 型式17
1.1.1 型式研究的缘起与发展17
1.1.2 型式的定义20
1.1.3 型式实例21
1.1.4 型式元素及其编码23
1.1.5 本研究中判别型式的六个标准26
1.2 型式语法26
1.2.1 短语学思想与习语原则27
1.2.2 词汇与语法关系及各自地位28
1.2.2.1 词汇语法不可分28
1.2.2.2 词汇为中心的研究30
1.2.3 型式与意义的关系32
1.3 型式语法的优缺点35
1.3.1 型式语法与传统语法的差异35
1.3.2 型式语法的优点36
1.3.3 型式语法的不足37
1.4 以型式语法为理论基础的相关研究40
1.5 小结41
第二章 型式识别方法与相关应用研究42
2.1 型式识别标准42
2.2 型式总结的必要性43
2.3 型式的识别44
2.3.1 型式的人工识别45
2.3.2 型式人工识别辅助工具的开发48
2.3.3 型式的自动识别48
2.3.3.1 型式自动识别的理据48
2.3.3.2 型式的自动识别研究51
2.4 现有的语言型式网络平台数据库52
2.4.1 基于机器处理的网络数据库53
2.4.2 基于人工处理的网络数据库54
2.5 小结56
第三章 聚类分析57
3.1 文本表示58
3.2 特征选择及其权重59
3.2.1 特征选择59
3.2.2 权重计算60
3.3 相似度计算61
3.3.1 相似度计算的源起及理据61
3.3.2 相似度计算方法61
3.3.3 相似度分析在语言研究中的应用63
3.4 聚类算法64
3.4.1 划分聚类65
3.4.2 层次聚类66
3.5 聚类质量评价指标67
3.6 聚类在本研究的应用理据68
3.7 小结69
第四章 文本预处理与特征集的建立及转换70
4.1 研究概述70
4.2 语料选取70
4.3 研究工具72
4.3.1 语料预处理工具72
4.3.2 自主开发的模块及脚本72
4.4 语料预处理流程73
4.5 动词型式中的必要元素及其转换方法75
4.5.1 型式列表中元素的总体特征75
4.5.2 具体词形的处理方法77
4.5.2.1 右侧搭配词处理方法77
4.5.2.2 左侧搭配词处理方法90
4.5.2.3 两侧搭配词处理方法90
4.5.3 相邻单词组合的处理方法90
4.5.4 词类标签及语义类标签的转换方法98
4.5.4.1 词类标签的转换方法98
4.5.4.2 语义类标签转换方法102
4.5.5 转换顺序及步骤104
4.6 小结105
第五章 索引行聚类及型式自动提取方法106
5.1 特征表示方法、特征权重与位置权重的计算106
5.1.1 特征及特征权重106
5.1.1.1 功能词处理方法107
5.1.1.2 特征标记方法107
5.1.1.3 型式边界的界定108
5.1.1.4 索引行跨距的设定110
5.1.1.5 特征权重计算方法112
5.1.2 位置权重112
5.1.3 特征—索引行矩阵的生成113
5.2 聚类算法114
5.2.1 相似度计算114
5.2.2 K均值算法115
5.2.2.1 K均值聚类115
5.2.2.2 K值的选择标准115
5.3 型式自动提取116
5.4 小结117
第六章 型式自动提取模型测试118
6.1 模型调试数据集及模型验证集的构建118
6.1.1 调试阶段语料集合的构成119
6.1.2 验证集的创建过程121
6.1.2.1 验证集中词项的选择121
6.1.2.2 验证集中索引行的抽取及处理方法122
6.2 配置文件的处理及参数设置与调整123
6.2.1 配置文件处理顺序123
6.2.2 参数设置与调整126
6.2.2.1 特征权重计算方法调试过程与解决方法126
6.2.2.2 位置权重计算方法调试过程及解决方法126
6.2.2.3 每个特征的总体权重计算方法127
6.2.2.4 跨距设定调试过程128
6.3 测试数据的评价指标128
6.3.1 聚类内部效度评估指标在本研究中的应用129
6.3.2 聚类外部效度评估指标在本研究中的应用134
6.4 数据结果报告135
6.4.1 索引行中型式及型式元素分布特征135
6.4.1.1 型式元素总体分布特征135
6.4.1.2 与动词高频共现的特征及其频数136
6.4.1.3 不同动词型式列表中特征的异同140
6.4.2 K值确定下基于现有人工标签的型式自动识别效度分析143
6.4.2.1 验证集中型式自动识别外部效度评估结果总体描述143
6.4.2.2 实验动词的型式自动识别准确率及召回率144
6.4.2.3 K值确定下型式自动识别后的再思考153
6.4.3 K值不确定下基于现有人工标签的型式自动识别效度分析153
6.4.3.1 K值不确定下型式自动识别的外部效度测量结果总体描述154
6.4.3.2 K值不确定下型式自动识别的准确率及召回率155
6.4.3.3 K值未知情况下模型验证的再思考170
6.5 分析和讨论171
6.5.1 数据背后的语言学思考171
6.5.1.1 印证了分布假设171
6.5.1.2 印证了词汇语法不可分172
6.5.1.3 型式元素间的横组合关系173
6.5.1.4 常规型式与非常规型式173
6.5.2 影响部分型式自动识别错误的原因175
6.5.2.1 型式元素间的插入成分175
6.5.2.2 无引导词THAT标志的从句识别176
6.5.2.3 赋码错误177
6.5.2.4 名词短语的识别问题177
6.5.3 关于聚类外部效度测量结果的再思考178
6.5.4 与前人研究结果的对比180
6.6 小结181
第七章 英语动词型式自动提取模型的应用设想183
7.1 应用范围183
7.1.1 型式自动识别与提取在语言教学领域的应用184
7.1.1.1 型式自动识别与提取在教学大纲制定中的应用184
7.1.1.2 型式自动识别与提取在语言课堂教学中的应用185
7.1.1.3 型式的自动识别与提取可以服务于学习者自主学习185
7.1.2 型式自动识别与提取在语言研究中的应用186
7.1.2.1 型式自动提取在词典编纂中的应用186
7.1.2.2 型式自动提取模型对非常规用法的识别186
7.1.2.3 型式自动识别在语言学研究中的应用187
7.1.3 型式自动识别与提取在其他领域的应用可能190
7.2 应用时需要注意的问题191
7.2.1 语料及语料的赋码191
7.2.2 聚类时参数的设置192
7.3 小结194
第八章 研究发现及价值195
8.1 研究发现195
8.1.1 索引行聚类的影响因素及分组数量的选择196
8.1.1.1 索引行聚类的影响因素196
8.1.1.2 索引行聚类时簇数量的选择196
8.1.2 型式自动识别的准确率及其影响因素197
8.1.2.1 型式自动识别准确率的提高197
8.1.2.2 影响部分型式自动识别错误的因素198
8.1.3 不同动词索引行中型式元素的分布存在差异198
8.2 研究价值及创新之处200
8.2.1 理论方面201
8.2.1.1 对型式语法的反哺201
8.2.1.2 对其他语言学理论的贡献205
8.2.2 方法论方面206
8.2.3 实践方面207
8.3 本研究的不足之处208
8.4 未来研究方向209
8.5 小结210
参考文献211
附录226