图书介绍
中文信息处理技术 原理与应用PDF|Epub|txt|kindle电子书版本网盘下载
![中文信息处理技术 原理与应用](https://www.shukui.net/cover/3/33140645.jpg)
- 李宝安,李燕,孟庆昌编著 著
- 出版社: 北京:清华大学出版社
- ISBN:7302112002
- 出版时间:2005
- 标注页数:365页
- 文件大小:26MB
- 文件页数:380页
- 主题词:汉字信息处理-高等学校-教材
PDF下载
下载说明
中文信息处理技术 原理与应用PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
目 录1
第1章 中文信息处理技术概论1
1.1 信息处理的实质1
1.1.1 信息和信息技术1
1.1.2 文字信息处理3
1.1.3 中文的文字信息处理的特点5
1.2 汉字编码的种类与中文信息处理过程中汉字编码的变换9
1.3 中英文兼容技术10
1.4.1 概述11
1.4 ASCⅡ体系的汉字内码11
1.4.2 未占用C1区的编码方式12
1.4.3 覆盖C1区的编码方式15
1.5 Unicode与Unicode汉字16
1.5.1 背景16
1.5.2 替代标准16
1.5.3 方法与状态17
1.5.4 设计思想17
1.5.5 Unicode字集18
1.5.6 未来扩展与字符收录20
1.5.7 代码赋值20
1.5.8 细目21
1.5.9 Unicode汉字23
1.6 中文信息处理系统五层结构模型26
1.7 中文信息处理技术发展概况29
1.7.1 汉字标准代码29
1.7.2 汉字操作平台30
1.7.3 汉字输入方法32
1.7.4 文字处理和文字编辑排版系统33
1.7.5 中文信息检索系统技术35
1.7.6 翻译系统技术35
1.7.7 汉语自然语言理解36
习题137
第2章 汉字编码输入原理38
2.1 汉字和汉字属性38
2.1.1 汉字发展及其分级38
2.1.2 汉字的结构分析39
2.1.3 汉字的字音和字义41
2.1.4 汉字的排序42
2.1.5 汉字的属性43
2.2 汉字编码输入方法44
2.2.1 概述44
2.2.2 汉字键盘码的笛卡儿积集分析46
2.2.3 汉字信息的熵值47
2.2.4 海曼公式与汉字编码的键盘特性48
2.2.5 汉字编码输入方法的简易评测方法48
2.2.6 汉字编码输入方法专业评测方法49
2.2.7 汉字键盘码的译码问题51
2.3 有关中文输入技术现状与发展的几个问题51
习题255
第3章 汉字字形存储与压缩技术56
3.1 汉字字形存储与字形码56
3.1.1 汉字字形的数字化56
3.1.2 整字存储与压缩存储57
3.2 汉字压缩存储常见方法58
3.3 衡量压缩与还原技术的重要指标59
3.4 汉字字形压缩的方法与技术60
3.4.1 汉字笔画矢量存储方法60
3.4.2 部件组字压缩方法66
3.4.3 子信息块哈夫曼树压缩71
3.4.4 字形轮廓压缩74
3.4.5 黑白段与线性增量压缩77
3.4.6 笔画轮廓压缩79
习题388
4.1.1 概述89
4.1 OCR技术概况89
第4章 汉字识别技术89
4.1.2 汉字识别应用领域90
4.1.3 印刷体文字识别的研究91
4.2 汉字识别种类93
4.3 汉字识别原理94
4.4 汉字识别一般方法95
4.4.1 印刷体文字识别研究方法简介95
4.4.2 联机手写文字识别研究方法98
4.5 汉字识别产品介绍106
4.5.1 汉王数字化档案馆解决方案概述106
4.5.2 汉王数字档案资源建设107
4.5.3 汉王数字档案的管理利用111
4.5.4 汉王数字图书馆解决方案114
4.6 汉字识别技术的最新进展119
4.7 汉字识别系统的未来发展120
习题4122
第5章 中西文兼容处理技术123
5.1 中西文兼容处理的概念123
5.2 中文信息处理系统结构124
5.2.1 汉字终端125
5.2.2 汉字微型机系统129
5.3.1 各种编码的辨析与比较130
5.3 汉字的编码体系130
5.3.2 常用编码方式的转换134
5.3.3 中文编码的编码范围135
5.4 系统级兼容处理方法135
5.4.1 输入管理模块138
5.4.2 显示管理模块139
5.4.3 打印管理模块141
5.4.4 字库管理模块141
5.4.5 语音管理模块142
5.6.1 终端仿真143
5.6 终端级兼容处理方法143
5.5 应用级兼容处理方法143
5.6.2 通用仿真终端144
5.7 UNIX操作系统的中文化与国际化145
5.8 开放式中西文兼容操作系统设计147
5.9 中文操作系统的现状与发展151
5.9.1 中文外挂平台的发展152
5.9.2 自有知识产权的操作系统COSIX152
5.9.3 发展基于Linux的自主操作系统153
习题5156
6.1.1 语言的分类与自然语言158
第6章 汉语自然语言理解158
6.1 汉语自然语言理解概述158
6.1.2 理解语言的过程160
6.1.3 中文有没有文法161
6.1.4 关于中文信息是否要求分词161
6.1.5 中文理解的单位161
6.2 自然语言理解国外研究现状162
6.3 汉语自然语言理解与生成的国内研究现状164
6.4 汉语理解与生成的难点与问题167
6.5 自然语言理解过程的层次168
6.6.1 汉语理解系统的组成169
6.6 基于语法的汉语自然理解系统169
6.6.2 基于语法的理解系统实例172
6.7 基于语义的汉语自然理解系统176
6.7.1 HNC理论的形成178
6.7.2 HNC理论的基本内容179
6.7.3 HNC理论的实现186
6.8 基于语料库方法和统计语言模型的汉语自然理解系统187
6.9 汉语理解研究的应用前景与发展策略191
习题6192
7.1 中文应用系统发展概况193
7.1.1 我国中文信息处理技术发展的历史回顾193
第7章 中文信息处理技术的应用193
7.1.2 我国中文信息处理技术的发展阶段194
7.2 中文电子印刷排版系统197
7.2.1 系统构成198
7.2.2 精密汉字字模和照排控制技术199
7.2.3 字模信息还原和照排控制201
7.2.4 激光照排机201
7.2.5 排版软件的功能201
7.2.6 电子印刷排版系统应发展多个层次等级202
7.2.7 中文电子印刷排版系统技术的未来发展203
7.2.8 电子印刷排版系统相关方案和产品介绍204
7.3 中文信息检索系统217
7.3.1 信息、知识、文献217
7.3.2 文献信息资源的类型与特点219
7.3.3 信息检索的含义与实质222
7.3.4 信息检索的重要意义与作用223
7.3.5 计算机检索的发展历史223
7.3.6 计算机检索原理225
7.3.7 计算机检索系统的构成226
7.3.8 信息检索的类型与特点226
7.3.9 信息检索效率的评价指标227
7.3.10 信息检索的方式228
7.3.11 信息检索语言229
7.3.12 中文文本的标引235
7.3.13 中文文献的自动分类243
7.3.14 信息检索方法245
7.3.15 信息检索技术249
7.4 基于Internet的搜索引擎252
7.4.1 搜索引擎概述252
7.4.2 国外主要搜索引擎255
7.4.3 中文搜索引擎比较257
7.4.4 搜索引擎工作流程268
7.4.5 搜索引擎的使用方法269
7.4.6 总体评价与展望270
7.5 中文办公自动化系统272
7.5.1 办公自动化系统概述272
7.5.2 中文办公软件产品介绍——WPS Office 2002技术白皮书274
7.5.3 中文办公软件产品介绍——WPS二次开发技术白皮书289
习题7292
附录A 中华人民共和国国家标准GB 2312—1980《信息技术信息交换用汉字编码字符集 基本集》294
附录B 中华人民共和国国家标准GB/T 7589—1987《信息交换用汉字编码字符集 第二辅助集》327
附录C 中华人民共和国国家标准GB/T 7590—1987《信息交换用汉字编码字符集 第四辅助集》331
附录D 中华人民共和国国家标准GB 13000.1—1993《信息技术 通用多八位编码字符集(UCS) 第一部分:体系结构与基本多文种平面》334
附录E 中华人民共和国国家标准GB 18030—2000《信息技术信息交换用汉字编码字符集 基本集的扩充》357
参考文献364