图书介绍

Python自然语言处理PDF|Epub|txt|kindle电子书版本网盘下载

Python自然语言处理
  • 印度雅兰·萨纳卡(Jalaj Thanaki) 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111606703
  • 出版时间:2018
  • 标注页数:284页
  • 文件大小:51MB
  • 文件页数:304页
  • 主题词:软件工具-自然语言处理

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

Python自然语言处理PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 引言1

1.1自然语言处理1

1.2基础应用5

1.3高级应用6

1.4 NLP和Python相结合的优势7

1.5 nltk环境搭建7

1.6读者提示8

1.7总结9

第2章 实践理解语料库和数据集10

2.1语料库10

2.2语料库的作用11

2.3语料分析13

2.4数据属性的类型16

2.4.1分类或定性数据属性16

2.4.2数值或定量数据属性17

2.5不同文件格式的语料18

2.6免费语料库资源19

2.7为NLP应用准备数据集20

2.7.1挑选数据20

2.7.2预处理数据集20

2.8网页爬取21

2.9总结23

第3章 理解句子的结构24

3.1理解NLP的组成24

3.1.1自然语言理解24

3.1.2自然语言生成25

3.1.3 NLU和NLG的区别25

3.1.4 NLP的分支26

3.2上下文无关文法26

3.3形态分析28

3.3.1形态学28

3.3.2词素28

3.3.3词干28

3.3.4形态分析28

3.3.5词29

3.3.6词素的分类29

3.3.7词干和词根的区别32

3.4词法分析32

3.4.1词条33

3.4.2词性标注33

3.4.3导出词条的过程33

3.4.4词干提取和词形还原的区别34

3.4.5应用34

3.5句法分析34

3.6语义分析36

3.6.1语义分析概念36

3.6.2词级别的语义37

3.6.3上下位关系和多义词37

3.6.4语义分析的应用38

3.7消歧38

3.7.1词法歧义38

3.7.2句法歧义39

3.7.3语义歧义39

3.7.4语用歧义39

3.8篇章整合40

3.9语用分析40

3.10总结40

第4章 预处理42

4.1处理原始语料库文本42

4.1.1获取原始文本42

4.1.2小写化转换44

4.1.3分句44

4.1.4原始文本词干提取46

4.1.5原始文本词形还原46

4.1.6停用词去除48

4.2处理原始语料库句子50

4.2.1词条化50

4.2.2单词词形还原51

4.3基础预处理52

4.4实践和个性化预处理57

4.4.1由你自己决定57

4.4.2预处理流程57

4.4.3预处理的类型57

4.4.4理解预处理的案例57

4.5总结62

第5章 特征工程和NLP算法63

5.1理解特征工程64

5.1.1特征工程的定义64

5.1.2特征工程的目的64

5.1.3一些挑战65

5.2 NLP中的基础特征65

5.2.1句法分析和句法分析器65

5.2.2词性标注和词性标注器81

5.2.3命名实体识别85

5.2.4 n元语法88

5.2.5词袋89

5.2.6语义工具及资源91

5.3 NLP中的基础统计特征91

5.3.1数学基础92

5.3.2 TF-IDF96

5.3.3向量化99

5.3.4规范化100

5.3.5概率模型101

5.3.6索引103

5.3.7排序103

5.4特征工程的优点104

5.5特征工程面临的挑战104

5.6总结104

第6章 高级特征工程和NLP算法106

6.1词嵌入106

6.2 word2vec基础106

6.2.1分布语义107

6.2.2定义word2vec108

6.2.3无监督分布语义模型中的必需品108

6.3 word2vec模型从黑盒到白盒109

6.4基于表示的分布相似度110

6.5 word2vec模型的组成部分111

6.5.1 word2vec的输入111

6.5.2 word2vec的输出111

6.5.3 word2vec模型的构建模块111

6.6 word2vec模型的逻辑113

6.6.1词汇表构建器114

6.6.2上下文环境构建器114

6.6.3两层的神经网络116

6.6.4算法的主要流程119

6.7 word2vec模型背后的算法和数学理论120

6.7.1 word2vec算法中的基本数学理论120

6.7.2词汇表构建阶段用到的技术121

6.7.3上下文环境构建过程中使用的技术122

6.8神经网络算法123

6.8.1基本神经元结构123

6.8.2训练一个简单的神经元124

6.8.3单个神经元的应用126

6.8.4多层神经网络127

6.8.5反向传播算法127

6.8.6 word2vec背后的数学理论128

6.9生成最终词向量和概率预测结果的技术130

6.10 word2vec相关的一些事情131

6.11 word2vec的应用131

6.11.1实现一些简单例子132

6.11.2 word2vec的优势133

6.11.3 word2vec的挑战133

6.11.4在实际应用中使用word2vec134

6.11.5何时使用word2vec135

6.11.6开发一些有意思的东西135

6.11.7练习138

6.12 word2vec概念的扩展138

6.12.1 para2vec139

6.12.2 doc2vec139

6.12.3 doc2vec的应用140

6.12.4 GloVe140

6.12.5练习141

6.13深度学习中向量化的重要性141

6.14总结142

第7章 规则式自然语言处理系统143

7.1规则式系统144

7.2规则式系统的目的146

7.2.1为何需要规则式系统146

7.2.2使用规则式系统的应用147

7.2.3练习147

7.2.4开发规则式系统需要的资源147

7.3规则式系统的架构148

7.3.1从专家系统的角度来看规则式系统的通用架构149

7.3.2 NLP应用中的规则式系统的实用架构150

7.3.3 NLP应用中的规则式系统的定制架构152

7.3.4练习155

7.3.5 Apache UIMA架构155

7.4规则式系统的开发周期156

7.5规则式系统的应用156

7.5.1使用规则式系统的NLP应用156

7.5.2使用规则式系统的通用AI应用157

7.6使用规则式系统来开发NLP应用157

7.6.1编写规则的思维过程158

7.6.2基于模板的聊天机器人应用165

7.7规则式系统与其他方法的对比168

7.8规则式系统的优点169

7.9规则式系统的缺点169

7.10规则式系统面临的挑战170

7.11词义消歧的基础170

7.12规则式系统近期发展的趋势171

7.13总结171

第8章 自然语言处理中的机器学习方法172

8.1机器学习的基本概念172

8.2自然语言处理应用的开发步骤176

8.2.1第一次迭代时的开发步骤177

8.2.2从第二次到第N次迭代的开发步骤177

8.3机器学习算法和其他概念179

8.3.1有监督机器学习方法179

8.3.2无监督机器学习方法206

8.3.3半监督机器学习算法210

8.3.4一些重要概念211

8.3.5特征选择215

8.3.6维度约减219

8.4自然语言处理中的混合方法221

8.5总结221

第9章 NLU和NLG问题中的深度学习223

9.1人工智能概览223

9.1.1人工智能的基础223

9.1.2人工智能的阶段225

9.1.3人工智能的种类227

9.1.4人工智能的目标和应用227

9.2 NLU和NLG之间的区别232

9.2.1自然语言理解232

9.2.2自然语言生成232

9.3深度学习概览233

9.4神经网络基础234

9.4.1神经元的第一个计算模型235

9.4.2感知机236

9.4.3理解人工神经网络中的数学概念236

9.5实现神经网络249

9.5.1单层反向传播神经网络249

9.5.2练习251

9.6深度学习和深度神经网络251

9.6.1回顾深度学习251

9.6.2深度神经网络的基本架构251

9.6.3 NLP中的深度学习252

9.6.4传统NLP和深度学习NLP技术的区别253

9.7深度学习技术和NLU255

9.8深度学习技术和NLG262

9.8.1练习262

9.8.2菜谱摘要和标题生成262

9.9基于梯度下降的优化265

9.10人工智能与人类智能269

9.11总结269

第10章 高级工具270

10.1使用Apache Hadoop作为存储框架270

10.2使用Apache Spark作为数据处理框架272

10.3使用Apache Flink作为数据实时处理框架274

10.4 Python中的可视化类库274

10.5总结275

第11章 如何提高你的NLP技能276

11.1开始新的NLP职业生涯276

11.2备忘列表277

11.3确定你的领域277

11.4通过敏捷的工作来实现成功278

11.5 NLP和数据科学方面一些有用的博客278

11.6使用公开的数据集278

11.7数据科学领域需要的数学知识278

11.8总结279

第12章 安装指导280

12.1安装Python、pip和NLTK280

12.2安装PyCharm开发环境280

12.3安装依赖库280

12.4框架安装指导281

12.5解决你的疑问281

12.6总结281

热门推荐