图书介绍
数字音视频处理PDF|Epub|txt|kindle电子书版本网盘下载
![数字音视频处理](https://www.shukui.net/cover/14/31318639.jpg)
- 韩冰主编;杨曦,张建龙副主编 著
- 出版社: 西安:西安电子科技大学出版社
- ISBN:9787560647654
- 出版时间:2018
- 标注页数:256页
- 文件大小:52MB
- 文件页数:265页
- 主题词:数字技术-应用-音频设备;数字技术-应用-视频信号
PDF下载
下载说明
数字音视频处理PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 绪论1
1.1 数字音视频基础1
1.2 数字音视频技术的发展趋势2
1.3 数字音视频系统的组成3
1.4 本章小结6
第2章 听视觉处理的脑机制7
2.1 听觉的生理基础7
2.1.1 听觉感知模型的国内外研究现状8
2.1.2 人类听觉系统简介10
2.1.3 听觉特性12
2.1.4 听觉掩蔽13
2.1.5 听觉加工理论14
2.2 视觉的生理基础15
2.2.1 研究现状15
2.2.2 视觉感知17
2.2.3 人类视觉系统概述24
2.2.4 视觉注意机制25
2.3 本章小结29
第3章 数字音频技术基础30
3.1 数字信号处理基础30
3.1.1 线性和时不变30
3.1.2 冲激响应和卷积30
3.1.3 傅里叶变换、拉普拉斯变换和Z变换31
3.1.4 离散时间傅里叶变换(DTFT)与离散傅里叶变换(DFT)32
3.2 语音信号产生模型33
3.2.1 语音信号产生机理33
3.2.2 语音信号产生的数字模型34
3.3 语音信号的时域模型35
3.3.1 语音信号的预处理35
3.3.2 短时平均能量39
3.3.3 短时平均过零率41
3.3.4 短时自相关函数42
3.4 语音信号的频谱分析45
3.4.1 短时傅里叶变换(STFT)的定义和物理意义45
3.4.2 短时傅里叶变换的取样率47
3.4.3 语音信号的重构49
3.4.4 窗长及形状对STFT的影响50
3.4.5 语音的语谱图分析50
3.4.6 语音的倒谱51
3.5 本章小结52
第4章 音视频获取软件和方法53
4.1 音频信号采集软件和方法53
4.1.1 常见的音频采集设备的特点53
4.1.2 音频采集软件Windows录音机53
4.1.3 音频处理工具Sony Sound Forge55
4.2 图像/视频信号采集工具和方法63
4.2.1 图像信息采集技术63
4.2.2 视频信息采集技术65
4.3 音频/视频格式的转换85
4.3.1 音频格式转换85
4.3.2 视频格式转换87
4.4 本章小结88
第5章 音频压缩编码89
5.1 音频压缩概述89
5.1.1 音频信号89
5.1.2 音频压缩的必要性和可能性89
5.2 音频编码技术90
5.2.1 波形编码91
5.2.2 参数编码93
5.2.3 混合编码94
5.2.4 感知编码95
5.3 MPEG音频编码标准99
5.3.1 MPEG-1音频压缩编码标准100
5.3.2 MPEG-2音频压缩编码标准103
5.3.3 MPEG-4音频压缩编码标准107
5.4 本章小结112
第6章 图像视频压缩编码113
6.1 图像视频压缩概述113
6.1.1 图像视频信号的特点113
6.1.2 图像视频压缩的必要性和可行性114
6.2 图像压缩编码技术115
6.2.1 图像压缩编码系统的基本结构115
6.2.2 统计编码116
6.2.3 变换编码123
6.2.4 矢量量化编码124
6.2.5 预测编码125
6.3 视频编码技术127
6.3.1 视频编码系统的一般结构127
6.3.2 视频编码方案分类128
6.3.3 采用时间预测和变换编码的视频编码129
6.4 静止图像压缩标准133
6.4.1 JPEG静止图像压缩标准133
6.4.2 JPEG 2000静止图像压缩标准135
6.5 MPEG视频编码标准136
6.6 本章小结140
第7章 数字音频处理技术141
7.1 语音信号合成的基本方法141
7.1.1 概述141
7.1.2 共振峰合成法142
7.1.3 线性预测合成法144
7.1.4 基音同步叠加法146
7.1.5 文语转换系统148
7.2 语音识别的基本技术和方法149
7.2.1 概述149
7.2.2 语音识别原理151
7.2.3 特征表示与提取154
7.2.4 动态时间规整154
7.2.5 有限状态矢量量化技术156
7.2.6 孤立字(词)语音识别系统158
7.2.7 连续语音识别系统161
7.3 本章小结162
第8章 数字图像/视频处理技术163
8.1 图像的低层视觉处理163
8.1.1 概述163
8.1.2 空域滤波增强163
8.1.3 频域增强169
8.2 图像的中层视觉处理173
8.2.1 概述173
8.2.2 图像分割的定义和依据174
8.2.3 边缘点检测175
8.2.4 边缘线跟踪179
8.2.5 门限化分割184
8.2.6 区域分割法186
8.3 视频处理中的关键技术研究188
8.3.1 概述188
8.3.2 镜头边界检测189
8.3.3 视频关键帧的提取方法194
8.3.4 视频目标检测199
8.4 本章小结208
第9章 基于内容的视频检索技术209
9.1 引言209
9.1.1 信息检索209
9.1.2 多媒体检索209
9.2 基于内容的音频检索211
9.2.1 国内外研究现状212
9.2.2 基于内容的音频检索的总体框架217
9.2.3 基于内容的音频检索的难点218
9.2.4 现有的音频检索系统219
9.3 基于内容的图像检索技术224
9.3.1 基于内容的图像检索系统的检索过程和关键技术224
9.3.2 现有的图像检索系统229
9.3.3 图像检索系统的发展趋势232
9.4 基于内容的视频检索技术233
9.4.1 引言233
9.4.2 基于内容的视频检索及关键技术235
9.4.3 现有的基于内容的视频检索系统242
9.4.4 TRECVID(The Text RetrievalConference Video Track)会议246
9.4.5 存在的问题及发展趋势246
9.5 本章小结248
参考文献249