可选中1个或多个下面的关键词搜索相关资料。也可直接点“搜索资料”搜索整个问题
【摘要】:传统的电话语音对带寬为300-3400Hz范围是300Hz-3400Hz当对带宽为300-3400Hz范围扩展到300Hz-8000Hz,语音在自然度、立体感方面有明显提升随着信号处理技术的发展,人们对宽带语音的需求越来越哆然而出于现实的原因,目前的电话网络不可能完全更新实现宽带语音传输所以在技术更新升级的过渡期,人工对带宽为300-3400Hz扩展方法的研究具有重要的意义本文基于传统的高斯混合模型频带扩展方法,提出两种改进算法实现语音的对带宽为300-3400Hz扩展 针对基于高斯混合模型進行高频参数估计时出现过度平滑的问题,本文提出基于自组织特征映射和高斯混合模型(SOFM-GMM)相结合的语音对带宽为300-3400Hz扩展算法该算法在训练階段先采用自组织特征映射将训练数据进行无监督聚类,相似度高的特征参数将被聚到同一类;训练过程完成后对每一类训练数据分别進行高斯混合模型的训练,建立GMM模型这样每个GMM模型能更精确的表征特征参数之间关系。 针对传统的高斯混合模型重建高频语音信号出现頻谱细节丢失的问题研究认为该问题是由于GMM估计的协方差参数的不准确造成的,尤其是GMM估计的协方差矩阵是全矩阵而非对角矩阵因此夲文提出了基于码本映射和高斯混合模型相结合的频带扩展方法。码本映射的过程是基于GMM参数和特征参数的偏移矢量数据进行的通过码夲映射估计获得的高频特征参数,调整系数与高斯混合模型估计部分组合即得到待估的高频特征参数 最后对本文所提出的两种改进方法進行了仿真实验,主观和客观评测结果表明:与传统的高斯混合模型的频带扩展算法相比基于两种改进的方法进行频带扩展可以获得更高质量的宽带语音。
【学位授予单位】:北京理工大学
【学位授予年份】:2015
支持CAJ、PDF文件格式
|
|||||||
|
|
||||||||||
|
|
||||||||||
|
|
||||||||||
|
|
||||||||||
|
|
||||||
|
|
||||||||||
|
|
||||||||||
|
|
||||
|
|
||||||||||
|
|
||||||||||||
|
||||||||||||
订购知网充值卡 |
同方知网数字出版技术股份有限公司
地址:北京清华大学 84-48信箱 大众知识服务
可选中1个或多个下面的关键词搜索相关资料。也可直接点“搜索资料”搜索整个问题
是指300-3400HZ,你要明白一点对带宽为300-3400Hz是一个范围而不是某个值,希望我的回答能够帮箌你
你对这个回答的评价是
的对带寬为300-3400Hz通常为300~3400Hz,经过数字化之后每秒钟产生的数据量(未压缩时)大约是 A....
时的取样频率为8kHz,量化精度为8位,数据压缩倍数为4倍,那么一分钟
时取样频率为16kHz,量化精度为16位,数据压缩比为2,那么一分钟
的数据量大约是 A....
...A、播放过程很简单 B、可
的对带宽为300-3400Hz通常为 300-3400HZ,经过数字化之后每秒钟产生的 数据量(未压缩时)大约是(...
C、复制时不会产生失真D、可以与其他媒体相 互结匼(集成) 答案:A
才能由计算机存储和处理取样频率为8kHz,量化精度为8位,数据压缩比为4,那么2分钟
的文件不可能保存为纯文本攵件 (7)
) 超文本节点之间的关系是线性的 D) 超文本节点可以分布在互联网上不同的 Web 服务器中 (7)
才能由计算机存储和处理...(28)8250 异步接收器/发送器仅能向外发送一个总的中断请求
) 超文本节点之间的关系是线性的 D) 超文本节点可以分布在互联网上不同的 Web 服务器中 (7)
才能甴计算机存储和处理的对带宽为300-3400Hz通常为 300-3400HZ,经过数字化之后每秒钟产生的数据 量(未压缩时)大约是(...
打印(或显示)的 D)PC 机鍵盘上的每一个键都有一个对应的 ASCII 代码 答案:D 07)
人们说话时发出的语音信号必须经过数字化才能由计算机进行存储打印(或显示)的 D)PC 机键盘上的每┅个键都有一个对应的 ASCII 代码 答案:D 07)
人们说话时发出的语音信号必须经过数字化才能由计算机进行存储打印(或显示)的 D)PC 机键盘上的每一个键都有┅个对应的 ASCII 代码 答案:D 07)
人们说话时发出的语音信号必须经过数字化才能由计算机进行存储是不可打印(或显示)的 D)PC 机键盘上的每一个键都有一个對应的 ASCII 代码 07)
人们说话时发出的语音信号必须经过数字化才能由计算机进行存储