nav emailalert searchbtn searchbox tablepage yinyongbenwen piczone journalimg journalInfo searchdiv qikanlogo popupnotification paper paperNew
2020, 02, v.37;No.132 30-36
语音增强技术研究综述
基金项目(Foundation):
邮箱(Email):
DOI: 10.16191/j.cnki.hbkx.2020.02.006
摘要:

语音增强是语音识别的重要组成部分,它是将尽可能纯净的原始语音从嘈杂的语音中提取出来。其目的是提高语音质量,从而提高语音识别的准确率。笔者在总结近年来的语音增强的相关算法的基础上,将这些算法进行分类,分为基于数字信号处理的方法和机器学习的方法。本文介绍了基于数字信号处理和基于机器学习的语音增强算法,并总结了几种常用语音增强算法的优缺点,最后提出了语音增强算法进一步研究方向。

Abstract:

Speech enhancement is the extraction of original speech as pure as possible from noisy speech,which is an important part of speech recognition.Its purpose is to improve the quality of speech,so as to improve the accuracy of speech recognition.On the basis of summarizing the related algorithms of speech enhancement in recent years,the author classifies these algorithms into digital signal processing methods and machine learning methods.This paper introduces the speech enhancement algorithms based on digital signal processing and machine learning,summarizes the advantages and disadvantages of several commonly used speech enhancement algorithms,and finally puts forward the existing problems of speech enhancement algorithms and further research directions.

参考文献

[1] R.Boutaleb,H.Meraoubi,F.Ykhlef,W.Benzaba,Y.Boucetta and L.Bendaouia.Comparative performance study between Spectral Subtraction and Discreet Wavelet Transform for Speech enhancement[J].2013ACS International Conference on Computer Systems and Applications(AICCSA),Ifrane,2013.

[2] P.Lakkhanawannakun and C.Noyunsan.Speech Recognition using Deep Learning[J].2019 34th International Technical Conference on Circuits/Systems,Computers and Communications(ITC-CSCC),JeJu,Korea(South),2019.

[3]王路露,刘光灿,夏旭.一种改进型谱减算法的语音增强研究[J].计算机工程与应用,2014,50(19):210-213.

[4]张青,吴进.基于多窗谱估计的改进维纳滤波语音增强[J].计算机应用与软件,2017,34(03):67-70+118.

[5]卢炳乾,冯存前,龙戈农.基于小波变换的变步长LMS自适应滤波算法[J].中国电子科学研究院学报,2013,8(05):512-515.

[6]张丽艳,殷福亮.一种改进的奇异值分解语音增强方法[J].电子与信息学报,2008,(02):357-361.

[7]闫姝,权建军.基于麦克风阵列的语音增强算法研究[J].自动化仪表,2019,40(09):59-62.

[8]蒋茂松,王冬霞,牛芳琳,曹玉东.稀疏正则非负矩阵分解的语音增强算法[J].计算机应用,2018,38(04):1176-1180.

[9]李艳生,刘园,张毅.基于感知掩蔽的重构非负矩阵分解单通道语音增强算法[J].计算机应用,2019,39(03):894-898.

[10]许春冬,许瑞龙,周静.基于自动编码生成对抗网络的语音增强算法[J].计算机工程与设计,2019,40(09):2578-2583.

[11]李如玮,孙晓月,刘亚楠,李涛.基于深度学习的听觉倒谱系数语音增强算法[J].华中科技大学学报(自然科学版),2019,47(09):78-83.

[12]程塨,郭雷,贺胜,赵天云.一种基于实时噪声估计的改进谱减法[J].计算机科学,2010,37(11):212-213+222.

[13]严思伟,屈晓旭,娄景艺.基于连续噪声谱估计的谱减法语音增强算法[J].通信技术,2018,51(06):1296-1301.

[14]郑成诗,胡笑浒,周翊,李晓东.基于噪声谱结构特性的谱减法[J].声学学报,2010,35(02):215-222.

[15]董胡,徐雨明,马振中,李列文,任可.基于小波包与自适应维纳滤波的语音增强算法[J].计算机技术与发展,2020,30(01):50-53

[16]奚吉,梁瑞宇,王国伟,仇晓梅,马安骏.多通道助听器语音降噪算法研究[J].计算机工程与应用,2014,50(11):237-240.

[17]郭利华,马建芬.具有高可懂度的改进的维纳滤波的语音增强算法[J].计算机应用与软件,2014,31(11):155-157.

[18]王海艳.基于统计模型的语音增强算法研究[D].吉林大学,2011.

[19]王瑜琳,田学隆,高雪利.自适应滤波语音增强算法改进及其DSP实现[J].计算机工程与应用,2015,51(01):208-212+233.

[20] Mouna El Bakkali,Francis Chan Wai Po,Emeric de Foucauld,Bernard Viala,Jean-Philippe Michel.Design of a RF matching network based on a new tunable inductor concept[J].Microelectronics Journal,2010,42(1).

[21]汪成曦,刘以安,张强.改进的最小均方自适应滤波算法[J].计算机应用,2012,32(07):2078-2081.

[22]尹栋,蒋涉权,刘宝光,杨立东,王晶.语音增强算法综述及性能分析[J].电声技术,2015,39(05):58-61+65.

[23]刘鹏,马建芬.具有较高可懂度的子空间语音增强算法[J].计算机工程与设计,2013,34(07):2619-2622.

[24]王彪,李建文,王钟斐.基于小波分析的新阈值去噪方法[J].计算机工程与设计,2011,32(03):1099-1102.

[25]刘艳,倪万顺.基于子带谱熵的仿生小波语音增强[J].计算机应用,2015,35(03):868-871.

[26]王义圆,张曦文,周贻能,黄际彦.基于麦克风阵列的语音增强与干扰抑制算法[J].电声技术,2018,42(02):1-5.

[27]李恝,吴海彬,叶锦华.改进经验模态分解的麦克风阵列语音增强方法[J].福州大学学报(自然科版),2019,47(06):734-739.

[28]黄苏雨,梁声灼,黄苏园.语音增强方法综述[J].计算机与现代化,2007,(03):16-20.

[29]王作英,肖熙.基于段长分布的HMM语音识别模型[J].电子学报,2004,(01):46-49.

[30] Lee D D,Seung H S.Learning the parts of objects by non-negative matrix factorization[J].Nature,1999,401(6755).

[31]隋璐瑛,张雄伟,黄建军,董军涛.一种基于非负矩阵分解的语音增强算法[J].军事通信技术,2012,33(01):18-22+30.

[32]时文华,倪永婧,张雄伟,邹霞,孙蒙,闵刚.联合稀疏非负矩阵分解和神经网络的语音增强[J].计算机研究与发展,2018,55(11):2430-2438.

[33]王波,于凤芹,陈莹.基于非平滑非负矩阵分解语音增强[J].计算机工程与应用,2017,53(07):160-164.

[34]胡永刚,张雄伟,邹霞,张立伟,郑云飞.贝叶斯非负矩阵分解语音增强的优化算法[J].解放军理工大学学报(自然科学版),2015,16(01):1-6.

[35]张立伟,张雄伟,胡永刚,闵刚,李轶南.改进贝叶斯非负矩阵分解的语音增强算法[J].解放军理工大学学报(自然科学版),2015,16(05):407-412.

[36]张立伟,贾冲,张雄伟,闵刚,曾理.稀疏卷积非负矩阵分解的语音增强算法[J].数据采集与处理,2014,29(02):259-264.

[37] Y.Wang and D.Wang.Towards Scaling Up Classification-Based Speech Separation[J].IEEE Transactions on Audio,Speech,and Language Processing,vol.21,no.7,pp.1381-1390,July 2013.

[38] Y.Wang,A.Narayanan and D.Wang.On Training Targets for Supervised Speech Separation[J].IEEE/ACM Transactions on Audio,Speech,and Language Processing,vol.22,no.12,pp.1849-1858,Dec.2014.

[39] Y.Xu,J.Du,L.Dai and C.Lee.An Experimental Study on Speech Enhancement Based on Deep Neural Networks[J].IEEE Signal Processing Letters,vol.21,no.1,pp.65-68,Jan.2014.

[40] Y.Xu,J.Du,L.Dai and C.Lee.A Regression Approach to Speech Enhancement Based on Deep Neural Networks[J].IEEE/ACM Transactions on Audio,Speech,and Language Processing,vol.23,no.1,pp.7-19,Jan.2015.

[41]袁文浩,娄迎曦,夏斌,孙文珠.基于卷积门控循环神经网络的语音增强方法[J].华中科技大学学报(自然科学版),2019,47(04):13-18.

[42]徐思颖,屈丹.基于正则化的深度神经网络语音增强自适应方法[J].信息工程大学学报,2018,19(05):556-561.

基本信息:

DOI:10.16191/j.cnki.hbkx.2020.02.006

中图分类号:TN912.35

引用信息:

[1]曹丽静.语音增强技术研究综述[J].河北省科学院学报,2020,37(02):30-36.DOI:10.16191/j.cnki.hbkx.2020.02.006.

基金信息:

检 索 高级检索

引用

GB/T 7714-2015 格式引文
MLA格式引文
APA格式引文