电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

基于HHT瞬时能频值的耳语音端点检测VIP专享VIP免费

基于HHT瞬时能频值的耳语音端点检测_第1页
基于HHT瞬时能频值的耳语音端点检测_第2页
基于HHT瞬时能频值的耳语音端点检测_第3页
2010,46(29)ComputerEngineeringandApplications计算机工程与应用1引言耳语音是人们的一种语音交流方式。目前对耳语音的研究虽然相对其他语言研究较少,但该研究已日益引起国内外研究机构和科研人员的重视[1]。随着耳语音识别[2-4]、转换[5-6]等研究的逐渐展开,准确地判断出耳语音的起点和终点,可以减少有效数据处理时间,提高识别精度,改善系统性能。研究表明,在语音识别系统中,有一半左右的错误率是由端点检测引起的[7]。因此,进行准确、有效的端点检测是耳语音信号处理中首先要解决的问题。与正常语音相比,耳语音最主要的特点是声带不振动,没有基频,发音很不稳定,信噪比较低[8],容易淹没在嘈杂的背景噪声中,这些给耳语音的端点检测带来较大的困难,正常语音的端点检测算法已不适用于耳语音。文献[9]利用谱熵能反映语音段和非语音段在频谱上的差异,达到耳语音端点检测的目的。文献[10]基于希尔伯特-黄变换(Hilbert-HuangTrans-form,HHT)中的经验模态分解(EmpiricalModeDecomposi-基于HHT瞬时能频值的耳语音端点检测谈雪丹1,顾济华1,赵鹤鸣2,陶智1,韩韬1,吴俊1TANXue-dan1,GUJi-hua1,ZHAOHe-ming2,TAOZhi1,HANTao1,WUJun11.苏州大学物理科学与技术学院,江苏苏州2150062.苏州大学电子信息学院,江苏苏州2150211.SchoolofPhysicalScienceandTechnology,SoochowUniversity,Suzhou,Jiangsu215006,China2.SchoolofElectronicsandInformationEngineering,SoochowUniversity,Suzhou,Jiangsu215021,ChinaE-mail:taoz@suda.edu.cnTANXue-dan,GUJi-hua,ZHAOHe-ming,etal.EndpointdetectionbasedoninstantaneousenergyfrequencyvalueofHHTforwhisperedspeech.ComputerEngineeringandApplications,2010,46(29):147-150.Abstract:BecauseofthelowSNRofthewhispers,itisdifficulttoobtainbothhighaccurateratesandgoodrobustnesswithsometraditionaldetectionalgorithmsinwhisperedenvironment.AnalgorithmofwhisperedspeechendpointdetectionispresentedwhichisbasedonInstantaneousEnergyFrequencyValue(IEFV)ofHilbert-HuangTransform(HHT).Thispaperap-pliesHHTtoseparateinstantaneousamplitudeandinstantaneousfrequencyfromwhispers,andextractsIEFV,whichisatem-poral-amplitude-frequencycharacter.BecauseIEFVcandistinguishwhispersformnoiseeffectively,itisusedasthefeatureforendpointdetection.TheaccurateratesofbothinitialandfinalofthisalgorithmarehigherthantheZero-Energy-Productmethod,theSpectralEntropymethodandtheFittingCharacteristicmethodinthetestwith700samplesat2~10dBSNR.Asshownintheexperiments,thisalgorithmcandetectwhisperedspeechendpointaccuratelyinvariousnon-stablenoisybackgrounds.Keywords:whisperedspeech;Hilbert-HuangTransform(HHT);instantaneousenergyfrequencyvalue;endpointdetection摘要:由于耳语音信噪比较低,采用传统的算法进行耳语音端点检测存在正确率低、抗噪性能差等问题。提出了一种基于希尔伯特-黄变换瞬时能频值的耳语音端点检测的算法。运用希尔伯特-黄变换,分离出耳语音的瞬时幅值与频率,提取基于时间-能量-频率的特征参数瞬时能频值,利用该特征值对耳语音和噪声进行区分,进行端点检测。对700个信噪比为2~10dB的耳语音测试样本进行仿真实验,该算法检测的起点正确率与终点正确率均高于零能积法、熵法以及拟和特征法。实验表明,该算法适应于多种非平稳噪声环境,能较好地检测耳语音的端点。关键词:耳语音;希尔伯特-黄变换;瞬时能频值;端点检测DOI:10.3778/j.issn.1002-8331.2010.29.041文章编号:1002-8331(2010)29-0147-04文献标识码:A中图分类号:TN912.34基金项目:国家自然科学基金(theNationalNaturalScienceFoundationofChinaunderGrantNo.60572076);江苏省高校自然科学研究计划基金资助项目(No.05JKB510113)。作者简介:谈雪丹(1985-),女,硕士研究生,主要研究领域为语音信号处理;顾济华(1957-),男,教授,博导...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部