基于HHT瞬时能频值的耳语音端点检测VIP专享VIP免费

下载本文档

阅读 161
下载 4
格式 pdf
大小 2 MB
约5页
2024-11-10 发布于河南
收藏
评论
点赞(0)
海报
举报

下载本文档

2010，46（29）ComputerEngineeringandApplications计算机工程与应用1引言耳语音是人们的一种语音交流方式。目前对耳语音的研究虽然相对其他语言研究较少，但该研究已日益引起国内外研究机构和科研人员的重视[1]。随着耳语音识别[2-4]、转换[5-6]等研究的逐渐展开，准确地判断出耳语音的起点和终点，可以减少有效数据处理时间，提高识别精度，改善系统性能。研究表明，在语音识别系统中，有一半左右的错误率是由端点检测引起的[7]。因此，进行准确、有效的端点检测是耳语音信号处理中首先要解决的问题。与正常语音相比，耳语音最主要的特点是声带不振动，没有基频，发音很不稳定，信噪比较低[8]，容易淹没在嘈杂的背景噪声中，这些给耳语音的端点检测带来较大的困难，正常语音的端点检测算法已不适用于耳语音。文献[9]利用谱熵能反映语音段和非语音段在频谱上的差异，达到耳语音端点检测的目的。文献[10]基于希尔伯特-黄变换（Hilbert-HuangTrans-form，HHT）中的经验模态分解（EmpiricalModeDecomposi-基于HHT瞬时能频值的耳语音端点检测谈雪丹1，顾济华1，赵鹤鸣2，陶智1，韩韬1，吴俊1TANXue-dan1，GUJi-hua1，ZHAOHe-ming2，TAOZhi1，HANTao1，WUJun11.苏州大学物理科学与技术学院，江苏苏州2150062.苏州大学电子信息学院，江苏苏州2150211.SchoolofPhysicalScienceandTechnology，SoochowUniversity，Suzhou，Jiangsu215006，China2.SchoolofElectronicsandInformationEngineering，SoochowUniversity，Suzhou，Jiangsu215021，ChinaE-mail：taoz@suda.edu.cnTANXue-dan，GUJi-hua，ZHAOHe-ming，etal.EndpointdetectionbasedoninstantaneousenergyfrequencyvalueofHHTforwhisperedspeech.ComputerEngineeringandApplications，2010，46（29）：147-150.Abstract：BecauseofthelowSNRofthewhispers，itisdifficulttoobtainbothhighaccurateratesandgoodrobustnesswithsometraditionaldetectionalgorithmsinwhisperedenvironment.AnalgorithmofwhisperedspeechendpointdetectionispresentedwhichisbasedonInstantaneousEnergyFrequencyValue（IEFV）ofHilbert-HuangTransform（HHT）.Thispaperap-pliesHHTtoseparateinstantaneousamplitudeandinstantaneousfrequencyfromwhispers，andextractsIEFV，whichisatem-poral-amplitude-frequencycharacter.BecauseIEFVcandistinguishwhispersformnoiseeffectively，itisusedasthefeatureforendpointdetection.TheaccurateratesofbothinitialandfinalofthisalgorithmarehigherthantheZero-Energy-Productmethod，theSpectralEntropymethodandtheFittingCharacteristicmethodinthetestwith700samplesat2～10dBSNR.Asshownintheexperiments，thisalgorithmcandetectwhisperedspeechendpointaccuratelyinvariousnon-stablenoisybackgrounds.Keywords：whisperedspeech；Hilbert-HuangTransform（HHT）；instantaneousenergyfrequencyvalue；endpointdetection摘要：由于耳语音信噪比较低，采用传统的算法进行耳语音端点检测存在正确率低、抗噪性能差等问题。提出了一种基于希尔伯特-黄变换瞬时能频值的耳语音端点检测的算法。运用希尔伯特-黄变换，分离出耳语音的瞬时幅值与频率，提取基于时间-能量-频率的特征参数瞬时能频值，利用该特征值对耳语音和噪声进行区分，进行端点检测。对700个信噪比为2～10dB的耳语音测试样本进行仿真实验，该算法检测的起点正确率与终点正确率均高于零能积法、熵法以及拟和特征法。实验表明，该算法适应于多种非平稳噪声环境，能较好地检测耳语音的端点。关键词：耳语音；希尔伯特-黄变换；瞬时能频值；端点检测DOI：10.3778/j.issn.1002-8331.2010.29.041文章编号：1002-8331（2010）29-0147-04文献标识码：Ａ中图分类号：TN912.34基金项目：国家自然科学基金（theNationalNaturalScienceFoundationofChinaunderGrantNo.60572076）；江苏省高校自然科学研究计划基金资助项目（No.05JKB510113）。作者简介：谈雪丹（1985-），女，硕士研究生，主要研究领域为语音信号处理；顾济华（1957-），男，教授，博导...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容