700字范文,内容丰富有趣,生活中的好帮手!
700字范文 > 语音降噪处理方法 装置 计算机设备及存储介质与流程

语音降噪处理方法 装置 计算机设备及存储介质与流程

时间:2021-07-17 18:44:04

相关推荐

语音降噪处理方法 装置 计算机设备及存储介质与流程

本申请涉及语音降噪技术领域,特别是涉及一种语音降噪处理方法、装置、计算机设备及存储介质。

背景技术:

噪声对语音声学分析与特征中造成很大的影响,各种各样的噪声在语谱图中产生各种杂纹导致声学特征不能正确识别和分析。在语音传输系统中,噪声会掩蔽语音而影响是否听清语音内容,过大的噪声会导致语音识别率下降。针对于噪声的干扰,需要进行语音降噪处理,降低噪声对语音的影响,突出语音的特点。

在实现过程中,发明人发现传统技术中至少存在如下问题:传统方法中,存在语音消息消除过多的问题。

技术实现要素:

基于此,有必要针对上述技术问题,提供一种能够避免语音消息消除过多的语音降噪处理方法、装置、计算机设备及存储介质。

为了实现上述目的,本发明实施例提供了一种语音降噪处理方法,包括步骤:

当信号采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪语音信号,并对含噪语音信号进行分频处理,得到低频带信号;

获取低频带信号的幅度谱和相位谱;

获取幅度谱对应的调制域信号;调制域信号包括调制域幅度谱、调制域功率谱和调制域相位谱;

采用谱减法对调制域幅度谱或者调制域功率谱进行处理,得到降噪后的调制域幅度谱;谱减法中的平滑过减因子为根据调制域的后验信噪比和平滑因子得到;

对调制域相位谱进行补偿,得到补偿后的调制域相位谱;

基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号;降噪后的低频带信号用于合成降噪语音信号。

在其中一个实施例中,还包括步骤:

对含噪语音信号进行分频处理,得到高频带信号;

获取高频带信号的幅度谱和相位谱;

采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后的高频带信号的幅度谱;并基于降噪后的高频带信号的幅度谱和高频带信号的相位谱,得到降噪后的高频带信号;传递增益函数为根据高频带信号的功率谱、互功率谱和估计的噪声互功率谱得到;

合成降噪后的高频带信号和降噪后的低频带信号,得到降噪语音信号。

在其中一个实施例中,采用谱减法对调制域幅度谱或功率谱进行处理,得到降噪后的调制域幅度谱的步骤中,基于以下公式得到降噪后的调制域幅度谱:

其中,u为调制帧变量;w为离散频率变量;k为调制域变量;|s(u,w,k)|为降噪后的调制域幅度谱;p是谱减法的类型,当p=1时使用的是调制域幅度谱谱减,当p=2时使用的是调制域功率谱谱减;当p=1时,|v(u,w,k)|p为估计的噪声调制域幅度谱,当p=2时,|v(u,w,k)|p为估计的噪声调制域功率谱;α(k)为调制域平滑过减因子;|ylf(u,w,k)|p为调制域幅度谱或功率谱;snrpost(u,w,k)为调制域的后验信噪比;θ为平滑因子;α0为常数。

在其中一个实施例中,对调制域相位谱进行补偿,得到补偿后的调制域相位谱的步骤包括:

采用反对称函数与估计的噪声调制域幅度谱,对调制域相位谱进行共轭角调整,得到相位补偿;

或,采用反对称函数与估计的噪声调制域功率谱,对调制域相位谱进行共轭角调整,得到相位补偿;

根据相位补偿和调制域相位谱,得到补偿后的调制域相位谱。

在其中一个实施例中,采用反对称函数与估计的噪声调制域幅度谱,对调制域相位谱进行共轭角调整,得到相位补偿的步骤中,基于以下公式,得到相位补偿:

其中,u为调制帧变量;w为离散频率变量;k为调制域变量;λ(u,w,k)为相位补偿;为反对称函数;ξ为常数;|v(u,w,k)|1为估计的噪声调制域幅度谱;

采用反对称函数与估计的噪声调制域功率谱,对调制域相位谱进行共轭角调整,得到相位补偿的步骤中,基于以下公式,得到相位补偿:

其中,u为调制帧变量;w为离散频率变量;k为调制域变量;λ(u,w,k)为相位补偿;为反对称函数;ξ为常数;|v(u,w,k)|2为估计的噪声调制域功率谱;

根据相位补偿和调制域相位谱,得到补偿后的调制域相位谱的步骤中,基于以下公式,得到补偿后的相位谱:

angle[s(u,w,k)]=angle[ylf(u,w,k)]+λ(u,w,k);

其中,angle[s(u,w,k)]为补偿后的相位谱;angle[ylf(u,w,k)]为调制域相位谱。

根据相位补偿和调制域相位谱,得到补偿后的调制域相位谱的步骤中,基于以下公式,得到补偿后的相位谱:

angle[s(u,w,k)]=angle[ylf(u,w,k)]+λ(u,w,k);

其中,angle[s(u,w,k)]为补偿后的相位谱;angle[ylf(u,w,k)]为调制域相位谱。

在其中一个实施例中,基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号的步骤包括:

将降噪后的调制域幅度谱和补偿后的调制域相位谱依次进行傅里叶反变换和重叠相加处理,得到降噪后的低频带信号的幅度谱;

对降噪后的低频带信号的幅度谱和低频带信号相位谱依次进行傅里叶反变换处理和重叠相加处理,得到降噪后的低频带信号。

在其中一个实施例中,基于降噪后的高频带信号的幅度谱和高频带信号的相位谱,得到降噪后的高频带信号的步骤包括:

对高频带信号的相位谱和降噪后的高频带信号的幅度谱依次进行傅里叶反变换处理和重叠相加,得到降噪后的低频带信号。

在其中一个实施例中,采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后的高频带信号的幅度谱的步骤中,基于以下公式得到降噪后的高频带信号的幅度谱:

|s(u,w)|=|yhf(u,w)|h(u,w);

其中,|s(u,w)|为降噪后的高频带信号的幅度谱;h(u,w)为传递增益函数;|yhf(u,w)|为含噪语音高频带幅度谱;为含噪语音高频带互功率谱;为估计的高频带噪声互功率谱;i、j分别为两个语音采集设备采集的的高频带信号;为修改后的后验信噪比;为增益函数;g、b、h为常量;|yi(u,w)yj(u,w)|为高频带信号互幅度谱。

在其中一个实施例中,获取低频带信号的幅度谱和相位谱的步骤包括:

预处理低频带信号,得到平稳低频带信号;

采用傅里叶变换对平稳低频带信号进行处理,得到低频带信号的幅度谱和相位谱。

在其中一个实施例中,预处理低频带信号,得到平稳低频带信号的步骤包括:

对低频带信号依次进行分帧处理和加窗处理,得到平稳低频带信号。

在其中一个实施例中,获取高频带信号的幅度谱和相位谱的步骤包括:

预处理高频带信号,得到平稳高频带信号;

对平稳高频带信号进行傅里叶变换处理,得到高频带信号的幅度谱和相位谱。

在其中一个实施例中,预处理高频带信号,得到平稳高频带信号的步骤包括:

对高频带信号依次进行分帧处理和加窗处理,得到平稳高频带信号。

在其中一个实施例中,获取幅度谱对应的调制域信号的步骤包括:

采用傅里叶变换对幅度谱进行处理,得到调制域信号。

在其中一个实施例中,对含噪语音信号进行分频处理,得到低频带信号的步骤包括:

对含噪语音信号进行无凸起低通滤波处理,得到低频带信号;

对含噪语音信号进行分频处理,得到高频带信号的步骤包括:

对含噪语音信号进行无凸起高通滤波处理,得到高频带信号。

本发明实施例还提供了一种语音降噪处理装置,包括:

语音信号获取模块,用于当信号采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪语音信号;

低频滤波模块,用于对含噪语音信号进行分频处理,得到低频带信号;

低频带信号频谱获取模块,用于获取低频带信号的幅度谱和相位谱;

调制域信号获取模块,用于获取幅度谱对应的调制域信号;调制域信号包括调制域幅度谱、调制域功率谱和调制域相位谱;

调制域幅度谱处理模块,用于采用谱减法对调制域幅度谱或者功率谱进行处理,得到降噪后的调制域幅度谱;谱减法中的平滑过减因子为根据调制域的后验信噪比和平滑因子得到;

补偿模块,用于对调制域相位谱进行补偿,得到补偿后的调制域相位谱;

低频带信号降噪模块,用于基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号;降噪后的低频带信号用于合成降噪语音信号。

在其中一个实施例中,语音降噪处理装置还包括:

高频滤波模块,用于对含噪语音信号进行分频处理,得到高频带信号;

高频带信号频谱获取模块,用于获取高频带信号的幅度谱和相位谱;

高频带信号降噪模块,用于采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后的高频带信号的幅度谱;并基于降噪后的高频带信号的幅度谱和高频带信号的相位谱,得到降噪后的高频带信号;传递增益函数为根据高频带信号的功率谱、互功率谱和估计的噪声互功率谱得到;

合成模块,用于合成降噪后的高频带信号和降噪后的低频带信号,得到降噪语音信号。

本发明实施例还提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述方法的步骤。

本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法的步骤。

上述技术方案中的一个技术方案具有如下优点和有益效果:

上述语音降噪处理方法,语音采集设备之间的距离达到预设值时,采集的语音信号在低频带存在强相关噪声,因此当语音采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪语音信号,并对含噪语音信号进行分频处理,得到低频带信号。通过获取低频带信号的幅度谱所对应的调制域信号,并对调制域信号进行处理,得到降噪后的语音信号。具体地,采用谱减法对调制域幅度谱或者所述调制域功率谱进行处理,得到降噪后的调制域幅度谱,在此过程中,谱减法所采用的平滑过减因子为根据调制域的后验信噪比和平滑因子得到。通过此种方式,即避免了平滑过减因子过大导致语音消息消除过多,又避免了过减因子过小使得抑制噪声能力不足,同时也不会产生相邻帧之间的突然变化,有效地提高了语音信号的质量。进一步地,对调制域相位谱进行补偿处理,得到补偿后的调制域相位谱,可以进一步地抑制语音信号的背景噪声,提高语音信号的质量。因此,基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到的降噪后的低频带信号的噪声小,进而得到更高质量的语音信号。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1为一个实施例中语音降噪处理方法的第一示意性流程示意图;

图2为一个实施例中语音降噪处理方法的第二示意性流程示意图;

图3为一个实施例中对调制域相位谱进行补偿,得到补偿后的调制域相位谱的步骤的流程示意图;

图4为一个实施例中基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号的步骤的流程示意图;

图5为一个实施例中获取低频带信号的幅度谱和相位谱的步骤的流程示意图;

图6为一个实施例中获取高频带信号的幅度谱和相位谱的步骤的流程示意图;

图7为一个实施例中语音降噪处理装置的第一示意性结构框图;

图8为一个实施例中语音降噪处理装置的第二示意性结构框图;

图9为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

在一个实施例中,如图1所示,提供了一种语音降噪处理方法,包括步骤:

s110,当信号采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪语音信号,并对含噪语音信号进行分频处理,得到低频带信号;

其中,语音采集设备可以为本领域任意一种采集语音的设备。在一个具体示例中,语音采集设备为麦克风。预设值可以为16cm。

具体地,可以通过本领域任意一种方式去获取语音采集设备采集的含噪语音信号。在一个具体示例中,含噪语音信号的获取方式包括从语音采集设备中调取含噪语音信号。可以通过本领域任意一种方式去对含噪语音信号进行分频处理,得到低频带信号。可选地,采用低通滤波对含噪语音信号进行处理,得到低频带信号。在一个具体示例中,对所述含噪语音信号在分频点进行无凸起低通滤波,得到低频带信号,从而实现在后续语音合成的过程中,分频点处没有凸起。

s120,获取低频带信号的幅度谱和相位谱;

具体地,对低频带信号进行傅里叶变换处理,得到低频带信号的幅度谱和相位谱。需要说明的是,也可以通过本领域任意一种手段获取低频带信号的幅度谱和相位谱。

s130,获取幅度谱对应的调制域信号;调制域信号包括调制域幅度谱、调制域功率谱和调制域相位谱;

具体地,可以通过本领域任意一种技术手段获取幅度谱对应的调制域信号。在一个具体示例中,获取幅度谱对应的调制域信号的步骤可以包括采用傅里叶变换对幅度谱进行处理,得到调制域信号。进一步地,可以对幅度谱在每一个频率点分别逐帧进行短时傅里叶变化得到调制域信号。调制域信号包括调制域幅度谱、调制域功率谱和调制域相位谱。

s140,采用谱减法对调制域幅度谱或者调制域功率谱进行处理,得到降噪后的调制域幅度谱;谱减法中的平滑过减因子为根据调制域的后验信噪比和平滑因子得到;

其中,采用谱减法对调制域幅度谱或者调制域功率谱进行处理,可以得到降噪后的调制域幅度谱。

具体地,采用谱减法对调制域幅度谱进行处理,得到降噪后的调制域幅度谱。或者,采用谱减法对调制域功率谱进行处理,可以得到降噪后的调制域功率谱,降噪后的调制域功率谱可以转换成降噪后的调制域幅度谱,转换方式在此不做赘述。

在其中一个实施例中,采用谱减法对调制域幅度谱或功率谱进行处理,得到降噪后的调制域幅度谱的步骤中,基于以下公式得到降噪后的调制域幅度谱:

其中,u为调制帧变量;w为离散频率变量;k为调制域变量;|s(u,w,k)|为降噪后的调制域幅度谱;p是谱减法的类型,当p=1时使用的是调制域幅度谱谱减,当p=2时使用的是调制域功率谱谱减;当p=1时,|v(u,w,k)|p为估计的噪声调制域幅度谱,当p=2时,|v(u,w,k)|p为估计的噪声调制域功率谱;α(k)为调制域平滑过减因子;|ylf(u,w,k)|p为调制域幅度谱或功率谱;snrpost(u,w,k)为调制域的后验信噪比;θ为平滑因子;α0为常数。

s150,对调制域相位谱进行补偿,得到补偿后的调制域相位谱;

其中,在语音降噪处理中,对调制域相位谱进行处理可以进一步抑制背景噪声,从而提高语音质量。幅度谱是实信号,因此得到的调制域信号是共轭对称的。基于此,可以通过反对称函数去改变共轭项之间的角度关系,继而可以对调制域相位谱进行补偿,得到补偿后的调制域相位谱。

s160,基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号;降噪后的低频带信号用于合成降噪语音信号。

具体地,根据补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,可以得到降噪后的低频带信号。降噪后的低频带信号可以合成降噪语音信号。可选地,可以获取语音信号的高频带信号,对该高频带信号和降噪后的低频带信号进行合成,得到降噪语音信号;也可以获取语音信号的高频带信号,然后对高频带信号进行降噪处理,将降噪后的高频带信号和降噪后的低频带信号进行合成,得到降噪语音信号。需要说明的是,对高频带信号进行的降噪处理方式,可以为本领域任意一种方式,在此不做具体限定。信号合成也可以采用本领域所用的方式。

上述语音降噪处理方法,语音采集设备之间的距离达到预设值时,采集的语音信号在低频带存在强相关噪声,因此当语音采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪语音信号,并对含噪语音信号进行分频处理,得到低频带信号。通过获取低频带信号的幅度谱所对应的调制域信号,并对调制域信号进行处理,得到降噪后的语音信号。具体地,采用谱减法对调制域幅度谱或者所述调制域功率谱进行处理,得到降噪后的调制域幅度谱,在此过程中,谱减法所采用的平滑过减因子为根据调制域的后验信噪比和平滑因子得到。通过此种方式,即避免了平滑过减因子过大导致语音消息消除过多,又避免了过减因子过小使得抑制噪声能力不足,同时也不会产生相邻帧之间的突然变化,有效地提高了语音信号的质量。进一步地,对调制域相位谱进行补偿处理,得到补偿后的调制域相位谱,可以进一步地抑制语音信号的背景噪声,提高语音信号的质量。因此,基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到的降噪后的低频带信号的噪声小,进而得到更高质量的语音信号。

在一个实施例中,如图2所示,还包括步骤:

s210,对含噪语音信号进行分频处理,得到高频带信号;

具体地,可以通过本领域任意一种方式去获取语音采集设备采集的含噪语音信号。在一个具体示例中,含噪语音信号的获取方式包括从语音采集设备中调取含噪语音信号。可以通过本领域任意一种方式去对含噪语音信号进行分频处理,得到高频带信号。在一个具体示例中,对所述含噪语音信号在分频点进行无凸点高通滤波,得到高频带信号,从而实现在后续语音合成的过程中,分频点没有凸起。需要说明的是,对含噪语音信号进行分频处理,得到高频带信号的步骤可以与上述s110步骤一起执行,即只进行一次分频处理,便可以得到高频带信号和低频带信号。

s220,获取高频带信号的幅度谱和相位谱;

具体地,对高频带信号进行傅里叶变换处理,得到高频带信号的幅度谱和相位谱。需要说明的是,也可以通过本领域任意一种手段获取高频带信号的幅度谱和相位谱。

s230,采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后的高频带信号的幅度谱;并基于降噪后的高频带信号的幅度谱和高频带信号的相位谱,得到降噪后的高频带信号;传递增益函数为根据高频带信号的功率谱、互功率谱和估计的噪声互功率谱估计得到;

具体地,采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后续的高频带信号的幅度谱。需要说明的是,当双麦的距离达到预设值时,采集的语音信号在高频带存在弱相关噪声。采用传递增益函数处理高频带信号的幅度谱,可以有效地对弱相关噪声进行抑制。

在其中一个实施例中,采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后的高频带信号的幅度谱的步骤中,基于以下公式得到降噪后的高频带信号的幅度谱:

|s(u,w)|=|yhf(u,w)|h(u,w);

其中,|s(u,w)|为降噪后的高频带信号的幅度谱;h(u,w)为传递增益函数;|yhf(u,w)|为含噪语音高频带幅度谱;为含噪语音高频带互功率谱;为估计的高频带噪声互功率谱;i、j分别为两个语音采集设备采集的的高频带信号;为修改后的后验信噪比;为增益函数;g、b、h为常量;|yi(u,w)yj(u,w)|为高频带信号互幅度谱。

在一个具体示例中,基于降噪后的高频带信号的幅度谱和高频带信号的相位谱,得到降噪后的高频带信号的步骤包括:对高频带信号的相位谱和降噪后的高频带信号的幅度谱依次进行傅里叶反变换处理和重叠相加,得到降噪后的低频带信号。需要说明的是,也可以采用本领域任意手段得到降噪后的低频带信号。

s240,合成降噪后的高频带信号和降噪后的低频带信号,得到降噪语音信号。

其中,对降噪后的高频带信号和降噪后的低频带信号进行合成处理,可以得到降噪语音信号。需要说明的是,合成处理手段可以为本领域任意一种,在此不做具体限定。

上述语音降噪处理方法,语音采集设备之间的距离达到预设值时,采集的语音信号在高频带存在弱相关噪声,因此当语音采集设备之间的距离达到预设值时,获取采集设备采集的含噪语音信号,并对含噪语音信号进行分频处理,得到高频带信号。通过对高频带信号的幅度谱采用传递增益函数处理,得到降噪后的高频带信号的幅度谱。基于降噪后的高频带信号的幅度谱和高频带信号的相位谱,得到的降噪后的高频带信号具有更少的噪声。针对于高频带信号和低频带信号的噪声特性,进行不同的降噪处理方法,从而获取更少噪声的语音信号。

在其中一个实施例中,如图3所示,对调制域相位谱进行补偿,得到补偿后的调制域相位谱的步骤包括:

s310,采用反对称函数与估计的噪声调制域幅度谱,对调制域相位谱进行共轭角调整,得到相位补偿;

或,采用反对称函数与估计的噪声调制域功率谱,对调制域相位谱进行共轭角调整,得到相位补偿;

其中,在语音降噪处理中,对调制域相位谱进行处理可以进一步抑制背景噪声,从而提高语音质量。幅度谱是实信号,因此得到的调制域信号时共轭对称的。基于此,可以通过反对称函数与估计的噪声调制域幅度谱,对调制域相位谱改变共轭项之间的角度关系,继而可以对调制域相位谱进行补偿,得到补偿后的调制域相位谱。

需要说明的是,估计的噪声调制域幅度谱或估计的噪声调制域相位谱可以根据含噪语音信号的调制域幅度谱得到。

在其中一个实施例中,采用反对称函数与估计的噪声调制域幅度谱,对调制域相位谱进行共轭角调整,得到相位补偿的步骤中,基于以下公式,得到相位补偿:

其中,u为调制帧变量;w为离散频率变量;k为调制域变量;λ(u,w,k)为相位补偿;为反对称函数;ξ为常数;|v(u,w,k)|1为估计的噪声调制域幅度谱;

采用反对称函数与估计的噪声调制域功率谱,对调制域相位谱进行共轭角调整,得到相位补偿的步骤中,基于以下公式,得到相位补偿:

其中,u为调制帧变量;w为离散频率变量;k为调制域变量;λ(u,w,k)为相位补偿;为反对称函数;ξ为常数;|v(u,w,k)|2为估计的噪声调制域功率谱;

s320,根据相位补偿和调制域相位谱,得到补偿后的调制域相位谱。

具体而言,得到相位补偿之后,可以基于该相位补偿对调制域相位谱进行处理,得到补偿后的调制域相位谱。

在一个具体示例中,根据相位补偿和调制域相位谱,得到补偿后的调制域相位谱的步骤中,基于以下公式,得到补偿后的相位谱:

angle[s(u,w,k)]=angle[ylf(u,w,k)]+λ(u,w,k);

上述语音降噪处理方法,通过获得相位补偿,并基于相位补偿对调制域相位谱进行处理,得到补偿后的调制域相位谱,抑制了低频带信号的强相关噪声。

在其中一个实施例中,如图4所示,基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号的步骤包括:

s410,将降噪后的调制域幅度谱和补偿后的调制域相位谱依次进行傅里叶反变换和重叠相加处理,得到降噪后的幅度谱;

其中,傅里叶反变换为信号处理的常用手段之一,在此不做具体说明。

具体而言,对降噪后的调制域幅度谱和补偿后的调制域相位谱进行傅里叶反变换处理,然后将得到的结果进行重叠相加处理,得到降噪后的幅度谱;

s420,对降噪后的幅度谱和低频带信号相位谱进行傅里叶反变换处理和重叠相加处理,得到降噪后的低频带信号。

具体而言,对降噪后的幅度谱和低频带信号相位谱进行傅里叶反变换处理,然后将得到的结果进行重叠相加处理,得到降噪后的低频带信号。

在一个实施例中,如图5所示,获取低频带信号的幅度谱和相位谱的步骤包括:

s510,预处理低频带信号,得到平稳低频带信号;

具体地,对低频带信号进行预处理,得到平稳低频带信号。预处理可以为本领域任意一种方式,在此不做具体要求。

s520,采用傅里叶变换对平稳低频带信号进行处理,得到低频带信号的幅度谱和相位谱。

通过对平稳低频带信号进行傅里叶变换处理,得到低频带信号的频率表达式,进而得到低频带信号的幅度谱和相位谱。

在其中一个实施例中,预处理低频带信号,得到平稳低频带信号的步骤包括:对低频带信号依次进行分帧处理和加窗处理,得到平稳低频带信号。

上述语音降噪方法,通过对低频带信号进行预处理,从而得到平稳低频带信号。具体地,语音信号在宏观上是不平稳的,在微观上是平稳的,从而可以将语音信号按照以一帧为单位进行划分。将语音信号进行分帧之后,可以对其进行加窗处理,即将分帧得到的语音信号与一个窗函数相乘,减少频谱泄露。

在一个实施例中,如图6所示,获取高频带信号的幅度谱和相位谱的步骤包括:

s610,预处理高频带信号,得到平稳高频带信号;

具体地,对高频带信号进行预处理,得到平稳高频带信号。预处理可以为本领域任意一种方式,在此不做具体要求。

s620,对平稳高频带信号进行傅里叶变换处理,得到高频带信号的幅度谱和相位谱。

通过对平稳高频带信号进行傅里叶变换处理,得到高频带信号的频率表达式,进而得到高频带信号的幅度谱和相位谱。

在其中一个实施例中,预处理高频带信号,得到平稳高频带信号的步骤包括:对高频带信号依次进行分帧处理和加窗处理,得到平稳高频带信号。

上述语音降噪方法,通过对高频带信号进行预处理,从而得到平稳高频带信号。具体地,语音信号在宏观上是不平稳的,在微观上是平稳的,从而可以将语音信号按照以一帧为单位进行划分。将语音信号进行分帧之后,可以对其进行加窗处理,即将分帧得到的语音信号与一个窗函数相乘,减少频谱泄露。

在一个具体实施例中,对含噪语音信号进行分频处理,得到低频带信号的步骤包括:

对含噪语音信号进行无凸起低通滤波处理,得到低频带信号;

对含噪语音信号进行分频处理,得到高频带信号的步骤包括:

对含噪语音信号进行无凸起高通滤波处理,得到高频带信号。

上述语音降噪处理方法,通过在分频点对含噪语音信号进行无凸起低通滤波处理,得到低频带信号和高频带信号,从而使得分频点处没有凸起。

应该理解的是,虽然图1-6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-6中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图7所示,提供了一种语音降噪处理装置,包括:

语音信号获取模块10,用于当信号采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪语音信号;

低频滤波模块20,用于对含噪语音信号进行分频处理,得到低频带信号;

低频带信号频谱获取模块30,用于获取低频带信号的幅度谱和相位谱;

调制域信号获取模块40,用于获取幅度谱对应的调制域信号;调制域信号包括调制域幅度谱、调制域功率谱和调制域相位谱;

调制域幅度谱处理模块50,用于采用谱减法对调制域幅度谱或者功率谱进行处理,得到降噪后的调制域幅度谱;谱减法中的平滑过减因子为根据调制域的后验信噪比和平滑因子得到;

补偿模块60,用于对调制域相位谱进行补偿,得到补偿后的调制域相位谱;

低频带信号降噪模块70,用于基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号;降噪后的低频带信号用于合成降噪语音信号。

在其中一个实施例中,如图8所示,语音降噪处理装置还包括:

高频滤波模块80,用于对含噪语音信号进行分频处理,得到高频带信号;

高频带信号频谱获取模块90,用于获取高频带信号的幅度谱和相位谱;

高频带信号降噪模块100,用于采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后的高频带信号的幅度谱;并基于降噪后的高频带信号的幅度谱和高频带信号的相位谱,得到降噪后的高频带信号;传递增益函数为根据高频带信号的功率谱、互功率和估计的噪声互功率谱估计得到;

合成模块110,用于合成降噪后的高频带信号和降噪后的低频带信号,得到降噪语音信号。

关于语音降噪处理装置的具体限定可以参见上文中对于语音降噪处理方法的限定,在此不再赘述。上述语音降噪处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种语音降噪处理方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:

当信号采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪语音信号,并对含噪语音信号进行分频处理,得到低频带信号;

获取低频带信号的幅度谱和相位谱;

获取幅度谱对应的调制域信号;调制域信号包括调制域幅度谱、调制域功率谱和调制域相位谱;

采用谱减法对调制域幅度谱或者调制域功率谱进行处理,得到降噪后的调制域幅度谱;谱减法中的平滑过减因子为根据调制域的后验信噪比和平滑因子得到;

对调制域相位谱进行补偿,得到补偿后的调制域相位谱;

基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号;降噪后的低频带信号用于合成降噪语音信号。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

对含噪语音信号进行分频处理,得到高频带信号;

获取高频带信号的幅度谱和相位谱;

采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后的高频带信号的幅度谱;并基于降噪后的高频带信号的幅度谱和高频带信号的相位谱,得到降噪后的高频带信号;传递增益函数为根据高频带信号的功率谱、互功率谱和估计的噪声互功率谱得到;

合成降噪后的高频带信号和降噪后的低频带信号,得到降噪语音信号。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

当信号采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪语音信号,并对含噪语音信号进行分频处理,得到低频带信号;

获取低频带信号的幅度谱和相位谱;

获取幅度谱对应的调制域信号;调制域信号包括调制域幅度谱、调制域功率谱和调制域相位谱;

采用谱减法对调制域幅度谱或者调制域功率谱进行处理,得到降噪后的调制域幅度谱;谱减法中的平滑过减因子为根据调制域的后验信噪比和平滑因子得到;

对调制域相位谱进行补偿,得到补偿后的调制域相位谱;

基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号;降噪后的低频带信号用于合成降噪语音信号。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

对含噪语音信号进行分频处理,得到高频带信号;

获取高频带信号的幅度谱和相位谱;

采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后的高频带信号的幅度谱;并基于降噪后的高频带信号的幅度谱和高频带信号的相位谱,得到降噪后的高频带信号;传递增益函数为根据高频带信号的功率谱、互功率谱和估计的噪声互功率谱得到;

合成降噪后的高频带信号和降噪后的低频带信号,得到降噪语音信号。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

技术特征:

1.一种语音降噪处理方法,其特征在于,包括步骤:

当信号采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪语音信号,并对所述含噪语音信号进行分频处理,得到低频带信号;

获取所述低频带信号的幅度谱和相位谱;

获取所述幅度谱对应的调制域信号;所述调制域信号包括调制域幅度谱、调制域功率谱和调制域相位谱;

采用谱减法对所述调制域幅度谱或者所述调制域功率谱进行处理,得到降噪后的调制域幅度谱;所述谱减法中的平滑过减因子为根据调制域的后验信噪比和平滑因子得到;

对所述调制域相位谱进行补偿,得到补偿后的调制域相位谱;

基于所述补偿后的调制域相位谱、所述降噪后的调制域幅度谱和所述低频带信号的相位谱,得到降噪后的低频带信号;所述降噪后的低频带信号用于合成降噪语音信号。

2.根据权利要求1所述的语音降噪处理方法,其特征在于,还包括步骤:

对所述含噪语音信号进行分频处理,得到高频带信号;

获取所述高频带信号的幅度谱和相位谱;

采用传递增益函数对所述高频带信号的幅度谱进行处理,得到降噪后的高频带信号的幅度谱;并基于降噪后的高频带信号的幅度谱和所述高频带信号的相位谱,得到降噪后的高频带信号;所述传递增益函数为根据所述高频带信号的功率谱、互功率谱和估计的噪声互功率谱得到;

合成所述降噪后的高频带信号和所述降噪后的低频带信号,得到所述降噪语音信号。

3.根据权利要求1所述的语音降噪处理方法,其特征在于,采用谱减法对所述调制域幅度谱或所述调制域功率谱进行处理,得到降噪后的调制域幅度谱的步骤中,基于以下公式得到降噪后的调制域幅度谱:

其中,u为调制帧变量;w为离散频率变量;k为调制域变量;|s(u,w,k)|为所述降噪后的调制域幅度谱;p是谱减法的类型,当p=1时使用的是调制域幅度谱谱减,当p=2时使用的是调制域功率谱谱减;当p=1时,|v(u,w,k)|p为估计的噪声调制域幅度谱,当p=2时,|v(u,w,k)|p为估计的噪声调制域功率谱;α(k)为调制域平滑过减因子;|ylf(u,w,k)|p为所述调制域幅度谱或功率谱;snrpost(u,w,k)为所述调制域的后验信噪比;θ为所述平滑因子;α0为常数。

4.根据权利要求1所述的语音降噪处理方法,其特征在于,对所述调制域相位谱进行补偿,得到补偿后的调制域相位谱的步骤包括:

采用反对称函数与估计的噪声调制域幅度谱,对所述调制域相位谱进行共轭角调整,得到相位补偿;

或,采用反对称函数与估计的噪声调制域功率谱,对所述调制域相位谱进行共轭角调整,得到相位补偿;

根据所述相位补偿和所述调制域相位谱,得到所述补偿后的调制域相位谱。

5.根据权利要求4所述的语音降噪处理方法,其特征在于,采用反对称函数与估计的噪声调制域幅度谱,对所述调制域相位谱进行共轭角调整,得到相位补偿的步骤中,基于以下公式,得到所述相位补偿:

其中,u为调制帧变量;w为离散频率变量;k为调制域变量;λ(u,w,k)为所述相位补偿;为所述反对称函数;ξ为常数;|v(u,w,k)|1为估计的噪声调制域幅度谱;

采用反对称函数与估计的噪声调制域功率谱,对所述调制域相位谱进行共轭角调整,得到相位补偿的步骤中,基于以下公式,得到所述相位补偿:

其中,u为调制帧变量;w为离散频率变量;k为调制域变量;λ(u,w,k)为所述相位补偿;为所述反对称函数;ξ为常数;|v(u,w,k)|2为估计的噪声调制域功率谱;

根据所述相位补偿和所述调制域相位谱,得到所述补偿后的调制域相位谱的步骤中,基于以下公式,得到所述补偿后的相位谱:

angle[s(u,w,k)]=angle[ylf(u,w,k)]+λ(u,w,k);

其中,angle[s(u,w,k)]为所述补偿后的相位谱;angle[ylf(u,w,k)]为所述调制域相位谱。

6.根据权利要求1所述的语音降噪处理方法,其特征在于,基于所述补偿后的调制域相位谱、所述降噪后的调制域幅度谱和所述低频带信号的相位谱,得到降噪后的低频带信号的步骤包括:

将所述降噪后的调制域幅度谱和所述补偿后的调制域相位谱依次进行傅里叶反变换和重叠相加处理,得到降噪后的所述低频带信号的幅度谱;

对降噪后的所述低频带信号的幅度谱和所述低频带信号相位谱依次进行傅里叶反变换处理和重叠相加处理,得到降噪后的低频带信号。

7.根据权利要求2所述的语音降噪处理方法,其特征在于,基于降噪后的高频带信号的幅度谱和所述高频带信号的相位谱,得到降噪后的高频带信号的步骤包括:

对所述高频带信号的相位谱和所述降噪后的高频带信号的幅度谱依次进行傅里叶反变换处理和重叠相加,得到降噪后的低频带信号。

8.根据权利要求2所述的语音降噪处理方法,其特征在于,采用传递增益函数对所述高频带信号的幅度谱进行处理,得到降噪后的高频带信号的幅度谱的步骤中,基于以下公式得到所述降噪后的高频带信号的幅度谱:

|s(u,w)|=|yhf(u,w)|h(u,w);

其中,|s(u,w)|为所述降噪后的高频带信号的幅度谱;h(u,w)为传递增益函数;|yhf(u,w)|为含噪语音高频带幅度谱;为含噪语音高频带互功率谱;为估计的高频带噪声互功率谱;i、j分别为两个语音采集设备采集的的高频带信号;为修改后的后验信噪比;为增益函数;g、b、h为常量;|yi(u,w)yj(u,w)|为高频带信号互幅度谱。

9.根据权利要求1所述的语音降噪处理方法,其特征在于,获取所述低频带信号的幅度谱和相位谱的步骤包括:

预处理所述低频带信号,得到平稳低频带信号;

采用傅里叶变换对所述平稳低频带信号进行处理,得到所述低频带信号的幅度谱和相位谱。

10.根据权利要求9所述的语音降噪处理方法,其特征在于,预处理所述低频带信号,得到平稳低频带信号的步骤包括:

对所述低频带信号依次进行分帧处理和加窗处理,得到所述平稳低频带信号。

11.根据权利要求2所述的语音降噪处理方法,其特征在于,获取所述高频带信号的幅度谱和相位谱的步骤包括:

预处理所述高频带信号,得到平稳高频带信号;

对所述平稳高频带信号进行傅里叶变换处理,得到所述高频带信号的幅度谱和相位谱。

12.根据权利要求11所述的语音降噪处理方法,其特征在于,预处理所述高频带信号,得到平稳高频带信号的步骤包括:

对所述高频带信号依次进行分帧处理和加窗处理,得到所述平稳高频带信号。

13.根据权利要求1所述的语音降噪处理方法,其特征在于,获取所述幅度谱对应的调制域信号的步骤包括:

采用傅里叶变换对所述幅度谱进行处理,得到所述调制域信号。

14.根据权利要求2至13任一项所述的语音降噪处理方法,其特征在于,对所述含噪语音信号进行分频处理,得到低频带信号的步骤包括:

对所述含噪语音信号进行无凸起低通滤波处理,得到所述低频带信号;

对所述含噪语音信号进行分频处理,得到高频带信号的步骤包括:

对所述含噪语音信号进行无凸起高通滤波处理,得到所述高频带信号。

15.一种语音降噪处理装置,其特征在于,包括:

语音信号获取模块,用于当信号采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪语音信号;

低频滤波模块,用于对所述含噪语音信号进行分频处理,得到低频带信号;

低频带信号频谱获取模块,用于获取所述低频带信号的幅度谱和相位谱;

调制域信号获取模块,用于获取所述幅度谱对应的调制域信号;所述调制域信号包括调制域幅度谱、调制域功率谱和调制域相位谱;

调制域幅度谱处理模块,用于采用谱减法对所述调制域幅度谱或者功率谱进行处理,得到降噪后的调制域幅度谱;所述谱减法中的平滑过减因子为根据调制域的后验信噪比和平滑因子得到;

补偿模块,用于对所述调制域相位谱进行补偿,得到补偿后的调制域相位谱;

低频带信号降噪模块,用于基于所述补偿后的调制域相位谱、所述降噪后的调制域幅度谱和所述低频带信号的相位谱,得到降噪后的低频带信号;所述降噪后的低频带信号用于合成降噪语音信号。

16.根据权利要求15所述的语音降噪处理装置,其特征在于,还包括:

高频滤波模块,用于对所述含噪语音信号进行分频处理,得到高频带信号;

高频带信号频谱获取模块,用于获取所述高频带信号的幅度谱和相位谱;

高频带信号降噪模块,用于采用传递增益函数对所述高频带信号的幅度谱进行处理,得到降噪后的高频带信号的幅度谱;并基于降噪后的高频带信号的幅度谱和所述高频带信号的相位谱,得到降噪后的高频带信号;所述传递增益函数为根据所述高频带信号的功率谱、互功率谱和估计的噪声互功率谱得到;

合成模块,用于合成所述降噪后的高频带信号和所述降噪后的低频带信号,得到所述降噪语音信号。

17.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至14中任一项所述方法的步骤。

18.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至14中任一项所述的方法的步骤。

技术总结

本申请涉及一种语音降噪处理方法、装置、计算机设备及存储介质。其中,语音降噪处理方法包括当检测到语音采集设备与目标物的距离达到预设值时,获取语音采集设备采集的含噪语音信号,并对含噪语音信号进行分频处理,得到低频带信号;获取低频带信号的幅度谱和相位谱;获取幅度谱对应的调制域信号;采用谱减法对调制域幅度谱或功率谱进行处理,得到降噪后的调制域幅度谱或功率谱;对调制域相位谱进行补偿,得到补偿后的调制域相位谱;基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号;降噪后的低频带信号用于合成降噪语音信号。谱减法所采用的平滑过减因子避免了平滑过减因子过大导致语音消息消除过多的问题。

技术研发人员:肖强;肖全之;黄荣均;方桂萍;闫玉凤

受保护的技术使用者:珠海市杰理科技股份有限公司

技术研发日:.10.21

技术公布日:.02.14

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。