一种基于麦克风阵列的语音降噪方法及系统的制作方法
【技术领域】
[0001]本发明涉及数字信号处理技术领域,尤其涉及一种基于麦克风阵列的语音降噪方法及系统。
[0002]【背景技术】随着语音通信及语音识别技术的快速发展,其已在人们的日常生活和工作中的多个领域得到了广泛的应用,为人们提供了极大的便利。然而,语音通信及语音识别的应用环境是复杂多变的,尤其是在车载、机载以及多人讲话等信噪比较低的应用环境中,噪声的存在给传统的语音通信及语音识别技术带来了很大的挑战,因此语音降噪技术已成为语音通信及语音识别能正常、准确工作的保证。为了提升语音降噪技术的有效性,现有语音降噪技术主要包括单麦克风增强技术和麦克风阵列技术,其中,单麦克风增强技术单纯利用信号的时序信息进行降噪处理,而麦克风阵列技术却融合语音信号的时序信息和空间信息,因此,麦克风阵列技术相较于单麦克风语音增强技术,能更好地平衡噪声抑制幅度和语音失真度控制之间的关系。
[0003]麦克风阵列技术是利用两个或者更多的麦克风组成的麦克风阵列进行语音增强,其最基本的思想是通过自适应滤波器用一个麦克风接收到的噪声抵消另一个麦克风接收到的信号中的噪声成分,得到目标语音信号。由于在实际应用中两个麦克风采集的信号都可能包含目标语音信号,因此,降噪的同时也会损害到目标语音信号,这就需要对自适应滤波器的收敛和滤波进行控制,以保证在有效地抑制噪声的同时保护一个麦克风中的目标语音信号不会被另一个麦克风中的目标语音信号所抵消,否则就会造成目标语音信号的失真。针对上述技术问题,后又有技术人员提出通过确定麦克风阵列所有声音信号的入射角度进行信号成分的统计,进而得到滤波控制因子,利用该滤波控制因子可将目标语音信号中可能存在的噪声成分滤除,从而较有效地解决了在滤波过程中存在语音信号失真的问题,但是,如果噪声信号中含有目标语音信号成分,则无论如何调整滤波控制因子,目标语音信号经滤波后仍会存在一定的失真,这使得该种方案也无法完全解决语音信号失真的问题。
【发明内容】
[0004]本发明的实施例针对基于麦克风阵列的现有语音降噪方法存在的上述技术问题,提供一种可以更为有效地解决语音失真问题的语音降噪方法及系统。
[0005]为实现上述目的,本发明采用的技术方案为:一种基于麦克风阵列的语音降噪方法,包括:
[0006]利用波束成形技术将组成所述麦克风阵列的背靠背布置的两个无指向性麦克风构建为两个背向心形指向性麦克风,以得到前向目标语音信号和后向噪声信号;
[0007]对所述前向目标语音信号和所述后向噪声信号进行相同程度的频率均衡,得到已均衡目标语音信号和已均衡噪声信号;
[0008]对所述已均衡目标语音信号进行自适应滤波处理,估计出所述已均衡噪声信号中存在的目标语音信号的泄漏成分;
[0009]从所述已均衡噪声信号中去除所述目标语音信号的泄漏成分,得到已修正噪声信号;
[0010]对所述已修正噪声信号进行自适应滤波处理,估计出所述已均衡目标语音信号中存在的噪声信号的泄漏成分;
[0011]从所述已均衡目标语音信号中去除所述噪声信号的泄漏成分,得到已修正目标语音信号;
[0012]基于所述已修正目标语音信号,得到还原后的目标语音信号。
[0013]优选的是,所述对所述前向目标语音信号和所述后向噪声信号进行相同程度的频率均衡,得到已均衡目标语音信号和已均衡噪声信号包括:
[0014]提取所述前向目标语音信号相对最先到达所述麦克风阵列的频域声音信号进行缩放的增益因子;
[0015]将所述前向目标语音信号除以所述增益因子,得到所述已均衡目标语音信号;
[0016]将所述后向噪声信号除以所述增益因子,得到所述已均衡噪声信号。
[0017]优选的是,所述方法还包括:
[0018]计算所述已修正目标语音信号与所述已修正噪声信号之间的信噪比;
[0019]在所述信噪比大于预设门限时,更新估计出的所述目标语音信号的泄漏成分;
[0020]在所述信噪比小于等于所述预设门限时,更新估计出的所述噪声信号的泄漏成分。
[0021]优选的是,所述计算所述已修正目标语音信号与所述已修正噪声信号之间的信噪比包括:
[0022]计算所有频带下的已修正目标语音信号总量;
[0023]计算所有频带下的已修正噪声信号总量;
[0024]计算所述已修正目标语音信号总量与所述已修正噪声信号总量的比,并将计算结果作为所述已修正目标语音信号与所述已修正噪声信号之间的信噪比。
[0025]优选的是,所述基于所述已修正目标语音信号,得到还原后的目标语音信号包括:
[0026]对所述已修正目标语音信号进行自适应后置滤波处理,得到已后置滤波目标语音信号;
[0027]基于所述已后置滤波目标语音信号,得到所述还原后的目标语音信号。
[0028]为了实现上述目的,本发明采用的技术方案为:一种基于麦克风阵列的语音降噪系统,包括:
[0029]波束形成模块,用于利用波束成形技术将组成所述麦克风阵列的背靠背布置的两个无指向性麦克风构建为两个背向心形指向性麦克风,以得到前向目标语音信号和后向噪声信号;
[0030]频率均衡模块,用于对所述前向目标语音信号和所述后向噪声信号进行相同程度的频率均衡,得到已均衡目标语音信号和已均衡噪声信号;
[0031 ]目标语音信号自适应滤波模块,用于对所述已均衡目标语音信号进行自适应滤波处理,估计出所述已均衡噪声信号中存在的目标语音信号的泄漏成分;
[0032]噪声信号修正模块,用于从所述已均衡噪声信号中去除所述目标语音信号的泄漏成分,得到已修正噪声信号;
[0033]噪声信号自适应滤波模块,用于对所述已修正噪声信号进行自适应滤波处理,估计出所述已均衡目标语音信号中存在的噪声信号的泄漏成分;
[0034]目标语音信号修正模块,用于从所述已均衡目标语音信号中去除所述噪声信号的泄漏成分,得到已修正目标语音信号;以及,
[0035]后置处理模块,用于基于所述已修正目标语音信号,得到还原后的目标语音信号。
[0036]优选的是,所述频率均衡模块包括:
[0037]增益因子提取单元,用于提取所述前向目标语音信号相对最先到达所述麦克风阵列的频域声音信号进行缩放的增益因子;
[0038]目标语音信号均衡单元,用于将所述前向目标语音信号除以所述增益因子,得到所述已均衡目标语音信号;以及,
[0039]噪声信号均衡单元,用于将所述后向噪声信号除以所述增益因子,得到所述已均衡噪声信号。
[0040]优选的是,所述系统还包括:
[0041]信噪比计算模块,用于计算所述已修正目标语音信号与所述已修正噪声信号之间的信噪比;
[0042]所述目标语音信号自适应滤波模块还用于在所述信噪比大于预设门限时,更新估计出的所述目标语音信号的泄漏成分;
[0043]所述噪声信号自适应滤波模块还用于在所述信噪比小于等于所述预设门限时,更新估计出的所述噪声信号的泄漏成分。
[0044]优选的是,所述信噪比计算模块包括:
[0045]第一计算单元,用于计算所有频带下的已修正目标语音信号总量;
[0046]第二计算单元,用于计算所有频带下的已修正噪声信号总量;以及,
[0047]信噪比计算单元,用于计算所述已修正目标语音信号总量与所述已修正噪声信号总量的比,并将计算结果作为所述已修正目标语音信号与所述已修正噪声信号之间的信噪比。
[0048]优选的是,所述后置处理模块还用于对所述已修正目标语音信号进行自适应后置滤波处理,得到已后置滤波目标语音信号;及还用于基于所述已后置滤波目标语音信号,得到所述还原后的目标语音信号。
[0049]本发明的有益效果在于,本发明的基于麦克风阵列的语音降噪方法及系统通过波束成形技术将组成麦克风阵列的背靠背布置的两个无指向性麦克风构建为具有两个背向心形指向性麦克风,这可以获得主要包括目标语音信号的前向目标语音信号和主要包括噪声信号的后向噪声信号,而且本发明通过对前向目标语音信号进行频率均衡,可以有效地避免前向目标语音信号在不同的频带具有不同的缩放幅度,进而可以避免还原后的目标语音信号出现频率失真;另外,本发明在此基础上创新性地采用了对已均衡目标语音信号和已修正噪声信号均进行自适应滤波的自
适应双滤波方法,彻底解决在两个麦克风采集到的声音信号均包含目标语音信号的情况下,通过自适应滤波进行降噪的同时也损害到目标语音信号的问题,进而可以从另一个方面避免还原后的目标语音信号出现失真。
【附图说明】
[0050]图1为根据本发明所述基于麦克风阵列的语音降噪方法的一种实施方式的流程图;
[0051]图2示出了图1所述麦克风阵列的布局结构;
[0052]图3示出了图2所示麦克风阵列接收源信号的情况;
[0053]图4示出了图1所述心形指向性麦克风的波束图,其中,实线代表前向目标语音信号的前向心形波束,虚线代表后向噪声信号的后向心形波束;
[0054]图5示出了图1所述麦克风阵列的波束形成结构图;
[0055]图6为根据本发明所述基于麦克风阵列的语音降噪系统的一种实施方式的方框原理图;
[0056]图7 7K出了图6所7K语音降噪系统的一种实施结构;
[0057]图8示出了图6中频率均衡模块的一种实施结构;
[0058]图9为根据本发明所述基于麦克风阵列的语音降噪系统的另一种实施方式的方框原理图。
【具体实施方式】
[0059]下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
[0060]如图1至图5所示,本发明的基于麦克风阵列的语音降噪方法,包括如下步骤:
[0061]步骤S1:利用波束成形技术将组成麦克风阵列的如图4所示的背靠背布置的两个无指向性麦克风Ml、M2构建为两个背向心形指向性麦克风,以得到前向目标语音信号C(l, k)和后向噪声信号B(l,k),该前向目标语音信号C(l,k)和后向噪声信号B(l,k)具体为离散的频域信号,其中,1为与时间相关的参数,k为频带。
[0062]步骤S2:对前向目标语音信号C(l,k)和后向噪声信号B(l,k)进行相同程度的频率均衡,得到已均衡目标语音信号C' (l,k)和已均衡噪声信号B' (l,k),以防止因前向目标语音信号在不同的频带具有不同的缩放幅度而导致还原后的目标语音信号出现频率失真,在此对后向噪声信号进行相同程度的频率均衡是保证后续进行的自适应双滤波的准确性。
[0063]步骤S3:对已均衡目标语音信号C' (l,k)进行以^表示的自适应滤波处理,估计出已均衡噪声信号中存在的以βτ.c' (l,k)表示的目标语音信号的泄漏成分。
[0064]步骤S4:从已均衡噪声信号B' (l,k)中去除目标语音信号的泄漏成分β τ.C' (1,k),得到更加纯净的已修正噪声信号CBA(1,k)。
[0065]步骤S5:对已修正噪声信号CBA(1,k)进行以β表示的自适应滤波处理,估计出已均衡目标语音信号中存在的以β *CBA(l,k)表示的噪声信号的泄漏成分。
[0066]步骤S6:从已均衡目标语音信号C' (l,k)中去除噪声信号的泄漏成分β ?08六(1,10,得到已修正目标语音信号0171(1,10。通过步骤S3至步骤S6进行的自适应双滤波,保证了从已均衡目标语音信号中去除的仅为噪声信号的泄漏成分β.0ΒΑ(1Λ),进而可以有效避免在降噪的同时损害目标语音信号问题的发生,保证经本发明方法还原得到的目标语音信号γ_α,ιο的真实性。
[0067]步骤S7:基于该已修正目标语音信号0UT(1,k),得到还原后的目标语音信号,即降噪输出的时域目标语音信号。
[0068]在步骤S7中,可采用直接将已修正目标语音信号OUT (1,k)转换为时域信号,得到还原后的目标语音信号的方式。在本发明中,为了进一步对已修正目标语音信号0UT(l,k)中残留的稳态噪声做进一步的有效抑制,还可进一步对已修正目标语音信号0UT(l,k)进行自适应后置滤波处理,得到已后置滤波目标语音信号(1,k),最后再基于该已后置滤波目标语音信号Y- (1,k)得到还原后的目标语音信号yciut (η),具体为对已后置滤波目标语音信号Υ_(1Λ)进行反傅里叶变换(IDFT),以将已后置滤波目标语音信号¥_(1,10转换为时域目标语音信号y- (η),在实际应用中,该时域目标语音信号y- (η)通常经过数模转换后即可输出。在此,该自适应后置滤波处理例如可采用维纳滤波方法、卡尔曼滤波方法等手段进行,其中,采用维纳滤波方法进行自适应后置滤波处理的具体方法如图7所示可为:
[0069]分别计算已修正目标语音信号0UT(1,k)和已修正噪声信号CBA(1,k)的功率谱λ out(l, k)和λΒ(1,10,利用功率谱λΒ(1,10和λ_(1,10进行自适应后置滤波,最终输出已后置滤波目标语音信号(1, k):
[0070]Yout(l,k) =G(l,k).λ_(1,10^*6(1,10为自适应后置滤波的增益,该增益可利用最小均方误差的方法获得:
[0071]即G(l,k)=S' (1,k)/( λ B(l, k)+S' (1, k))
[0072]公式中的S' (1,k)为考虑到语音信号的短时平稳性和相关性,通过平滑递归得到的干净语音信号,其估计方法为:
[0073]S' (1, k) = 0.85*Yout (1-1, k) +0.15* ( λ out (1, k) - λ B(1, k))
[0074]其中,Yout(l-l, k)为上一时间帧输出的已后置滤波目标语音信号,λ_(ι,ιΟ-λΒ(ι,ιο为初步估计得到的当前时间帧估计降噪语音信号。另外,上述自适应后置滤波的增益G(l,k)还可通过递归最小二乘滤波算法、自适应滤波的神经网络方法、基于QR分解的方法、统一模型下的自适应滤波及基于高阶累积量的自适应算法等获得。
[0075]步骤S1中利用波束成形技术将组成麦克风阵列的如图4所示的背靠背布置的两个无指向性麦克风M1、M2构建为两个背向心形指向性麦克风的具体方法如下:
[0076]如图2所示,首先使麦克风Ml和麦克风M2背靠背布置,即使二者的轴向AX重合,其中的麦克风Ml面向目标语音信号区域α,而麦克风M2则面向噪声信号区域β。
[0077]利用图2所示的麦克风阵列构建两个背向心形指向性麦克风,以得到前向目标语音信号和后向噪声信号的过程如下:
[0078]步骤S101:如图3所示,经麦克风Ml获得时域声音信号Xl (η),及经麦克风M2获得时域声音信号x2 (η),其中,假设时域源信号为s (η),则经麦克风Ml接收到的时域声音信号xjn) = s (η),经麦克风M2接收到的时域声音信号x2 (n) = s (η_ τ ),其中,时域源信号s(n)、时域声音信号Xl(n)和时域声音信号x2(n)均为经过模数转换后获得的数字信号,其中η代表时间,τ为时域源信号s(n)到达麦克风M2的时间相对到达麦克风Ml的时间的延迟,在此假设时域源信号s (η)的入射波方向与轴向ΑΧ的夹角为Θ,则τ = dcos Θ /c,其中d为麦克风Ml和麦克风M2之间的间距,c为声音在空气中的传播速度,一般取c等于340米/秒。
[0079]步骤S102:将时域声音信号Xl (η)和时域声音信号χ2 (η)从时间域变换为频率域,这具体需要先对时域声音信号进行分帧处理,再将分帧后的每帧时域声音信号进行加窗处理,最后对加窗后的每帧时域声音信号进行离散傅里叶变换(DFT),最终得到源于时域声音信号Χι(η)的频域声音信号X: (1,k)和源于时域声音信号X2 (η)的频域声音信号Χ2 (1,k),具体地 Xjl’k) =S(l,k),X2(l,k) =S(l,k)e ,其中 S(l,k)为源于源信号 s(n)的频域源信号。
[0080]步骤S103:如图5所示,以麦克风Ml接收到的频域声音信号(1,k)减去对麦克风M2接收到的频域声音信号进行时间T延迟后的信号,得到主要包括目标语音信号的前向目标语音信号C(l,k),即C(l, k) = X“l,k)-X2(l, k)e」樣;及以麦克风M2接收到的频域声音信号X2(l,k)减去对麦克风Ml接收到的频域声音信号进行时间T延时后的信号,得到主要包括噪声信号的后向噪声信号B (1,k),即:B (1,k) = X2 (1,k) (1,k) e JMd/c ;这里选取延迟时间Τ = d/c,其中d为麦克风Ml和麦克风M2之间的
间距,c为声音在空气中的传播速度。通过该步骤即可将麦克风Ml、麦克风M2构建为两个背向心形指向性麦克风,图4示出了由麦克风Ml、麦克风M2组成的麦克风阵列的波束图。
[0081]上述步骤S2中,对前向目标语音信号C(l,k)和后向噪声信号B(l,k)进行相同程度的频率均衡,得到已均衡目标语音信号和已均衡噪声信号包括:
[0082]步骤S201:提取前向目标语音信号C(l,k)相对最先到达麦克风阵列的频域声音信号Xi(l,k),即频域源信号S(l,k),进行缩放的增益因子,具体为:
[0083]C(l, k) = Xj (1, k)-X2(l, k) e.]ωΤ = S(l, k)_S(l, k) e.]ω(τ+τ),进而得到:
[0084]C(l,k) = S(l,k) (1-e JW(dcose/c+T)) =S(l,k).2sin [ jt f (T+dcos Θ/c)];
[0085]由此可见,前向目标语音信号C(l,k)并不仅仅是频域源信号S(l,k),还乘上了一个与信号频率相关增益因子2sin[ π f (T+dcos Θ /c)](f为频带k对应的频率值),在此将该增益因子记为lq,该增益因子会使得前向目标语音信号在不同的频带具有不同的缩放幅度,从而导致还原后的目标语音信号的失真,因此本发明在该步骤对前向目标语音信号C(l,k)进行频率均衡,也即将该增益因子规整掉,就可以避免还原后的目标语音信号出现频率失真。
[0086]步骤S202:将前向目标语音信号C(l,k)除以该增益因子weq,得到已均衡目标语音信号 c' (l,k)。
[0087]步骤S203:将后向噪声信号B(l,k)除以增益因子weq,得到已均衡噪声信号B' (l,k)。
[0088]为了使上述自适应双滤波可以获得更好的修正和跟踪效果,本发明利用信噪比对两路自适应滤波的估计输出的更新时间进行控制,具体为:计算已修正目标语音信号0UT(l,k)与已修正噪声信号CBA(l,k)之间的信噪比、⑴;在信噪比Y⑴大于预设门限时,认为存在目标语音信号的泄漏成分βτ.(Τ (l,k),则更新估计出的目标语音信号的泄漏成分βτ.(Τ (l,k);在信噪比、(1)小于等于预设门限时,认为存在噪声信号的泄漏成分β.0ΒΑ(1,10,则更新估计出的噪声信号的泄漏成分β *CBA(l,k)o在此,该预设门限可根据麦克风阵列的应用场合设定,对于麦克风Ml与需要采集的目标语音信号较近的应用场合,例如在降噪耳机中的应用,容易获得更高的信噪比,此时预设门限应设定的相对高一些,通常设定为10左右;而对于麦克风Ml与需要采集的目标语音信号较远的应用场合,例如在某些固定的降噪设备中的应用,信噪比会相对较低,此时预设门限应设定的相对低一些,通常设定为5左右,基于上述说明该预设门限的参考设定范围为5至10。
[0089]上述计算已修正目标语音信号与已修正噪声信号之间的信噪比、(1)具体可包括:计算所有频带下的已修正目标语音信号总量;计算所有频带下的已修正噪声信号总量;计算已修正目标语音信号总量与所述已修正噪声信号总量的比,并将计算结果作为已修正目标语音信号与所述已修正噪声信号之间的信噪比、(1),公式表达为:Y (1)=Σ k0UT(l,k)/ Σ kCBA(l,k)。
[0090]本发明的基于麦克风阵列的语音降噪方法首先通过波束成形技术将组成麦克风阵列的背靠背布置的两个无指向性麦克风构建为两个背向心形指向性麦克风,因此可利用该麦克风阵列获得主要包括目标语音信号的前向目标语音信号和主要包括噪声信号的后向噪声信号;之后通过对前向目标语音信号进行规整掉与频率相关的增益因子的频率均衡处理,可以避免还原后的目标语音信号出现频率失真,为了保证后续自适应双滤波的准确实施,本发明在此对后向噪声信号进行了与前向目标语音信号相同程度的频率均衡,以保证在该频率均衡步骤可对前向目标语音信号和后向噪声信号进行相同程度的缩放;在上述处理的基础上,本发明的方法创新性地采用了自适应双滤波方法对已均衡目标语音信号进行降噪处理,利用后向噪声信号和前向目标语音信号的陷零方向分别跟踪到目标语音信号的泄漏成分和噪声信号的泄漏成分,具体为首先通过对已均衡目标语音信号进行自适应滤波处理,估计出已均衡噪声信号中存在的目标语音信号的泄漏成分,也即已均衡噪声信号中具有的目标语音信号的成分,这样,本发明通过在已均衡噪声信号中去除该目标语音信号的泄漏成分的方式即可获得纯净的已修正噪声信号,此时,再对已修正噪声信号进行自适应滤波处理,即可更准确地估计出已均衡目标语音信号中存在的噪声信号的泄漏成分,因此,通过在已均衡目标语音信号中去除该已噪声信号的泄漏成分,即可有效避免在对已均衡目标语音信号进行降噪的同时损害目标语音信号问题的发生,进而可以保证经本发明方法还原得到的目标语音信号的真实性。
[0091]与上述基于麦克风阵列的语音降噪方法相对应,本发明的基于麦克风阵列的语音降噪系统包括波束形成模块1、频率均衡模块2、目标语音信号自适应滤波模块3、噪声信号修正模块4、噪声信号自适应滤波模块5、目标语音信号修正模块6和后置处理模块7,该波束形成模块1用于按照图5和图7所示的波束成形技术将组成麦克风阵列的如图4所示的背靠背布置的两个无指向性麦克风Ml、M2构建为两个背向心形指向性麦克风,以得到前向目标语音信号C(l,k)和后向噪声信号B(l,k);频率均衡模块2用于对前向目标语音信号C(l,k)和后向噪声信号B(l,k)进行相同程度的频率均衡,得到已均衡目标语音信号C' (l,k)和已均衡噪声信号B' (l,k);目标语音信号自适应滤波模块3用于对已均衡目标语音信号C' (l,k)进行以^^表示的自适应滤波处理,估计出已均衡噪声信号存在的以β τ.C' (1,k)表示的目标语音信号的泄漏成分;噪声信号修正模块4用于从已均衡噪声信号B' (l,k)中去除目标语音信号的泄漏成分βτ.(Τ (l,k),得到已修正噪声信号CBA(l,k);噪声信号自适应滤波模块5用于对已修正噪声信号CBA(l,k)进行以β表征的自适应滤波处理,估计出已均衡目标语音信号中存在的以β *CBA(l,k)表示的噪声信号的泄漏成分;目标语音信号修正模块6用于从已均衡目标语音信号C' (l,k)中去除噪声信号的泄漏成分β <84(1,10,得到已修正目标语音信号0171(1,10 ;后置处理模块7用于基于该已修正目标语音信号ουτα,k),得到还原后的目标语音信号。
[0092]如图8所示,上述频率均衡模块2可进一步包括增益因子提取单元21、目标语音信号均衡单元22和噪声信号均衡单元23,该增益因子提取单元21用于提取所述前向目标语音信号相对最先到达所述麦克风阵列的频域声音信号进行缩放的增益因子;目标语音信号均衡单元22用于将前向目标语音信号C(l,k)除以增益因子ww得到已均衡目标语音信号C' (l,k);噪声信号均衡单元23用于将后向噪声信号B(l,k)除以所述增益因子ww得到已均衡噪声信号B' (l,k)。
[0093]如图9所示,本发明的系统还可包括信噪比计算模块8,其用于计算已修正目标语音信号0UT(l,k)与所述已修正噪声信号CBA(l,k)之间的信噪比、(1);在此基础上,上述目标语音信号自适应滤波模块3还用于在信噪比γ (1)大于预设门限时,更新估计出的目标语音信号的泄漏成分β τ.C' (1,k);该噪声信号自适应滤波模块5还用于在信噪比Y (1)小于等于预设门限时,更新估计出的噪声信号的泄漏成分β *CBA(l,k)o
[0094]上述信噪比计算模块8可进一步包括第一计算单元、第二计算单元和信噪比计算单元(未图示),该第一计算单元用于计算所有频带下的已修正目标语音信号总量;该第二计算单元用于计算所有频带下的已修正噪声信号总量;该信噪比计算单元用于计算所述已修正目标语音信号总量与所述已修正噪声信号总量的比,并将计算结果作为已修正目标语音信号0UT(1,k)与已修正噪声信号CBA(1,k)之间的信噪比、⑴。
[0095]上述后置处理模块7例如可以采用维纳滤波方法对所述已修正目标语音信号进行自适应后置滤波处理,得到已后置滤波目标语音信号(1,k),最后基于已后置滤波目标语音信号Υ_(1,k)得到还原后的目标语音信号yciut(n)。
[0096]本发明的基于麦克风阵列的语音降噪系统首先通过波束形成模块1获得主要包括目标语音信号的前向目标语音信号和主要包括噪声信号的后向噪声信号;之后通过频率均衡模块2对前向目标语音信号进行规
整掉与频率相关的增益因子的频率均衡处理,可以避免还原后的目标语音信号出现频率失真,为了保证后续自适应双滤波的准确实施,该频率均衡模块2在此对后向噪声信号进行了与前向目标语音信号相同程度的频率均衡,以保证该频率均衡模块2可对前向目标语音信号和后向噪声信号进行相同程度的缩放;在此基础上,本发明的系统创新性地通过目标语音信号自适应滤波模块3、噪声信号修正模块4、噪声信号自适应滤波模块5和目标语音信号修正模块6采用了自适应双滤波方法对已均衡目标语音信号进行降噪处理,利用后向噪声信号和前向目标语音信号的陷零方向分别跟踪到目标语音信号的泄漏成分和噪声信号的泄漏成分,具体为首先通过目标语音信号自适应滤波模块3对已均衡目标语音信号进行自适应滤波处理,估计出已均衡噪声信号中存在的目标语音信号的泄漏成分,也即已均衡噪声信号中具有的目标语音信号的成分,这样,噪声信号修正模块4通过在已均衡噪声信号中去除该目标语音信号的泄漏成分的方式即可获得纯净的已修正噪声信号,此时,再通过噪声信号自适应滤波模块5对已修正噪声信号进行自适应滤波处理,即可更准确地估计出已均衡目标语音信号中存在的噪声信号的泄漏成分,因此,通过目标语音信号修正模块6在已均衡目标语音信号中去除该噪声信号的泄漏成分,即可有效避免在对已均衡目标语音信号进行降噪的同时损害目标语音信号问题的发生,进而可以保证经本发明系统还原得到的目标语音信号的真实性。
[0097]本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的模块或单元可以是或者也可以不是物理上分开的,作为模块或单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0098] 以上依据图式所示的实施例详细说明了本发明的构造、特征及作用效果,以上所述仅为本发明的较佳实施例,但本发明不以图面所示限定实施范围,凡是依照本发明的构想所作的改变,或修改为等同变化的等效实施例,仍未超出说明书与图示所涵盖的精神时,均应在本发明的保护范围内。
【主权项】
1.一种基于麦克风阵列的语音降噪方法,其特征在于,包括: 利用波束成形技术将组成所述麦克风阵列的背靠背布置的两个无指向性麦克风构建为两个背向心形指向性麦克风,以得到前向目标语音信号和后向噪声信号; 对所述前向目标语音信号和所述后向噪声信号进行相同程度的频率均衡,得到已均衡目标语音信号和已均衡噪声信号; 对所述已均衡目标语音信号进行自适应滤波处理,估计出所述已均衡噪声信号中存在的目标语音信号的泄漏成分; 从所述已均衡噪声信号中去除所述目标语音信号的泄漏成分,得到已修正噪声信号;对所述已修正噪声信号进行自适应滤波处理,估计出所述已均衡目标语音信号中存在的噪声信号的泄漏成分; 从所述已均衡目标语音信号中去除所述噪声信号的泄漏成分,得到已修正目标语音信号; 基于所述已修正目标语音信号,得到还原后的目标语音信号。2.根据权利要求1所述的方法,其特征在于,所述对所述前向目标语音信号和所述后向噪声信号进行相同程度的频率均衡,得到已均衡目标语音信号和已均衡噪声信号包括: 提取所述前向目标语音信号相对最先到达所述麦克风阵列的频域声音信号进行缩放的增益因子; 将所述前向目标语音信号除以所述增益因子,得到所述已均衡目标语音信号; 将所述后向噪声信号除以所述增益因子,得到所述已均衡噪声信号。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括: 计算所述已修正目标语音信号与所述已修正噪声信号之间的信噪比; 在所述信噪比大于预设门限时,更新估计出的所述目标语音信号的泄漏成分; 在所述信噪比小于等于所述预设门限时,更新估计出的所述噪声信号的泄漏成分。4.根据权利要求3所述的方法,其特征在于,所述计算所述已修正目标语音信号与所述已修正噪声信号之间的信噪比包括: 计算所有频带下的已修正目标语音信号总量; 计算所有频带下的已修正噪声信号总量; 计算所述已修正目标语音信号总量与所述已修正噪声信号总量的比,并将计算结果作为所述已修正目标语音信号与所述已修正噪声信号之间的信噪比。5.根据权利要求1或2所述的方法,其特征在于,所述基于所述已修正目标语音信号,得到还原后的目标语音信号包括: 对所述已修正目标语音信号进行自适应后置滤波处理,得到已后置滤波目标语音信号; 基于所述已后置滤波目标语音信号,得到所述还原后的目标语音信号。6.一种基于麦克风阵列的语音降噪系统,其特征在于,包括: 波束形成模块,用于利用波束成形技术将组成所述麦克风阵列的背靠背布置的两个无指向性麦克风构建为两个背向心形指向性麦克风,以得到前向目标语音信号和后向噪声信号; 频率均衡模块,用于对所述前向目标语音信号和所述后向噪声信号进行相同程度的频率均衡,得到已均衡目标语音信号和已均衡噪声信号; 目标语音信号自适应滤波模块,用于对所述已均衡目标语音信号进行自适应滤波处理,估计出所述已均衡噪声信号中存在的目标语音信号的泄漏成分; 噪声信号修正模块,用于从所述已均衡噪声信号中去除所述目标语音信号的泄漏成分,得到已修正噪声信号; 噪声信号自适应滤波模块,用于对所述已修正噪声信号进行自适应滤波处理,估计出所述已均衡目标语音信号中存在的噪声信号的泄漏成分; 目标语音信号修正模块,用于从所述已均衡目标语音信号中去除所述噪声信号的泄漏成分,得到已修正目标语音信号;以及, 后置处理模块,用于基于所述已修正目标语音信号,得到还原后的目标语音信号。7.根据权利要求6所述的系统,其特征在于,所述频率均衡模块包括: 增益因子提取单元,用于提取所述前向目标语音信号相对最先到达所述麦克风阵列的频域声音信号进行缩放的增益因子; 目标语音信号均衡单元,用于将所述前向目标语音信号除以所述增益因子,得到所述已均衡目标语音信号;以及, 噪声信号均衡单元,用于将所述后向噪声信号除以所述增益因子,得到所述已均衡噪声信号。8.根据权利要求6或7所述的系统,其特征在于,所述系统还包括: 信噪比计算模块,用于计算所述已修正目标语音信号与所述已修正噪声信号之间的信噪比; 所述目标语音信号自适应滤波模块还用于在所述信噪比大于预设门限时,更新估计出的所述目标语音信号的泄漏成分; 所述噪声信号自适应滤波模块还用于在所述信噪比小于等于所述预设门限时,更新估计出的所述噪声信号的泄漏成分。9.根据权利要求8所述的系统,其特征在于,所述信噪比计算模块包括: 第一计算单元,用于计算所有频带下的已修正目标语音信号总量; 第二计算单元,用于计算所有频带下的已修正噪声信号总量;以及, 信噪比计算单元,用于计算所述已修正目标语音信号总量与所述已修正噪声信号总量的比,并将计算结果作为所述已修正目标语音信号与所述已修正噪声信号之间的信噪比。10.根据权利要求6或7所述的系统,其特征在于,所述后置处理模块还用于对所述已修正目标语音信号进行自适应后置滤波处理,得到已后置滤波目标语音信号;及还用于基于所述已后置滤波目标语音信号,得到所述还原后的目标语音信号。
【专利摘要】本发明公开了一种基于麦克风阵列的语音降噪方法及系统,包括:将组成麦克风阵列的两个无指向性麦克风构建为两个背向心形指向性麦克风,得到前向目标语音信号和后向噪声信号;对前向目标语音信号和后向噪声信号进行相同程度的频率均衡,得到已均衡目标语音信号和已均衡噪声信号;对前向目标语音信号和后向噪声信号进行自适应双滤波,得到已修正噪声信号和已修正目标语音信号;基于已修正目标语音信号,得到还原后的目标语音信号。本发明采用频率均衡避免还原后的目标语音信号出现频率失真,采用自适应双滤波方法解决在通过自适应滤波器进行降噪的同时也损害到目标语音信号的问题,进而彻底避免还原后的目标语音信号出现失真。
【IPC分类】G10L21/0208, H04R3/00
【公开号】CN105489224
【申请号】CN201410468440
【发明人】王海坤, 马峰, 乔玉平, 王智国, 胡国平, 胡郁, 刘庆峰
【申请人】讯飞智元信息科技有限公司
【公开日】2016年4月13日
【申请日】2014年9月15日