专利名称:梯度频率非线性振荡器网络中的学习和听觉场景分析的制作方法
技术领域:
本申请通常涉及音频信号输入的感知和识别,更具体地,涉及一种用于以更接近地模拟人耳和大脑的操作的方式提供结构化信号的非线性频率分析的信号处理方法和装置。
背景技术:
根据授权给Edward ff. Large (Large)的美国专利No. 7, 376, 562,利用非线性振荡器阵列处理输入语音信号在现有技术中是已知的。
人耳已经被建模成调谐到多个不同频率的振荡器。根据解释声音输入的需要,人脑通过连接振荡器对来对来自这些振荡器的信号进行处理。世界上自然存在的音频声音是复杂的信号,因此,发达的人耳是利用振荡器之间的这些连接的复杂处理器。事实上,振荡器之间的连接是不断变化的并且连接模式是对反复输入的学习的反应。这导致触突前细胞和触突后细胞之间的触突效率的提高。从现有建模技术还知道,两个振荡器之间的连接具有强度(振幅)和固有相位(natural phase)。
从Large通常了解到利用非线性振荡器网络来对信号进行处理。非线性共振提供了在线性共振中无法观察到的各种行为(例如,神经振荡)。此外,事实上,振荡器能够被连成复杂的网络。图I示出了用于对声信号进行处理的典型架构。它由一维阵列的非线性振荡器(称为梯度(gradient)频率非线性振荡器网络(GFNNs))组成。在图I中,GFNNs被布置成处理层,以模拟层I (输入层)处的耳蜗(102)、层2处的背侧耳蜗核(DCN) (104)以及层3处的下丘(ICC) (106)进行的听觉处理。从生理学的角度来看,非线性共振模拟耳蜗内的外毛细胞以及在DCN和ICC上的锁相神经响应。从信号处理的角度来看,由多个GFNN层进行处理不是多余的;由于非线性的缘故,信息在每一层处都增加。
更具体地,如图2所示,示例的非线性振荡器系统由包括非线性振荡器405”4052、4053、. . .、405n的网络402组成。输入激励层401可以通过一组激励连接403将输入信号传输到网络402。就这一点而言,输入激励层401可以包括一个或多个输入通道(channels)406^406^4063^ · · .、406。。输入通道可以包括多频率输入的单通道、多频率输入的两个或多个通道、或单频率输入的多通道,如通过事先频率分析来提供。事先频率分析可包括线性方法(傅里叶变换、小波变换、或线性滤波器组、现有技术中已知的方法)或者另一非线性网络,例如相同类型的另一网络。[0009]假设如图2中所示的C输入通道,那么在t时刻,通道406。上的激励表示为(t),并且对于特定的共振,激励连接403的矩阵可以作为从输入通道406c到振荡器405n的连接的强度来进行分析,正如从Large所了解到的。尤其,可以对连接矩阵进行选择,以使得这些激励连接中的一个或多个的强度等于零。
再次参见图2,内部网络连接404确定网络402中每个振荡器405N如何连接到另一个振荡器405n。根据Large可知,这些内部连接可被表示为复值参数的矩阵,每个复值参数描述了对于特定共振从一个振荡器405 到另一个振荡器405N的连接的强度,正如下面所解释的。
从Large可以知道,可以执行由非线性振荡器网络进行的信号处理,以概括地模拟耳朵响应。这类似于通过线性滤波器组来进行的信号处理,但是重要的区别是,处理单元是非线性的,而不是线性振荡器。在这部分中,该方法通过将其与线性时频分析进行比较来说明。
常见的信号处理操作是对复杂输入信号进行频率分解,例如通过傅里叶变换。通常,该操作是通过对输入信号X(t)进行处理的一组线性带通滤波器来实现的。例如,广泛使用的耳蜗的模型是gammatone滤波器组(Patterson等,1992)。为了与我们的模型相比较,泛化形式(generalization)可以写成微分方程
i = z{a + w) + x(i)(j)
其中,上点(overdot)表示相对于时间的微分(例如,dz/dt), z是复值状态变量,ω是角频率(ω = 2Jif,f以Hz为单位),α < O为线性阻尼参数。项x(t)表示由时变外部信号的线性强制(linear forcing)。因为z在每个时间t处都是复数,因此其可重写成极坐标形式,以振幅r和相位Φ来揭示系统行为。线性系统中的共振是指该系统在激励频率下进行振荡,振幅和相位是系统参数确定的。当激励频率Oci接近振荡器频率ω时,振荡器振幅r增加,以提供带通滤波行为。
最近,耳蜗的非线性模型已经被提,以对外毛细胞的非线性响应进行模拟。值得注意的是,外毛细胞被认为是负责耳蜗对柔和声音的极度敏感、良好的频率选择性和振幅压缩(例如,Egulluz, Ospeck, Choe, Hudspeth, & Magnasco, 2000)。解释这些特性的非线性共振模型已经以针对非线性振动的霍普夫标准型(Hopf normal form)为基础,并且是通用的。标准型(截取式)模型具有形式
z — z(m + ω + 0/ζ/2) + s(t) + Κ&Λ,(2)
注意这种形式和等式I的线性振荡器之间的表面相似性。再次,ω是角频率,并且α仍然为线性阻尼参数。然而在该非线性公式中,α变成了分岔参数(bifurcationparameter),其可假设为正值或负值以及α = O。值α = O被称为分岔点。β < O为非线性阻尼参数,其在α > O时阻止振幅放大(blow up)。再次,x(t)是指由外部信号的线性强制。项h.o.t.是指非线性展开式的高阶项,在标准型模型中,这些高阶项被截去(即,忽略)。类似于线性振荡器,非线性振荡器随着听觉激励的频率开始共振;结果,它们提供了一种滤波行为,其中它们最大程度地响应于接近它们自己的频率的激励。然而,重要的不同点在于,非线性模型解决了线性模型没有解决的行为,例如对微弱信号的极度敏感性、振幅压缩和较高的频率选择性。压缩的ga_achirp滤波器组表现出类似于等式2的非线性行为,但是明确地表达在信号处理框架(Irino & Patterson, 2006)中[0018]Large教导对等式2的高阶项进行扩展以实现不同频率的振荡器之间的耦合。这实现了非线性振荡器的梯度频率网络的有效计算,代表该项技术的根本改善。从发明
人的同时待审的申请No._可知,标准模型(等式3)与标准型(等式2;参见例如
Hoppensteadt & Izhikevich, 1997)有关,但是它的特性超越Hopf标准型的特性,因为基本的、更为现实可行的振荡器模型被充分展开,而不是被截取。高阶项的完全扩展(completeexpansion)产生如下形式的模型
权利要求1.一种用于学习神经网络中的非线性振荡器之间的连接的方法,包括 提供多个非线性振荡器,响应于输入,每个振荡器产生不同于其他振荡器的振荡; 检测所述多个非线性振荡器中的至少第一振荡器处的输入; 检测所述多个非线性振荡器中的至少第二振荡器处的输入; 对一时间点处的所述至少第一振荡器的所述振荡和所述至少第二振荡器的所述振荡进行比较; 确定所述至少第一振荡器的所述振荡和所述至少第二振荡器的所述振荡之间是否存在相关性;以及 根据所述至少第一振荡器的所述振荡和所述至少第二振荡器的所述振荡之间的所述相关性来改变所述至少第一振荡器和所述至少第二振荡器之间的连接的振幅和相位中的至少一个。
2.根据
权利要求I所述的方法,其中,所述连接表示为
3.根据
权利要求I所述的方法,进一步包括以下步骤当所述至少第一振荡器的所述振荡和所述至少第二振荡器的所述振荡之间存在相关性时,调节所述连接的所述相位以反映所述至少第一振荡器和所述第二振荡器之间的当前相位关系。
4.根据
权利要求I所述的方法,进一步包括以下步骤 当所述至少第一振荡器的所述振荡和所述至少第二振荡器的所述振荡之间不存在相关性时,减小所述至少第一振荡器和所述至少第二振荡器之间的所述连接的所述振幅。
5.根据
权利要求I所述的方法,进一步包括以下步骤 当所述至少第一振荡器的所述振荡和所述至少第二振荡器的所述振荡之间存在相关性时,增大所述至少第一振荡器和所述至少第二振荡器之间的所述连接的所述振幅。
6.一种用于学习神经网络中的非线性振荡器之间的连接的方法,包括 提供多个非线性振荡器,响应于输入,每个振荡器产生不同于其他振荡器的振荡; 检测所述多个非线性振荡器中的至少第一振荡器处的输入; 检测所述多个非线性振荡器中的至少第二振荡器处的输入; 对一时间点处的所述至少一个振荡器的所述振荡和所述至少第二振荡器的所述振荡进行比较; 确定所述至少一个振荡器的所述振荡和所述至少第二振荡器的所述振荡之间是否存在相关性;以及 当所述至少一个振荡器的所述振荡和所述至少第二振荡器的所述振荡大体上相关时,减小所述至少第一振荡器和所述至少第二振荡器之间的连接的振幅。
7.根据
权利要求6所述的方法,其中,所述连接表示为
8.根据
权利要求6所述的方法,进一步包括以下步骤当所述至少第一振荡器的所述振荡和所述至少第二振荡器的所述振荡之间存在相关性时,调节所述连接的所述相位以反映所述至少第一振荡器和所述第二振荡器之间的当前相位关系。
9.根据
权利要求6所述的方法,进一步包括以下步骤 当所述至少第一振荡器的所述振 荡和所述至少第二振荡器的所述振荡之间存在相关性时,增大所述至少第一振荡器和所述至少第二振荡器之间的所述连接的振幅。
10.一种用于进行听觉场景分析的方法,包括 提供多个非线性振荡器,响应于输入,每个振荡器产生不同于其他振荡器的振荡; 检测所述多个非线性振荡器中的至少第一振荡器处的输入; 检测所述多个非线性振荡器中的至少第二振荡器处的输入; 对一时间点处的所述至少第一振荡器的所述振荡和所述至少第二振荡器的所述振荡进行比较; 确定所述至少第一振荡器的所述振荡和所述至少第二振荡器的所述振荡之间是否存在相关性;以及 当所述至少第一振荡器的所述振荡和所述至少第二振荡器的所述振荡之间存在相关性时,增大所述至少第一振荡器和所述至少第二振荡器之间的连接的振幅。
11.根据
权利要求10所述的方法,其中,所述连接表示为
12.根据
权利要求10所述的方法,进一步包括以下步骤 当所述至少第一振荡器的所述振荡和所述至少第二振荡器的所述振荡之间存在相关性时,调节所述连接的所述相位以反映所述至少第一振荡器和所述第二振荡器之间的当前相位关系。
13.根据
权利要求10所述的方法,进一步包括以下步骤 当所述至少第一振荡器的所述振荡和所述至少第二振荡器的所述振荡之间不存在相关性时,减小所述至少第一振荡器和所述至少第二振荡器之间的所述连接的所述振幅。
专利摘要一种用于学习神经网络中的非线性振荡器之间的连接的方法包括提供多个非线性振荡器,响应于输入,每个非线性振荡器产生不同于其他振荡器的振荡;以及检测所述多个非线性振荡器中的至少第一振荡器处的输入。检测所述多个非线性振荡器中的至少第二振荡器处的输入,对一时间点处的所述至少第一振荡器的所述振荡和所述至少第二振荡器的所述振荡进行比较,以及确定所述至少第一振荡器的所述振荡和所述至少第二振荡器的所述振荡之间是否存在相关性。根据所述至少第一振荡器的所述振荡和所述至少第二振荡器的所述振荡之间的所述相关性来改变所述至少第一振荡器和所述至少第二振荡器之间的连接的振幅和相位中的至少一个。
文档编号GKCN102934158SQ201180011181
公开日2013年2月13日 申请日期2011年1月28日
发明者爱德华·W·拉奇 申请人:循环逻辑有限责任公司, 佛罗里达大西洋大学研究公司导出引文BiBTeX, EndNote, RefMan