目标成分校准装置、电子设备和目标成分校准方法
【技术领域】
[0001] 本发明设及从被检体的观测数据求得关于被检体的目标成分的含有量的技术。
【背景技术】
[0002] 在专利文献1中公开了对于被检体中的葡萄糖浓度进行校准的技术。在现有技术 中,为了提高对于季节性及生理性变动的校正精度,在伴随季节或溫度的变化的长时期内, 收集多个侵入性测定/非侵入性测定的测定数据组,将其作为校正用数据,基于该校正用 数据,制作W多元回归分析为基础的校准模型。并且,定期地采集侵入性测定/非侵入性测 定的测定数据组,一边更新校正用数据,一边进行定期的校正,从而,提高对于季节性及生 理性变动的校正精度。
[000引(现有技术文献)
[0004] 专利文献 阳0化]专利文献1 :特开2008-5920号公报
【发明内容】
[0006] (发明所要解决的课题)
[0007] 但是,在上述现有技术中,使用W多元回归分析为基础的分析方法,不能进行目标 成分单体的抽出,为了对应生物体条件的不同等,需要准备多个不同条件的样本数据,制作 校准回归方程。因此,对于各个被检体,需要收集多个样本数据,花费时间和精力,并且,需 要频繁的校正。因此,希望一种与W往相比更容易且高精度地进行校准的技术。
[0008] (解决课题的技术方案)
[0009] 本发明为了解决上述课题的至少一部分而作出,能够通过W下的方式或者适用例 而实现。
[0010] (1)根据本发明的第一方式,提供一种求得关于被检体的目标成分的含有量的目 标成分校准装置。该目标成分校准装置,包含:混合系数计算部,基于关于所述被检体的观 测数据和校准用数据,求得关于所述被检体的目标成分的混合系数;目标成分量计算部,基 于表示与所述目标成分相对应的混合系数和含有量的关系的一元回归方程(単回帰式)和 通过所述混合系数计算部求得的混合系数,计算所述目标成分的含有量,其中,所述目标成 分量计算部,根据所述观测数据的取得时的测定条件,调整所述一元回归方程的两个常数 中的至少一个。
[0011] 通过该目标成分校准装置,由于根据观测数据的取得时的测定条件而调整一元回 归方程,因此,能够根据测定条件提高校准精度,并且,由于不需要进行多次观测,因此,能 够容易地进行校准。
[0012] 在一实施方式中,目标成分校准装置,包含:被检体观测数据取得部,取得关于所 述被检体的观测数据;校准用数据取得部,取得校准用数据,所述校准用数据包含:与所述 目标成分相对应的独立成分和校准用的一元回归方程;混合系数计算部,基于关于所述被 检体的观测数据和所述校准用数据,求得关于所述被检体的所述目标成分的混合系数;目 标成分量计算部,基于表示与所述目标成分相对应的混合系数与含有量的关系的所述一元 回归方程和通过所述混合系数计算部求得的混合系数,计算所述目标成分的含有量,其中, 所述目标成分量计算部,根据所述观测数据的取得时的测定条件,调整所述一元回归方程 的两个常数。
[0013] 通过该目标成分校准装置,关于被检体,即使仅取得一个观测数据,也能够高精度 地求得关于被检体的目标成分的含有量。
[0014] 在上述目标成分校准装置中,所述测定条件为测定环境,所述目标成分量计算部, 可根据所述测定环境调整所述一元回归方程的所述两个常数中的至少一个。通过该结构, 通过根据测定环境而调整一元回归方程,能够提高校准精度。此外,所谓测定环境是指进行 测定的环境状态。作为优选的测定环境的一例为被检体的溫度、进行测定的场所的溫度等。 从而,在被检体为人的情况下,测定环境为人的体溫或该人存在的场所的溫度。
[0015] (3)在上述目标成分校准装置中,所述测定条件为作为所述被检体的受测者的不 同,所述目标成分量计算部,根据受测者的不同,调整所述一元回归方程的所述两个常数中 的至少一个。根据该结构,通过根据受测者而调整一元回归方程,能够提高校准精度。
[0016] 本发明也能够通过上述的方式W外的各种方式实现,例如,能够通过包含上述装 置的电子设备、用于实现上述的装置的各部的功能的计算机程序、W及存储计算机程序的 非易失性存储介质(non-transitoiT storage medium)等而实现。
【附图说明】
[0017] 图1为示出利用独立成分分析的校准曲线制作处理的概要的说明图。
[0018] 图2为示出目标成分的校准处理的概要的说明图。
[0019] 图3为示出校准曲线的第一调整例的图表。
[0020] 图4为示出校准曲线的第二调整例的图表。
[0021] 图5为校准曲线制作处理的流程图。
[0022] 图6为示出校准曲线制作处理所使用的计算机的说明图。
[0023] 图7为示出校准曲线制作处理所使用的装置的功能模块图。
[0024] 图8为示出独立成分矩阵计算部的内部结构的一例的功能模块图。
[00巧]图9为示意性示出测定数据组DS1的说明图。
[00%] 图10为混合系数推定处理的流程图。
[0027] 图11为说明推定混合矩阵A的说明图。
[0028] 图12为回归方程的计算处理的流程图。
[0029] 图13为目标成分的校准处理所使用的装置的功能模块图。
[0030] 图14为目标成分的校准处理的流程图。
【具体实施方式】
[0031] W下,按照如下顺序说明本发明的实施方式。
[0032] A、校准曲线制作处理及校准处理的概要:
[0033] B、校准曲线的调整例:
[0034] C、校准曲线制作方法:
[0035] D、目标成分的校准方法:
[0036] E、各种算法及其影响:
[0037] F、变形例:
[0038] 在本实施方式中,使用W下的缩略语。
[0039] · ICA:独立成分分析(Independent Component Analysis)
[0040] · SNV:标准正态变量变换(Standard Normal Variate transformation)
[0041 ] · PNS:零空间投影法(Project on Null Space)
[0042] · PCA:主成分分析(Principal Components Analysis)
[0043] · FA:因子分析(Factor Analysis)
[0044] A、校准曲线制作处理及校准处理的概要: W45] 图1为示出利用独立成分分析的校准曲线制作处理的概要的说明图。图1的(A) 示出关于多个样本的观测数据(也称为"测定数据")的一例。该观测数据为分光吸光度, 例如,能够通过包含葡萄糖等的多个化学成分的样本的分光测定而得到。作为在校准曲线 制作处理中使用的多个样本,使用目标成分(例如,葡萄糖)的含有量已知的样本。取而代 之,也可W通过分析装置测定多个样本中包含的目标成分的含有量。
[0046] 校准曲线制作时,首先,通过对于观测数据进行预处理,降低观测数据中所包含的 变动或噪声(图1的度))。作为预处理,例如,进行包含观测数据的正态化的第一预处理 和包含白色化的第二预处理。在第一预处理部中,为了减少观测数据的各种变动因素(样 本的状态或测定环境的变化等)带来的影响,优选执行零空间投影法。然后,通过对于预处 理后的观测数据执行独立成分分析处理,得到多个独立成分IC1、IC2…(图1的(0)。上 述的独立成分IC1、IC2…为与各样本所包含的各个物质成分相对应的数据,为统计上相互 独立的成分。各样本的观测数据,能够作为上述的独立成分ICUIC2…的线性结合而再现。 在图1的(C)中仅例示出2个独立成分ICUIC2,独立成分的数量可W适当设定为2 W上的 任意的数。此外,在实施方式的说明中,"目标成分"运一用语是指样本包含的物质或者化学 成分,另一方面,"独立成分"运一用语是指与样本的观测数据具有相同的数据长度的数据。
[0047] 下面,如图1的(D)~(巧所示,计算预处理后的观测数据和独立成分(例如,IC1) 的内积。图1的做的观测数据与图1的做相同。当求取1个观测数据和1个独立成分 IC1的内积时,关于该观测数据得到1个内积值。从而,对于多个观测数据,当计算与同一个 独立成分IC1的内积时,关于多个样本,得到对于同一个独立成分IC1的多个内积值。图1 的(巧为,关于多个样本的内积值P作为横轴、多个样本包含的目标成分的已知的含有量C 作为纵轴而绘制的图。假定在内积使用的独立成分IC1为与目标成分相对应的独立成分的 情况下,如图1的(巧所示,内积值P和各样本的目标成分的含有量C具有强烈的相关性。 因此,将由图1的(C)得到的多个独立成分IC1、IC2…中的显示最强烈的相关性的独立成 分作为与目标成分相对应的独立成分而选择。在图1的示例中,独立成分IC1为与校准的 目标成分(例如葡萄糖)相对应的独立成分。校准曲线表示为由图1的(巧描绘的一元回 归方程C = uP+v所对应的直线。此外,由于内积值P为与各样本中的独立成分IC1的含有 量成比例的值,因此,也称为"混合系数"。
[0048] 图2为示出使用校准曲线的目标成分的校准处理的概要的说明图。在校准处理 中,利用通过图1所示的校准曲线制作处理得到的目标成分的独立成分ICl(图1的巧)) 和校准曲线(图1的(巧)而进行。在校准处理中,首先,取得目标成分的含有量未知的样 本的观测数据(图2的(A))。然后,对于该观测数据进行预处理(图2的度))。该预处理 优选为与校准曲线制作时使用的预处理相同的处理。通过求取该预处理后的观测数据和独 立成分IC1(图2的度))的内积,算出关于观测数据的内积值P。通过将该内积值P适用于 校准曲线,能够决定目标成分的含有量C。
[0049] 不过,在本实施方式中,根据被检体的观测数据的测定条件调整校准曲线的一元 回归方程(图2巧))。例如,能够根据下式调整一元回归方程。
[0050] [式 1] 阳05U C = (ku · u)P+(kv · V). . . (1)
[0052] 运里,C为目标成分的含有量;P为内积值(混合系数);u、v为调整前的一元回归 方程的常数;k。、ky为常数U、V的调整系数。调整系数k。、ky,在目标成分校准前,被分别决 定为与测定条件相对应的适当的值、并设定在校准装置内。
[0053] 通过使用运样调整的校准曲线,能够精度良好地进行校准。并且,无需对于每个被 检体收集多个采样数据,通过校准曲线的调整而能够容易地提高校准精度。
[0054] 作为测定条件,例如可W考虑测定溫度(被检体的溫度、进行测
定的场所的溫 度)、湿度、气压等测定环境、W及作为被检体的受测者的不同等。基于溫度、湿度、气压等 的物理性测定条件(测定环境)调整校准曲线的情况下,优选依存于测定条件而预先决定 上述调整系数ku、ky的值并存储。并且,将作为被检体的受测者的不同作为测定条件的不同 而考虑的情况下,优选对于每位受测者预先决定上述(1)式的调整系数k。、ky。此外,代替 决定调整系数ku、ky,也可W预先决定调整完毕的常数(ky-U)、(ky-V)并存储。可W理解, 在上述任一种情况下,在预先决定与测定条件相对应的校准的一元回归方程的适当的常数 (ky · U)、(ky · V)方面是共通的。此外,有关图1的校准曲线制作处理和图2的校准处理, 将于下文详述。 阳化5] 可是,在使用现有技术说明的多元回归分析的校准方法中,与独立成分分析不同, 由于不能进行成分的单独分离,因此,需要使用包含全部测定条件的不同的数据组制作校 准曲线的回归方程。例如,在校准人体的血糖值的情况下,由于个体差也包含于测定条件的 不同中,因此,如果不对于每位受测者长期地收集校正数据的话,则不能使用该校准方法。 由于通过多元回归的校准回归方程表示在观测数据中出现的测定条件的不同,因此,回归 方程所包含的参数(系数)的个数也自然变多。并且,由于目标成分的信息分散于各说明变 量而存在,因此,当测定条件改变时,目标成分对于所有的说明变量的影响方式也变化。因 此,必须调整校准曲线的回归方程所包含的所有的系数,为了根据测定条件的不同进行校 准曲线的调整,需要至少与回归方程所包含的系数的个数相同的个数的数据组,因此,需要 复杂且繁杂的处理。
[0056] 运里,作为示例,在多元回归分析中,对于使说明变量的数量为7的情况进行考虑 的话,运种情况下的校准回归方程通过下式表达。
[00日7] Y 二过1 X Χι+&2 X X2+··· +过7 X X?+b
[005引运里,Y为目标变量,Xi α = 1~7)为说明变量,曰1 α = 1~7)及b为系数。 [0059] 运种情况下,为了调整8个系数ai、b,解如下的8元联立方程式,因此,需要具备8 个目标变量和56个说明变量的数据。
[0060] Υι= aiXXii+a2XXi2+…+a7XXi7+b
[0061] ......
[0062] Ys二 aiXX8i+a2XX82+…+a7XX87+b
[0063] 与此对比,在图2所示的实施方式中,由于使用一元回归方程C = uP+v作为校准 曲线,因此,为了调整一元回归方程的常数U、V,仅需要2个目标变量C和说明变量P的组 即可。从而,与现有技术相比,能够通过较少次数的测定进行校准曲线的校正。
[0064] B、校准曲线的调整例: W65] 图3为示出校准曲线的第一调整例的图表。在该示例中,使用葡萄糖水溶液作为 被检体。对于作为测定条件的溫度为35°C和36°C的不同的情况下,测定葡萄糖水溶液的 分光光谱。并且,利用使用35Γ的测定数据而制作的校准用数据(独立成分及校准回归方 程),进行对于36°C的测定数据的校准。具体顺序如下。
[0066] (la)在40~410mg/d之间制作28个级别的不同浓度的葡萄糖水溶液。
[0067] 仙)通过分光计测器测定35°C的葡萄糖水溶液的分光光谱,作为采样数据。 W側 (Ic)按照校准曲线制作处理的顺序(图1),对于采样数据进行预处理、独立成分 分析处理和校准回归方程的导出,制作校准用数据(独立成分及校准回归方程C = uP+v)。 W例 (Id)将葡萄糖水溶液调节至36。同样地测定分光光谱,作为测试数据。
[0070] (le)根据水溶液的溫度的不同,用适当的系数k。与校准回归方程的常数U相乘而 调整校准回归方程(常数V的调整系数ky等于1)。
[0071] (If)使用调整后的校准回归方程对于测试数据进行校准,求得校准精度。
[0072] 通过上述步骤(Ic)得到的校准回归方程如下。
[0073] C = 13548. 73P-246387. 33
[0074] 直接使用该校准回归方程和独立成分而校准36°C的葡萄糖水溶液的测试数据的 情况下,校准精度(实测值和校准值之间的预测标准偏差SE巧为1103. 9mg/化,校准精度很 差(图3的(A))。
[0075] 另一方面,在上述步骤(le)中,使系数ku= 1.00456与校准回归方程的常数U相 乘而得到W下的新的校准回归方程。
[0076] C = 13610. 67P-246387. 33
[0077] 使用该校准回归方程进行36 °C的测试数据的校准时,校准精度改善至SEP = 24. 4mgAlL (图 3 的度))。
[007引此外,在上述步骤(le)的常数U的调整中使用的系数ku= 1.00456是如下求得 的:从36°C的测试数据中选择与1个葡萄糖浓度。相对应的内积值P 1 (混合系数),在上述 (1)中使系数ky为1代入下式而求得。
[0079] [式引
[0080] k,= (Ci-v)/(u · Pi)
[0081] = (Cl巧46387. 33)/(13610. 67Pi)··· (2)
[0082] 在该第一调整例中,能够确认尽管测定条件(测定溫度)不同,却能够进行高精度 的校准。此外,为了目标成分校准装置能够根据测定溫度等的测定条件调整校准曲线,优 选在目标成分校准装置上设置测定该测定条件(例如溫度)的传感器,W及在目标成分校 准装置内预先存储测定条件和调整系数k。、ky的关系(或者,测定条件和调整完毕的常数 化。·??)、(ky -V)的关系)。由此,当传感器测定测定条件时,目标成分校准装置能够使用由 适合该测定条件的常数化。· U)、(ky · V)规定的校准曲线,精度良好地执行校准。
[0083] 此外,在第一调整例中,表示校准曲线的截距的常数V的调整系数ky为1,有时也 可W根据测定条件而将该调整系数ky设定为1 W外的值,从而,得到更高精度的校准曲线。 换言之,通过根据测定条件调整校准曲线的一元回归方程的2个常数u、v的至少一方,能够 得到更高精度的校准曲线。
[0084] 图4为示出校准曲线的第二调整例的图表。在第二调整例中,使用人体作为被检 体,在从人体的分光光谱数据校准血糖值(葡萄糖浓度)的情况下,进行校准曲线的调整。 在第二调整例中,测定条件的不同为受测者的个体差。具体而言,对于受测者A和受测者B, 进行分别10次的人体(例如,手)的分光光谱测定和通过采血的血糖值的测定。使用上述 的测定数据,首先,使用受测者A的测定数据,进行校准用数据(独立成分及校准回归方程) 的制作。然后,调整制作出的校准回归方程,实施对于受测者B的测定数据的血糖值校准, 确认其精度。具体顺序如下。
[00化](2a)通过分光计测器测定受测者A的人体的分光光谱,并且测定采血得到的血液 的血糖值。上述的测定分别进行10次。
[0086] (2b)将受测者A的测定光谱作为采样数据。
[0087] (2c)按照校准曲线制作处理的顺序(图1),对于采样数据进行预处理、独立成分 分析处理和校准回归方程的导出,制作校准用数据独立成分及校准回归方程C = uP+v。
[0088] (2d)通过分光计测器测定受测者B的人体的分光光谱,并且测定采血得到的血液 的血糖值,作为测试数据。
[0089] (2e)使用与受测者B匹配的适当系数ku、ky分别与校准回归方程的常数u、v相乘 而调整。
[0090] (2f)使用调整后的校准回归方程对于测试数据进行校准,求得校准精度(SEP)。
[0091] 通过上述的步骤(2c)得到的校准回归方程如下。
[0092] C = -91. 20P-1358. 64
[0093] 直接使用该校准回归方程和独立成分而校准受测者B的测试数据的血糖值的情 况下,校准精度SEP = 62. 5mg/化,校准精度很差(图4的(A))。
[0094] 另一方面,在上述步骤(2e)中,使系数ku= 0. 2141、kv= 0. 2686分别与校准回归 方程的常数U、V相乘而得到W下的新的校准回归方程。 阳0巧]C = -24. 50P-290. 84
[0096] 使用该校准回归方程进行受测者B的测试数据的校准时,校准精度改善至SEP = 8.4mg/dL (图 4 的度))。
[0097] 不过,为了比较,从受测者B的测定数据本身按照图1的顺序制作校准用数据(独 立成分及校准回归方程)。使用该校准用数据校准受测者B的测定数据的情况下,校准精度 SEP = 7. 2mgAlL。如此,可知在第二调整例中,通过调整使用不同的受测者的测定数据而制 作的校准曲线,能够进行与使用受测者本人的测定数据而制作的校准曲线的情况同等的精 度的校准。并且,SEP为7~SmgML运一校准精度,为与通过高精度分析装置分析采血获 得的血液的情况的精度相接近的数值。目P,在该第二调整例中,利用W人体为对象的分光光 谱测定运一非侵入性的测定,能够进行与侵入性测定中的精度接近的极高精度的血糖值测 定。 阳09引此外,在上述步骤(2e)中用于常数U、V的调整的系数ku= 0. 2141、kv= 0. 2686 为从受测者B的测试数据之中选择与2个真值Ci、C2相对应的内积值P i、P2(混合系数)并 通过求解有关上述(1)的下面的联立方程组而求得的。
[0099][式引 阳 100]。=化。· U) Pi+(kv · V)…(3a) 阳 101] 〔2=化 u*u)P2+(kv*v)…(3b) 阳102] 在该第二调整例中,可确认能够与作为测定条件的受测者的不同无关地进行高精 度的校准。此外,为了目标成分校准装置能够根据受测者的不同调整校准曲线,优选在目标 成分校准装置上设置用于输入受测者的ID(受测者名字、受测者固有的编号等)的输入装 置,并在目标成分校准装置内预先存储受测者的ID和适合于受测者的调整系数k。、ky(或 者,调整完毕的常数化。-11)、(kv-v))。由此,当受测者(用户)将受测者的ID输入目标 成分校准装置时,目标成分校准装置能够使用由适合该受测者的常数化。·ιι)、(ky ·ν)规定 的校准曲线,从而精度良好地执行校准。 阳103] 此外,作为求得校准回归方程的常数U、V的调整系数k。、ky的方法,可使用上述方 法W外的任意的方法。 阳104] C、校准曲线制作方法 阳105] 图5为示出作为本发明的一实施方式的校准曲线制作方法的流程图。该校准曲线 制作方法由工序1~工序5的5个工序构成。各工序1~5 W此顺序执行。按照顺序说明 各工序1~5。
[0106][工序 U 阳107] 工序1为准
备工序,由操作人员执行。操作人员准备(预备)目标成分的含有量 不同的同一种类的多个样本(例如,葡萄糖水溶液或人体)。在本实施例中,使用η个(η为 2?上的整数)的样本。
[0108] [工序引
[0109] 工序2为光谱的测定工序,由操作人员使用分光计测器执行。操作人员,通过分光 计测器对于工序1准备的多个样本分别进行拍摄,测定有关各样本的分光反射率的光谱。 分光计测器为,使来自被计测体的光通过分光器,由拍摄元件的拍摄面接受从分光器输出 的光谱来测定前述光谱的周知的设备。在分光反射率的光谱和吸光度的光谱之间,下式所 表达的关系成立。
[0110] [式 4] 阳1川[吸光度]=-logic [反射率]…(4)
[0112] 测定的分光反射率的光谱,使用式(4)被变换为吸光度光谱。变换为吸光度的原 因在于,在后述的独立成分分析所分析的混合信号中需要线性结合成立,从比尔-朗伯定 律(号シ-C;レh · <- ;k①法則)出发,关吸光度的线性结合成立。从而,在工序2中,可 W不测定分光反射率光谱,而测定吸光度光谱。作为测定结果,输出表示被计测体对于波长 的特性的吸光度分布的数据。该吸光度分布的数据也称为光谱数据。
[0113] 此外,代替用分光器测定分光反射率光谱或吸光度光谱,也可W从其他的测定值 推定上述的光谱。例如,可w用多波段照相机测定样本,从得到的多波段图像推定分光反射 率或吸光度光谱。作为运种推定方法,例如,可利用特开2001-99710号公报记载的方法等。
[0114] [工序引
[0115] 工序3为目标成分的含有量的测定工序,由操作人员进行。操作人员,对于工序1 准备的多个样本分别进行化学分析,测定有关各样本的目标成分的含有量(例如,葡萄糖 量)。在工序1准备的样本中的目标成分的含有量已知的情况下,可W省略该工序3。
[0116] [工序 4]
[0117] 工序4为混合系数的推定工序,典型地,使用计算机进行。图6为示出工序4及后 述的工序5所使用的计算机100及其周边装置的说明图。计算机100与分光计测器200电 连接。
[0118] 计算机100为周知的装置,其具备:通过执行计算机程序而进行各种处理或控制 的CPU 10 ;作为数据的收容处的存储器20 (存储部);保存计算机程序或数据的硬盘驱动 器30 ;输入接口 50 ;输出接口 60。
[0119] 图7为工序4及工序5所使用的装置的功能模块图。该装置400包含:样本观测 数据取得部410、样本目标成分量取得部420、混合系数推定部430、回归方程计算部440。 混合系数推定部430包含:独立成分矩阵计算部432、推定混合矩阵计算部434 W及混合系 数选择部436。此外,样本观测数据取得部410及样本目标成分量取得部420,例如通过图 6的CPU10与输入接口 50和存储器20的协同动作而实现。混合系数推定部430、独立成分 矩阵计算部432、推定混合矩阵计算部434 W及混合系数选择部436,例如通过图6的CPU 10与存储器20的协同动作而实现。回归方程计算部440,例如通过图6的CPU 10与存储 器20的协同动作而实现。此外,上述各部能够通过图6所示的计算机W外的其他具体的装 置或硬件电路而实现。
[0120] 图8为示出独立成分矩阵计算部432的内部结构的一例的功能模块图。独立成分 矩阵计算部432,具有:第一预处理部450、第二预处理部460、独立成分分析处理部470。上 述3个处理部450、460、470,按照上述顺序对处理对象数据(在本实施方式中为吸光度光 谱)进行处理,从而求得独立成分矩阵(下文描述)。有关上述各部的处理内容将于下文描 述。
[0121] 图6所示的分光计测器200在工序2中使用。计算机100,经由输入接口 50取得 吸光度光谱作为光谱数据(与图7的样本观测数据取得部410相对应),该吸光度光谱从 在工序2中通过分光计测器200测定的分光分布得到。计算机100,通过操作人员进行的 键盘的操作等,取得工序3所测定的目标成分的含有量(与图7的样本目标成分量取得部 420相对应)。
[0122] 作为上述的光谱数据和目标成分含有量的取得结果,将包含光谱数据和目标成分 含有量的数据组(W下称为"测定数据组")DS1保存于计算机100的硬盘驱动器30。 阳123] 图9为示意性示出硬盘驱动器30所保存的测定数据组DS1的说明图。如图所示, 测定数据组DS1为包含用于识别工序1准备的多个样本的样本编号Bi、B2、·,·、Β。、有关各样 本的目标成分含有量Ci、C2、···、(;、有关各样本的光谱数据Χι、Χ2、·,·、Χ。的数据结构。在 测定数据组DS1中,目标成分含有量Ci、C2、…、片^及光谱数据Χι、Χ2、·,·、Χ。,与样本编号 Βι、Β2、…、Β湘对应,W明确是关于哪个样本的数据。
[0124] CPU 10,将存储于硬盘驱动器30的给定的程序加载于存储器20,通过执行该程 序,进行作为工序4的作业的推定混合系数的处理。运里,所述给定的程序,可W为使用互 联网等的网络从外部下载的构成。在工序4中,CPU 10作为图7的混合系数推定部430而 发挥作用。 阳1巧]图10为示出通过CPU 10执行的混合系数推定处理的流程图。当处理开始时,CPU 10首先进行独立成分分析(步骤S110)。 阳126] 独立成分分析(Independent Component Analysis, ICA)为多维信号解析法之一, 其是如下的技术:W几个不同的条件观测独立信号重叠的混合信号,并W此为基础分离独 立的原信号。使用独立成分分析的话,将通过工序2得到的光谱数据可视为W目标成分为 代表的m个独立成分(未知)相混合的数据,从而,能够从通过工序2得到的光谱数据(观 测数据)推定独立成分的光谱。
[0127] 在本实施方式中,独立成分分析通过图8所示的3个处理部450、460、470依次执 行处理而执行。第一预处理部450,能够执行使用标准正态变量变换(SNV) 452和零空间投 影法(PNSH54中的一方或者双方的预处理。SNV452为如下的处理:通过减去处理对象数据 的平均值,并除W其标准偏差,得到平均值为0、标准偏差为1的正态化数据。PNS454为用于 除去处理对象数据所包含的基线变动的处理。在光谱的测定中,由于各种各样的因素,在各 个测定数据中会发生例如数据的平均值上下浮动等的被称为基线变动的数据间的偏差。因 此,优选在进行独立成分分析处理之前,除去该变动因素。PNS能够作为除去任意的基线变 动的预处理而使用。此外,有关PNS,例如在Zeng-Ping Qien, Julian Morris, and Elaine Martin,"Extracting Chemical Information from Spectral Data with Multiplicative Light Sc曰ttering Effects by Optic曰 1 P曰th-Length Estim曰tion 曰nd Correction"中进 行了说明。 阳12引此外,在对于通过图5的工序2得到的光谱数据进行SNV452的情况下,没有必要 进行通过PNS454的处理。另一方面,在进行通过PNS454的处理的情况下,优选其后进行某 种正态化处理(例如SNV452)。 阳129] 此外,作为第一预处理,也可W进行SNV、PNSW外的处理。在第一预处理中优选进 行某种正态化处理,但也可W省略正态化处理。W下,也将第一预处理部450称为"正态化 处理部"。有关上述的2个处理452、454的内容,将于下文进一步描述。此外,在提供给独 立成分矩阵计算部432的处理对象数据为已经正态化的数据的情况下,也可W省略第一预 处理。
[0130] 第二预处理部460能够执行使用主成分分析(PCA) 462和因子分析(FA) 464中的 任一方的预处理。此外,作为第二预处理也可W使用PCA和FAW外的处理。W下,将第二 预处理部460也称为"白色化处理部"。在一般的ICA的方法中,进行处理对象数据的维度 压缩和去相关而作为第二预处理。通过该第二预处理,由于应该通过ICA求得的变换矩阵 被限定为直角变换矩阵,因此,能够削减ICA的计算量。将运种第二预处理称为"白色化", 大多情况下使用PCA。但是,PCA在处理对象数据中包含随机噪声的情况下,有时候会受到 其影响而在结果上产生误差。因此,为了降低随机噪声的影响,优选使用对于噪声具有健壮 性的FA代替PCA进行白色化。图8的第二预处理部460能够选择PCA和FA的任一方来执 行白色化。有关上述的2个处理462、464的内容,将于下文进一步描述。此外,也可W省略 白色化处理。 阳131] 独立成分分析处理部(ICA处理部)470,通过对于进行了第一预处理和第二预处 理的光谱数据执行ICA,推定独立成分的光谱。ICA处理部470可执行使用了第一处理472 和第二处理474中的任一方的分析,其中,第一处理472使用峰度作为独立性指标,第二处 理474使用β散度作为独立性指标。通常,作为用于独立成分分离的指标,ICA使用表示分 离后的数据之间独立性的高阶统计量作为独立性指标。峰度为典型的独立性指标。但是, 在尖峰噪声等异常值进入处理对象数据的情况下,包含该异常值的统计量也作为独立性指 标而计算。因此,存在在对于处理对象数据的本来的统计量和算出的统计量之间存在误差, 引起分离精度降低的情况。因此,为了减小来自处理对象数据中的异常值的影响,优选使用 难W受到该影响的独立性指标。作为具有运种特性的独立性指标,可使用β散度。有关峰 度和β散度的内容,将于下文进一步描述。此外,作为ICA的独立性指标也可W利用峰度 和β散度W外的指标。
[0132] 有关独立成分分析的典型的处理内容,接下来将详细地描述。通过下式巧)的向 量赋予m个未知成分(源)的光谱S( W下,也将该光谱简称为"未知成分"),通过下式化) 的向量赋予通过工序2得到的η个光谱数据X。此外,式(5)所包含的各要素(Si、S2、一、Sm) 分别为向量(光谱)。目P,例如,要素 S1如式(7)所示。式(6)所包含的要素狂i、X2、…、 X。)也为向量,例如,要素 X,如式(8)所示。要素 X ,的下标j为测定光谱的波长段的数。此 夕F,未知成分的光谱S的要素数m为1 W上的整数,根据样本的种类预先经验性或者实验性 地决定。
[0133] [式引 阳 134] S =权,S2,…,Sm]T···巧)
[0135][式 6] 阳 136] X =技1,X2,''''ΧηΓ…化)
[0137][式 7] 阳13引 Si=怯…Si2,…,SiJ…(7)
[0139][式引 阳140] Xi=找…Xi2,…,…做 阳141] 各未知成分统计上是独立的。在上述的未知成分S和上述
的光谱数据X之间,下 式的关系成立。 阳1创[式9] 阳 143] X = A · S···巧) 阳144] 式(9)中的A为混合矩阵,也可下式(10)表示。此外,运里"A"的文字,如下 式(10)所示需要W粗体表示,但由于说明书使用文字上的限制,运里W普通文字表示。W 下,对于表示矩阵的其他粗体字,也同样地W普通文字表示。
[0145][式 10] 阳 146]
[0147] 混合矩阵A所包含的混合系数曰1,表示未知成分S , (j = 1~m)对作为观测数据 的光谱数据Xi α = 1~η)的贡献程度。
[0148] 在混合矩阵A已知的情况下,未知成分S的最小二乘解可W使用A的模拟逆矩阵 A+ W A+ · X简单地求得,但是,在本实施方式的情况下,由于混合矩阵A也未知,因此,必须 仅从观测数据X推定未知成分S和混合矩阵A。目P,如下式(11)所示,仅从观测数据X,使 用mXn的分离矩阵W,算出表示独立成分的光谱的矩阵下,称为"独立成分矩阵")Υ。 作为求得下式(11)中的分离矩阵W的算法,可W采用In化max、FastICA (快速独立成分分 析(Fast Independent Component Analysis))、JADE(特征矩阵的联合近似对角化(Joint Approximate Diagonalization of Eigenmatrices))等各种算法。 阳1例[式11] 阳 150] Y = W.X...(11) 阳151] 独立成分矩阵Y相当于未知成分S的推定值。从而,能够得到下式(12),将式(12) 变形而能够得到下式(13)。 阳 152][式 12] 阳15引
(1兹
[0154][式 13] 阳15引
。一C1沒)
[0156] 其中,1为A的推定混合矩阵,r为Y的模拟逆矩阵。 阳157] 由式(13)得到的推定混合矩阵义,可W通过下式表示。
[0158][式 14] 阳 159]
[0160] 在图10的步骤S110中,CPU 10进行直到求得上述的分离矩阵W为止的处理。详 细而言,将由工序2得到的、预先保存于硬盘驱动器30的每个样本的光谱数据X作为输入, 基于该输入,使用前述的In化max、化stICA、JADE等的任一算法,求得分离矩阵W。此外,如 前述的图8所示,作为独立成分分析的预处理,优选进行第一预处理部450的正态化处理和 第二预处理部460的白色化处理。 阳161] 执行步骤S110后,CPU 10基于上述分离矩阵W和由工序2得到的、预先保存于硬 盘驱动器30的每个样本的光谱数据X,进行算出独立成分矩阵Y的处理(步骤S120)。该 算出处理进行根据前述式(11)的运算。在步骤S110、S120的处理中,CPU 10作为图7的 独立成分矩阵计算部432而发挥作用。
[0162] 接着,CPU 10基于前述的预先保存于硬盘驱动器30的每个样本的光谱数据X和 通过步骤S120算出的独立成分矩阵Y,进行算出推定混合矩阵1的处理(步骤S130)。该 算出处理进行根据前述式(13)的运算。 阳163] 图11为用于说明推定混合矩阵1的说明图。该表TB中,纵方向为各样本编号Bi、 B2、一,Β。,横方向为独立成分矩阵Υ的各要素(W下称为"独立成分要素")Υι、Υ2、一,Υ。。 由样本编号Bi(i = 1~η)和独立成分要素 Y,(j = 1~m)确定的表ΤΒ中的要素,与推定 混合矩阵1的要素% (参照式(14))相同。从该表ΤΒ也可W得知,推定混合矩阵A的要 素爲ij,表示各个样本中的独立成分要素 Υι、Υ2、一,Υ。的比率。有关图11例示的目的分离顺 位k将于后述。在步骤S130的处理中,CPU 10作为图7的推定混合矩阵计算部434而发 挥作用。
[0164] 通过至步骤S130为止的处理,得到推定混合矩阵A。即,得到推定混合矩阵1 的要素(推定混合系数)%。此外,推定混合系数aij,在图1的示例中,相当于通过图1的 (D)~(巧算出的内积值P。之后,进入步骤S140。 阳1化]在步骤S140中,CPU 10,求得由工序3测定的目标成分含有量Ci、C2、···、(;和由 步骤S130算出的推定混合矩阵1所包含的各列的成分(W下称为混合系数向量隸)之间 的相关(类似性的程度)。详细而言,求得目标成分含有量C(Ci、C2、···、(;)和第一列的混 合系数向量隸1 (如1、如1、…、^1)的相关性,然后,求得目标成分含有量C(Ci、C2、…、 C。)和第二列的混合系数向量绞2 (各12、如2、…、或12)的相关性,运样,顺次对于各列求 得对于目标成分含有量C的相关性。 阳166] 作为表示上述相关性的大小的指标,能够使用根据下式的相关系数R。该相关系数 R也称为皮尔逊积矩相关系数。 阳 167][式 15]
[0168]
…C1费含 阳169] 援分别为目标成分量,向量4的要素的平均值
[0170] 作为图10的步骤S140的结果,得到每个独立成分(独立成分光谱)Υ,的相关系数 R.i(j = l、2、……、m)。之后,CPU 10从由步骤S140得到的相关系数Rj之中指定相关最高 的即值接近1的相关系数。然后,从推定混合矩阵A中选择能够得到最高相关系数R的列 向量缓(步骤S150)。 阳171] W图11的表TB来说,步骤S150中的选择是从多个列中选择一列。该被选择的 列的要素为与目标成分相对应的独立成分的混合系数。作为前述选择的结果,得到混合系 数向量绞k (忿&、浸&、,.·、;^Λ)。运里,k取1~m任一整数。此外,将该k的值作为表 示第几个独立成分相应于目标成分的目标成分顺位而临时地保存于存储器20。该混合系 数向量绞k所包含的要素 &ik、i2k、…、女&,相当于"与目标成分相对应的混合系数"。此 夕F,在图11的示例中,目标成分顺位k = 2,表示与独立成分Υ2相对应的混合系数向量 幾2=U。、"·、iii。)。此外,在本说明书中,"顺位"运一用语,作为"表示矩阵内的位 置的值"的意思而使用。在步骤S140、S150的处理中,CPU 10作为图7的混合系数选择部 436而发挥作用。在执行步骤S150后,CPU结束该混合系数的算出处理。作为其结果,工序 4结束,之后,进入工序5。 阳172][工序引 阳173] 工序5为回归方程的算出工序,与执行工序4时同样,使用计算机100进行。在工 序5中,计算机100执行算出校准曲线的回归方程的处理。此外,工序5可W将至工序4为 止的数据转移至其他计算机或装置而执行。 阳174] 图12为示出通过计算机100的CPU 10执行的回归方程的算出处理的流程图。当 开始处理时,CPU 10,首先,基于由工序3测定的目标成分含有量C(Ci、C2、…、C。)和由步 骤S150选择的混合系数向量堯k …、^:t),算出回归方程(步骤S210)。该回 归方程可W通过下式(16)表达。在步骤S210中,求得式(16)中的常数u、v。 阳1巧][式16] 阳 176] C = U · P+V··· (16)
[0177] 运里,C为目标成分含有量、P为测定数据和独立成分的内积值、U、V为常数。
[0178] 在执行步骤S210后,CPU 10,将通过步骤S210求得的回归方程的常数u、v和与通 过步骤S150决定的目标成分顺位k (图11)相对应的独立成分Yk,作为校准用数据组DS2 保存于硬盘驱动器30 (步骤S220)。之后,CPU 10跳至"返回",暂时结束该回归方程的算出 处理。其结果是,能够求得校准曲线的回归方程,也结束图5所示的校准曲线制作方法。在 步骤S210、S220的处理中,CPU 10作为图7的回归方程计算部440而发挥作用。 阳1巧]D、目标成分的校准方法: 阳180] 下面,对于目标成分的校准方法进行说明。被检体,由与制作校准曲线时所使用的 样本相同的成分构成。具体而言,目标成分的校准方法使用计算机进行。此外,运里的计算 机可W为制作校准曲线时使用的计算机100,也可W为其他的计算机。 阳181] 图13为进行目标成分的校准时使用的装置的功能模块图。该装置500具有:被 检体观测数据取得部510、校准用数据取得部520、混合系数计算部530、目标成分量计算部 540、非易失性存储装置550。混合系数计算部530包含预处理部532。该预处理部532具 有图8的第一预处理部450和第二预处理部460运二者的功能。混合系数计算部530具有 进行图2的(A)~(C)说明的内积运算的功能,因此,也可称为"内积运算部"。被检体观测 数据取得部510例如通过图6的CPU 10与输入接口 50和存储器20协同动作而实现。校 准用数据取得部520例如通过图6的CPU 10与存储器20和硬盘驱动器30协同动作而实 现。混合系数计算部530 W及目标成分量计算部540例如通过图6的CPU 10与存储器20 协同动作而实现。非易失性存储装置550中存储有校准用数据组DS2(独立成分及回归方 程的常数U、V)。此外,图13的装置也可W作为与图6的计算机不同的其他装置或者电子 设备而安装。运种情况下,图13的装置或者具备该装置的电子设备优选具有分光计测器。 [0182] 图14为示出由计算机100的CPU 10执行的目标成分校准处理的流程图。该目标 成分校准处理如下地实现:CPU 10将存储于硬盘驱动器30的给定的程序加载于存储器20 并执行该程序。首先,CPU 10进行由分光计测器拍摄被检体的处理(步骤S310)。步骤S310 的拍摄可W与工序2同样地进行,其结果是,得到被检体的吸光度光谱Xp。校准处理所使用 的分光计测器,优选与在为了误差而用于校准曲线的制作的分光计测器为同一机种。为了 进一步抑制误差,更优选为同一机体。此外,与图5的工序2同样地,也可W代替通过分光 器测定分光反射率、吸光度光谱,而从其他的测定值推定上述的光谱。一次拍摄一被检体时 得到的被检体的吸光度的光谱Xp,如下式所示W向量表达。 阳 183][式 17]
[0184] Xp=找 pi,Xp2, ...'Xpi}…(17) 阳化5] 在步骤S310的处理中,CPU 10作为图13的被检体观测数据取得部510而发挥作 用。接着,CPU 10从硬盘驱动器30 (图13的非易失性存储装置550)取得校准用数据组 DS2,存储于存储器20(步骤S320)。在步骤S320的处理中,CPU 10作为图13的校准用数 据取得部520而发挥作用。 阳186] 在执行步骤S320后,对于通过步骤S310得到的被检体的观测数据(吸光度光谱 Xp)执行预处理(步骤S330)。作为该预处理,优选执行与校准曲线制作时在图5的工序 4 (更具体而言为图10的步骤S110)中使用的预处理(即,第一预处理部450的正态化处理 及第二预处理部460的白色化处理)相同的处理。 阳187] 之后,CPU 10
求得校准用数据组DS2所包含的独立成分和由步骤S330得到的预处 理完毕的向量(预处理完毕的观测数据)的内积值P (步骤S340)。步骤S340的处理相当 于前述的图2的度)、(C)的处理。此外,该内积值P在校准曲线制作时,相当于通过图10 的步骤S130算出的混合系数。从而,也将该内积值P称为"混合系数"。
[0188] 在步骤S330、S340的处理中,CPU 10作为图13的混合系数计算部530而发挥作 用。
[0189] 接着,CPU 10从硬盘驱动器30 (图13的非易失性存储装置550)读出校准用数据 组DS2所包含的回归方程的常数U、V,通过将该常数U、V和通过步骤S340得到的内积值P 代入前述的式(16)的右边,求得目标成分的含有量C(步骤S350)。此时,也可W根据需要 调整常数U、V。含有量C例如W被检体的每单位容积或者单位质量(例如,每1化或者每 lOOg)的目标成分的质量而求得。在步骤S350的处理中,CPU 10作为图13的目标成分量 计算部540而发挥作用。其后,跳至"返回",结束该目标成分校准处理。
[0190] 此外,在本实施方式中,将通过步骤S350求得含有量C作为被检体的目标成分含 有量,取而代之,也可W通过步骤S330正态化中使用的正态化系数,对于通过步骤S350求 得的含有量C进行补正,将该补正后的值作为应该求得的含有量。具体而言,可W通过标准 偏差乘化含有量C求得含有量的绝对值(克数)。通过该构成,能够根据目标成分的种类使 含有量C为更高精度的值。 阳191] 通过W上的校准方法,能够从作为被检体的实测值的一光谱高精度地求得目标成 分的含有量。 阳192] E、各种算法及其影响: 阳193] W下,对于在图8所示的第一预处理部450、第二预处理部460、独立成分分析处理 部470中使用的各种算法进行顺次说明。
[0194] E-1、第一预处理(利用SNV/PNS的正态化处理): 阳1巧]作为第一预处理部450进行的第一预处理,能够利用SNV (标准正态变量变换)和 PNS(零空间投影法)。 阳196] SNV通过下式提供。 阳197][式1引 阳19引
[0199] 运里,Z为处理后的数据,X为处理对象数据(在本实施例中为吸光度光谱),X。、。 为处理对象数据X的平均值,σ为处理对象数据X的标准偏差。进行标准正态变量变换的 结果是得到平均值为0标准偏差为1的正态化数据Ζ。 阳200] 当进行PNS时,能够降低处理对象数据所包含的基线变动。在处理对象数据(在本 实施方式中为吸光度光谱)的测定中,由于各种各样的因素,在各个测定数据中会发生例 如数据的平均值上下浮动等的被称为基线变动的数据间的偏差。因此,优选在进行ICA(独 立成分分析)之前,除去该变动因素。PNS能够作为降低处理对象数据的基线变动的预处理 而使用。特别是,对于包含红外区域的吸收光光谱或者反射光光谱的测定数据,由于运种基 线变动多,因此,使用PNS的优点多。W下,对于通过PNS除去通过测定得到的数据(也简 单称为"测定数据X")所包含的基线变动的原理进行说明。而且,作为典型例,对于测定数 据为包含红外区域的吸收光光谱或者反射光光谱的情况进行说明。不过,对于其他种类的 测定数据x(例如,声音数据等)也可同样地使用PNS。 阳201] -般地,在理想情况下,测定数据x(处理对象数据X),使用m个(m为2 W上的整 数)独立成分Si(i = 1~m)和各自的混合比Ci,通过下式表示。 阳20引[式19] 阳203]
阳204] 运里,A为通过混合比Ci形成的矩阵(混合矩阵)。 阳205] 在ICA(独立成分分析)中,W该模型为前提执行处理。但是,在实际的测定数据 中存在各种变动因素(试料的状态、测定环境的变化等)。因此,作为考虑上述因素的模型, 可W考虑通过下式表现测定数据X的模型。
[0206][式 20] 阳207]
阳20引运里,b为表示光谱的振幅方向的变动量的参数,a为表示常数基线变动E (也称 为"平均值变动")的量的参数,bi…bg为表示依存于波长的g个(g为1 W上的整数)的 变动?·ι(λ)~fgU)的量的参数,ε为上述W外的变动成分。此外,常数基线变动E通 过Ε= …1}τ(右上角的Τ表示转置)而提供,其数据长度与测定数据X的数据长 度Ν(波长段的区分数)相等的常数向量。作为表示波长的变量λ,使用1至Ν的Ν个整 数。目P,该变量λ相当于测定数据X的数据长度N(N为2 w上的整数)的顺序数。此时, 依存于波长的变动 fi(^)~fg(A),通过 fi(A) = 似,…fi(N)}T, ???、fg(A)= {fgα),fg(2),…fg(N)}T而提供。由于上述的变动成为ICA或校准中的误差因素,因此,优 选预先除去。
[0209] 作为函数f( λ),优选使用λ的值在1至N的范围内函数f( λ)的值随着λ的增 加而单调增加的1变量函数。在零空间投影法中,通过使用指数α为整数的λ的指数函 数(乗関数)λ α W外的其他函数,能够进一步降低测定数据所包含的变动。
[0210] 作为优选的决定函数f( λ )的函数形式和其个数g的方法,可W采用实验试错法, 或者,使用现有的参数推定算法(例如,EM(期望值最大化法)算法)。 悦川在PNS中,考虑由上述的各个基线变动成分E、fi(A)~fg(A)构成的空间,通过 将测定数据X投影至不包含上述的变动成分的空间(零空间),而能够得到降低了基线变 动成分Ε、?·ι(λ)~?;(λ)的数据。作为具体的运算,通过下式计算进行PNS处理后的数据 Ζο 阳21引[式21] 阳21引
[0214] Ρ = (1,Γι(λ),f2(A)...fB(入)} 阳21引运里,P+为P的模拟逆矩阵。K 1通过将式(20)的构成成分S 1投影至不包含变动 成分的零空间获得。此外,通过将式(20)的变动成分ε投影至零空间获得。
[0216] 此外,在PNS的处理后,如果进行正态化(例如SNV)的话,也能够除去式(20)中 的光谱的振幅方向的变动量b的影响。 阳217] 当对于通过上述的PNS进行了预处理的数据进行ICA时,得到的独立成分成为 式(21)的成分ki的推定值,其与真的构成成分Si不同。但是,混合比Ci,由于并未从原式 (20)中的值发生变化,因此,并不影响使用混合比Ci的校准处理(图2、图14)。如此,当作 为ICA的预处理而执行PNS时,由于无法通过ICA得到真的构成成分Si,因此,通常不会产 生在ICA的预处理中使用PNS的构思。另一方面,在本实施方式中,由于即使执行PNS作为 ICA的预处理,也不影响校准处理,因此,将PNS作为预处理执行的话,能够更加精度良好地 进行校准。
[0218] 此外,有关 PNS 的详细情况,例如在 Zeng-Ping Qien, Julian Morris, and Elaine Martin,"Extracting Chemical Information from Spectral Data with Multiplicative Light Sc曰ttering Effects by Optical P曰th-Length Estimation 曰nd Correction",2006 中进行了说明。
[0219] E-2、第二预处理(利用PCA/FA的白色化处理): 阳220] 作为第二预处理部460进行的第二预处理,可利用PCA (主成分分析)和FA (因子 分析)。 阳221] 在一般的ICA的方法中,进行处理对象数据的维度压缩和去相关而作为预处理。 由于通过该预处理,应该通过ICA求得的变换矩阵被限定为正交变换矩阵,因此,能够削 减ICA的计算量。将运种预处理称为"白色化",大多情况下使用PCA。有关使用PCA的 白色化,例女日在 Aapo Hyvarinen, Juha Karhumen, Erkki Oja, "Independent Comonent Analysis", 2001,John Wil巧&Sons, Inc.("独立成分分析",2005年2月,东京电气大学出 版部发行)的第6章中有详细叙述。 阳222] 但是,PCA在处理对象数据中包含随机噪声的情况下,有时候会受到该随机噪声的 影响而在处理结果上产生误差。因此,为了降低随机噪声的影响,优选使用对于噪声具有健 壮性的FA(因子分析)代替PCA进行白色化。W下,说明通过FA进行白色化的原理。 阳223] 如前所述,一般在ICA中,假定将处理对象数据X作为构成成分Si的线性和而表 示的线性混合模型(上式(19)),求得混合比Ci和构成成分Si。但是,在实际的数据中,大 多附加有构成成分SiW外的随机噪声。因此,作为考虑了随机噪声的模型,考虑通过下式 表现测定数据X的模型。
[0224][式创 阳22引 X = A · S+P…倘) 阳226] 运里,P为随机噪声。 阳227] 于是,进行考虑了该噪声混合模型的白色化,之后,可W通过进行ICA来推定混合 矩阵A和独立成分Si。
[0228] 本实施方式的FA,假定独立成分Si和随机噪声P分别为正态分布(0, I m)、N(0, X)。此外,如通常所知那样,正态分布N(Xi,X2)的第一参数Χι示出期待值,第二参数X2示 出标准偏差。此时,处理对象数据X成为依照正态分布的变量的线性和,因此,处理对象数 据X也为正态分布。运里,当将处理对象数据X的协方差矩阵设为v[x]时,处理对象数据 X所遵循的正态分布可表现为N (0, V [X])。此时,可通过下述的顺序计算与处理对象数据X 的协方差矩阵V[x]有关的似然函数。
[0229] 首先,假定独立成分Si彼此正交,W下式计算处理对象数据X的协方差矩阵νω。 阳230][式 23] 阳231] V[x] = Ε[χχΤ] = ααΤ+Σ …(23) 阳232] 运里,S为噪声Ρ的协方差矩阵。 阳233] 运样,协方差矩阵V[x]可W通过混合矩阵A和噪声的协方差矩阵Σ表示。此时, 对数似然函数L(A,Σ)通过下式提供。
[0234][式 24] 阳235]
阳236] 运里,η为数据X的数据个数,m为独立成分的个数,算子tr表示矩阵的迹(对角 成分之和),算子det表示行列式。C表示通过样本计算从数据X求得的样本协方差矩阵, 通过下式计算。 阳237][式2引 阳23引
[0239] 通过使用上式(24)的对数似然函数L(A, Σ)的最大似然估计,能够求得混合矩阵 A和噪声的协方差矩阵Σ。作为该混合矩阵Α,能够得到几乎没有上式(22)的随机噪声Ρ 的影响的矩阵。运是FA的基本原理。此外,作为FA的算法,存在利用最大似然估计W外的 算法的各种算法。在本实施方式中,也能够利用运样的各种FA。
[0240] 不过,通过FA得到的推定值不过为AAT的值,在决定适合于该
值的混合矩阵A的 情况下,在降低随机噪声的影响的同时能够对于数据进行去相关,但是,由于残留有旋转的 自由度而不能唯一地决定多个构成成分Si。另一方面,ICA为用于减少多个构成成分Si的 旋转的自由度的处理,W使得多个构成成分Si相互正交。因此,在本实施方式中,将通过FA 求得的混合矩阵A的值作为白色化矩阵(完成白色化的矩阵)使用,通过ICA指定对于残留 的旋转的任意性。从而,在进行对于随机噪声具有健壮性的白色化处理之后,通过执行ICA, 能够决定相互正交的独立的构成成分Si。并且,作为运种处理的结果,能够降低随机噪声的 影响,使有关构成成分Si的校准精度提高。 阳241] E-3、ICA (作为独立性指标的峰度及β散度): 阳242] 在ICA(独立成分分析)中,一般地,作为用于分离独立成分的指标,使用表示 分离的数据之间的独立性的高阶统计量作为独立性指标。峰度为典型的独立性指标。 对于使用峰度作为独立性指标的ICA,例如,在Aapo Hyvarinen,化ha Karhumen, Erkki Oja, "Incbpendent Comonent Analysis", 2001, John Wil巧&Sons, Inc.("独立成分分析", 2005年12月,东京电气大学出版部发行)的第8章中有详细叙述。 阳243] 但是,在尖峰噪声等异常值进入处理对象数据的情况下,包含该异常值的统计量 也作为独立性指标而计算。因此,存在在对于处理对象数据的本来的统计量和算出的统计 量之间存在误差,引起分离精度降低的情况。因此,优选使用难W受到来自处理对象数据中 的异常值影响的独立性指标。作为具有运种特性的独立性指标,可使用β散度。W下,说 明作为ICA中的独立性指标的β散度的原理。
[0244] 如前所述,一般在ICA中,假定将处理对象数据X作为构成成分Si的线性和而表 示的线性混合模型(上式(19)),求得混合比Ci和构成成分S 1。通过ICA求得的构成成分 S的推定值y使用分离矩阵W而表示为y = W · y。此时,分离矩阵W优选为混合矩阵A的 逆矩阵。 阳245] 运里,分离矩阵W的推定值療的对数似然函数L (W)可通过下式表示。 悦46][式 26] 阳247]
[0248] 运里,积分符号Σ的要素为各数据点x(t)中的对数似然。可W将该对数似然函 数L (W)作为ICA中的独立性指标使用。β散度的方法为如下的方法:通过使适当的函 数作用于该对数似然函数L (常)来变换对数似然函数L (會>,使得W抑制数据中的尖 峰噪声等异常值的影响。
[0249] 利用β散度作为独立性指标的情况下,首先,使用预先选择的函数Φρ,通过下式 变换对数似然函数L (會)。
[0250][式 27] 阳巧1]
悦巧然后,将该函数JUfr (W)作为新的对数似然来考虑。 阳巧3] 作为用于减小例如尖峰噪声等的异常值的影响的函数Φρ,可W考虑随着对数似 然的值(函数φβ的括号内的值)变小函数Φ β的值指数函数(指数関数)性衰减的函 数。作为运种函数φρ,例如可W使用W下函数。 悦54][式2引 阳巧5]
阳巧6] 在该函数中,β的值越大,则对于各数据点ζ(在上式(27)中为对数似然)的函数 值越小。该β的值可W经验性地决定,例如,可W设定为约0.1。此外,作为该函数Φρ,不 限于式(28)的函数,也可W使用β的值越大,对于各数据点Ζ的函数值越小的其他函数。 阳巧7] 使用运种β散度作为独立性指标时,能够适当地抑制例如尖峰噪声等异常值的 影响。在考虑上式(27)的似然函数巳.5> (会:)的情况下,与该似然的最大化相对应而最小 化的概率分布之间的伪距为β散度。当执行使用运种β散度作为独立性指标的ICA时, 能够降低例如尖峰噪声等异常值的影响,提高有关构成成分Si的校准精度。 阳巧8] 此外,有关使用β散度的ICA,例如,在Minami Mihoko, aiinto Eguchi, "Robust Blind Source S巧aration by0-Divergence",200 2 中进行了说明。 阳巧9] F、变形例:
[0260] 该发明不限于前述的实施例及其变形例,在不脱离其主旨的范围内能够W各种方 式实施,例如也能够进行下述的变形。 阳%1] 变形例1 : 阳%2] 在前述的实施方式中,预先经验性或者实验性地决定未知成分的光谱S的要素数 m,未知成分的光谱S的要素数m也可W通过作为MDL(最小描述长度(Minimum Description Length))、AIC(赤池信息准则(Aka;Lke Information Criteria))等已知的信息量准则等 而决定。使用MDL等的情况下,未知成分的光谱S的要素数m可W从样本的观测数据通过 运算自动地决定。此外,有关MDL例如在"Independent component analysis for noisy data? MEG data analysis, 2000"中进行了说明。 阳%3] 变形例2 :
[0264] 在前述实施方式中,作为校准处理的对象的被检体,通过与制作校准曲线时使用 的样本相同的成分构成,但是,被检体中也可W含有与制作校准曲线时使用的样本相同的 成分W外的未知成分。由于将独立成分之间的内积假定为0,因此将与未知成分相对应的独 立成分的内积也考虑为0,因此,在通过内积求得混合系数的情况下,可W忽略未知成分的 影响。 阳2化]变形例3 : 阳266] 在前述实施方式中使用的计算机可W作为专用的装置而构成。例如,可W仅通过 硬件电路实现图7或图13所示的装置。或者,通过硬件电路实现图7或图13所示的装置 的功能的一部分,通过软件实现另一部分。 阳267] 变形例4 :
[0268] 在前述实施方式中,通过输入由分光计测器测定的光谱而进行有关样本或被检体 的分光反射率的光谱的输入,但本发明不限于此。例如,可W构成为从波长段不同的多个波 段图像推定分光光谱,并输入该分光光谱。所述波段图像,例如可W通过具备能够变更透过 波长段的滤光器的多波段照相机对样本或被检体进行拍摄而得到。
[0269] 此外,前述的各实施例及各变形例中的构成要素中的、独立权利要求记载的要素 W外的要素为附加要素,可适当地省略。
[0270] 符号说明 阳27U 10 CPU 20 存储器 阳272] 30 硬盘驱动器 50 输入接口 阳273] 60 输出接口 100个人计算机
[0274] 200分光计测器 400校准曲线制作装置 阳275] 410样本观测数据取得部 420样本目标成分量取得部 阳276] 430混合系数推定部 432独立成分矩阵计算部 阳277] 434推定混合矩阵计算部 436混合系数选择部
[0278] 440回归方程计算部 450第一预处理部(正态化处理部) 阳279] 452标准正态变量变换(SNV) 阳28〇] 454零空间投影法(PNS) 460第二预处理部(白色化处理部) 阳281] 462主成分分析(PCN) 464因子分析(FA) 阳282] 470独立成分分析处理部 472第一处理 阳283] 474第二处理 500校准装置 阳284] 510被检体观测数据取得部 520校准用数据取得部 阳28引 530混合系数计算部(内积运算部) 阳286] 532预处理部 540目标成分量计算部 阳287] 550非易失性存储装置。
【主权项】
1. 一种目标成分校准装置,求出关于被检体的目标成分的含有量,其特征在于,包括: 被检体观测数据取得部,取得关于所述被检体的观测数据; 校准用数据取得部,取得校准用数据,所述校准用数据包括与所述目标成分相对应的 独立成分、以及校准用的一元回归方程; 混合系数计算部,基于关于所述被检体的观测数据和所述校准用数据,求得关于所述 被检体的所述目标成分的混合系数; 目标成分量计算部,基于表示与所述目标成分相对应的混合系数和含有量的关系的所 述一元回归方程、以及通过所述混合系数计算部求得的混合系数,计算所述目标成分的含 有量, 其中,所述目标成分量计算部,根据取得所述观测数据时的测定条件,调整所述一元回 归方程的两个常数中的至少一个。2. 根据权利要求1所述的目标成分校准装置,其特征在于, 所述测定条件为测定环境, 所述目标成分量计算部根据所述测定环境调整所述一元回归方程的所述两个常数中 的至少一个。3. 根据权利要求1所述的目标成分校准装置,其特征在于, 所述测定条件为作为所述被检体的受测者的不同, 所述目标成分量计算部根据受测者的不同调整所述一元回归方程的所述两个常数中 的至少一个。4. 一种电子设备,其特征在于, 具备根据权利要求1至3中任一项所述的目标成分校准装置。5. -种目标成分校准方法,所述目标成分校准方法求得关于被检体的目标成分的含有 量,其特征在于,包含以下工序: (a) 取得关于所述被检体的观测数据; (b) 取得校准用数据,所述校准用数据包括与所述目标成分相对应的独立成分、以及校 准用的一元回归方程; (c) 基于关于所述被检体的观测数据和所述校准用数据,求得关于所述被检体的所述 目标成分的混合系数; (d) 基于表示与所述目标成分相对应的混合系数和含有量的关系的所述一元回归方 程、以及通过工序(c)求得的混合系数,计算所述目标成分的含有量, 其中,工序(d)根据取得所述观测数据时的测定条件调整所述一元回归方程的两个常 数中的至少一个。6. 根据权利要求5所述的目标成分校准方法,其特征在于, 所述测定条件为测定环境, 所述工序(d)根据所述测定环境调整所述一元回归方程的所述两个常数中的至少一 个。7. 根据权利要求5所述的目标成分校准方法,其特征在于, 所述测定条件为作为所述被检体的受测者的不同, 所述工序(d)根据受测者的不同调整所述一元回归方程的所述两个常数中的至少一
【专利摘要】本发明涉及目标成分校准装置、电子设备和目标成分校准方法。本发明提供一种与以往相比更容易且高精度地进行校准的技术。目标成分校准装置,包含:混合系数计算部,基于关于被检体的观测数据和校准用数据,求得关于被检体的目标成分的混合系数;目标成分量计算部,基于表示与目标成分相对应的混合系数和含有量的关系的一元回归方程和通过混合系数计算部求得的混合系数,计算目标成分的含有量。目标成分量计算部,根据观测数据的取得时的测定条件,调整一元回归方程的2个常数中的至少一个。
【IPC分类】G06F19/00
【公开号】CN105488326
【申请号】CN201510580672
【发明人】仓沢光, 荒井佳文
【申请人】精工爱普生株式会社
【公开日】2016年4月13日
【申请日】2015年9月11日
【公告号】EP3032430A1, US20160097676