电力控制设备、信息处理设备和电力控制方法

xiaoxiao2020-7-23  11

电力控制设备、信息处理设备和电力控制方法
【专利摘要】本发明提供了一种电力控制设备、信息处理设备和电力控制方法。液体冷却系统对中央处理器(CPU)进行冷却。第二温度传感器检测CPU的状态。第一温度传感器检测液体冷却系统的状态。液体冷却系统运行控制单元确定液体冷却系统是否在运行。当液体冷却系统运行控制单元确定液体冷却系统在运行时,CPU电力控制单元基于由第二温度传感器检测到的状态来控制对CPU的电力供应。当液体冷却系统运行控制单元确定液体冷却系统停止运行时,液体冷却系统保护控制器基于由第一温度传感器检测到的状态来控制对CPU的电力供应。
【专利说明】电力控制设备、信息处理设备和电力控制方法
【技术领域】
[0001]本文中所讨论的实施方式涉及电力控制设备、信息处理设备和电力控制方法。
【背景技术】
[0002]近年来,在信息处理设备(如服务器)的速度和功能性方面的改进已得到促进。由于提高的速度和功能性,所以安装在这样的信息处理设备中的电子元件(如中央处理单元(CPU))的电力消耗也在增加。由于增加的电力消耗,所以在这样的电子元件中的热生成量趋于增加。在信息处理设备中安装多个CPU或其它元件也逐渐成为普遍做法。在这样的情况下,整个信息处理设备中的热生成量将进一步增加。
[0003]具有增加的热生成量的信息处理设备需要对发热的电子元件进行冷却,以保持该电子元件的功能并且防止故障。为了冷却电子元件,近年来趋于采用与空气冷却相比提供更高的潜在冷却能力的液体冷却。
[0004]然而,液体冷却涉及如下问题:当液体冷却系统的内部冷却剂沸腾时,液体冷却系统可能被损坏。为了解决该问题,可假定通过采取措施(如增强内部管的容量以及增强安装在液体冷却系统中的管的局部强度)来加强液体冷却系统,以防止对该液体冷却系统造成损坏。然而,因为高密度的封装要求,所以难以对信息处理设备进行加强以防止对液体冷却系统造成损坏。
[0005]已经开发出用于保护液体冷却系统的技术,其中控制整个信息系统的运行的控制系统监视用于保护液体冷却系统的传感器。在这样的技术中,控制整个信息系统的运行的控制系统监视用于保护液体冷却系统的传感器,并且在检测到异常时切断对发热的电子元件的电力供应。
[0006]此外,已经开发出用于控制系统的冗余的技术,以提高控制整个系统的控制系统的可靠性(例如参见日本特开第10-154085号公报和日本特开第11-353018号公报)。
[0007]当液体冷却系统的监视和保护由控制整个信息系统的一个控制系统执行时,该控制系统不仅对液体冷却系统的控制进行响应,而且还对与系统有关的各种控制和信息处理设备的主要处理控制进行响应。由控制系统执行的处理很复杂使得控制系统可能陷入不可控状态。在控制系统中生成的可能的不可控状态的示例可以包括由于多个中断处理所引起的延迟响应和由乱码数据生成的意想不到的例程。在这样的情况下,可能丧失液体冷却系统的保护功能,从而导致液体冷却系统的保护失效的风险。
[0008]控制整个系统的运行的控制系统的常规冗余度技术的使用具有用于接管复杂控制系统的处理,并且导致耗时的接管处理。因而,在接管处理期间,由控制系统执行的处理将增加,从而使得对液体冷却系统的充分保护失效。如上所述,由于难以确保液体冷却系统的强度,液体冷却系统缺少时间来承受困难,从而在接管处理期间损坏液体冷却系统。
[0009]尽管可假定简单地隔开液体冷却系统的控制系统以避免这样的失效控制,但是存在液体冷却系统的控制系统在发生异常的同时不顾液体冷却系统的状态就停止液体冷却系统的风险。如果液体冷却系统在运行中并且在液体冷却系统被损坏之前存在足够的时间,则,即使在执行终止处理(如关闭)之后停止电力供应的情况下也可以实现液体冷却系统的保护。然而,如果停止电力供应而不执行任何终止处理,则存在丢失或损坏可能已经被保护的数据的风险,从而降低信息处理设备的可靠性。
[0010]因此,本发明的实施方式的一个方面的目的在于提供可以安全且准确地停止系统而不损坏系统的可靠性的电力控制设备、信息处理设备和电力控制方法。

【发明内容】

[0011]根据实施方式的一个方面,提供一种电力控制设备,其包括:第一传感器,其对用于冷却电路元件的冷却单元的状态进行检测;第二传感器,其检测所述电路元件的状态;确定单元,其确定所述冷却单元是否在运行;第一控制器,其在所述确定单元确定所述冷却单元停止运行时,基于由所述第一传感器检测到的状态来控制对所述电路元件的电力供应;以及第二控制器,其在所述确定单元确定所述冷却单元在运行时,基于由所述第二传感器检测到的状态来控制对所述电路元件的电力供应。
【专利附图】

【附图说明】
[0012]图1是示出根据第一实施方式的电力控制设备的框图;
[0013]图2是示出在液体冷却系统运行时对CPU的电力供应控制的图;
[0014]图3是示出在液体冷却系统停止运行时对CPU的电力供应控制的图;
[0015]图4是在根据第一实施方式的电力控制设备中的异常发热避免处理的流程图;
[0016]图5是根据第二实施方式的电力控制设备的框图;
[0017]图6是示出控制可用性确定单元的示例的图;
[0018]图7是在根据第二实施方式的电力控制设备中的异常发热避免处理的流程图;
[0019]图8是根据第二实施方式的变型的电力控制设备中的异常发热避免处理的流程图;
[0020]图9是根据第三实施方式的电力控制设备的框图;
[0021]图10是根据第三实施方式的电力控制设备中的诊断处理的流程图;
[0022]图11是根据第四实施方式的电力控制设备的框图;
[0023]图12是信息处理设备的硬件配置图;以及
[0024]图13是示出液体冷却系统的具体硬件配置的立体图。
【具体实施方式】
[0025]将参照附图来说明本发明的优选实施方式。电力控制设备、信息处理设备以及电力控制方法不限于下述实施方式。
[0026]「al第一实施方式
[0027]图1是根据第一实施方式的电力控制设备的框图。根据本实施方式的电力控制设备包括液体冷却系统1、系统监视控制器2、液体冷却系统保护控制器3、CPU4、电力供应单兀5、温度传感器6以及温度传感器7。
[0028]液体冷却系统I包括散热器11、风扇12、泵13、冷却板14以及管15。液体冷却系统I提供“冷却单元”的示例。[0029]管15是使得用于冷却CPU4的冷却剂循环的管。管15连接散热器11、泵13和冷却板14。
[0030]例如,泵13在散热器11侧从管15吸入冷却剂,并且在冷却板14侧将如此吸入的冷却剂排放到管15中,以使得冷却剂进行循环。
[0031]冷却板14被布置为与CPU4接触。冷却板14接纳从泵13发送的并被冷却的冷却齐U,利用如此接纳的冷却剂吸收CPU4的热量,并且将通过吸收热量而被加热的冷却剂输送回散热器11。冷却板14对CPU4进行冷却。
[0032]散热器11接纳由冷却板14加热的冷却剂。由散热器11接纳的冷却剂通过从风扇12送出的风而被冷却。之后,由散热器11如此冷却的冷却剂被泵13吸入,并被输送至冷却板14。
[0033]风扇12将风送至散热器11。散热器11内的冷却剂通过从风扇12送出的风而被冷却。
[0034]在本实施方式中,温度传感器6是温度开关(如正温度系数(PTC)热敏电阻器)。温度传感器6被布置为靠近冷却板14。作为PTC热敏电阻器的温度传感器6在温度超过预定阈值时停止发送信号。具体地,温度传感器6通常将信号发送至液体冷却系统保护控制器3,并且在液体冷却系统I的温度增加且所测量的温度超过阈值时停止发送信号。虽然在本实施方式中温度传感器6被布置为靠近其温度最可能增加的冷却板14,但是只要可以检测到液体冷却系统I中的异常温度增加,温度传感器6可以被布置在液体冷却系统I中的任意位置。例如,温度传感器6可以被布置在管15上。温度传感器6提供“第一传感器”的示例。
[0035]在本实施方式中,温度传感器7为例如负温度系数(NTC)热敏电阻器。作为NTC热敏电阻器的温度传感器7随着温度增加具有较低的电阻。温度传感器7将根据其电阻值的电压发送至CPU电力供应控制单元21。
[0036]系统监视控制器2例如为系统控制设施。系统监视控制器2监视整个信息处理设备的状况。虽然图1中仅示出在电力控制设备的说明中所使用的部分而略去了其它部分,但是系统监视控制器2实际上监视安装在信息处理设备中的各种其它部分的状况并且控制其运行。
[0037]系统监视控制器2包括CPU电力供应控制单元21和液体冷却系统运行控制单元22。
[0038]液体冷却系统运行控制单元22通过控制风扇12和泵13的运行来控制液体冷却系统I的运行。具体地,当CPU4停止运行时,液体冷却系统运行控制单元22停止风扇12和泵13以停止液体冷却系统I的运行。当CPU4运行时,液体冷却系统运行控制单元22激活风扇12和泵13以激活液体冷却系统I。液体冷却系统运行控制单元22确定液体冷却系统I是否在风扇12和泵13的控制下运行。
[0039]当风扇12和泵13运行时,液体冷却系统运行控制单元22向CPU电力供应控制单元21通知液体冷却系统I在运行。当风扇12和泵13停止运行时,液体冷却系统运行控制单元22向CPU电力供应控制单元21通知液体冷却系统I停止运行。液体冷却系统运行控制单元22提供“确定单元”的示例。
[0040]在从液体冷却系统运行控制单元22接收到液体冷却系统I在运行的通知时,CPU电力供应控制单元21使液体冷却系统保护控制器3停止运行。这使得液体冷却系统保护控制器3不能执行对电力供应单元5的电力供应停止指令。此外,CPU电力供应控制单元21接收来自温度传感器7的电压输入,并且根据该电压输入确定CPU4的温度。因为温度传感器7是NTC热敏电阻器,所以CPU电力供应控制单元21可以灵敏地掌握当前温度。然而,CPU电力供应控制单元21执行复杂的处理,如接收来自温度传感器7的连续信号的输入并且将如此输入的信号转换为温度,来掌握CPU4的温度。因而,CPU电力供应控制单元21的配置是复杂的。
[0041]CPU电力供应控制单元21预先在其中存储针对CPU4的温度的上限阈值。当根据从温度传感器7接收的电压而获得的温度超过如此存储的阈值时,CPU电力供应控制单元21增加风扇12和泵13的运行速度以增加液体冷却系统I的冷却能力。这延长了在液体冷却系统I被损坏之前经过的时间。之后,CPU电力供应控制单元21启动对信息处理设备的关闭。在关闭之后,CPU电力供应控制单元21将用于停止对CPU4的电力供应的指令通知给电力供应单元5,从而停止对CPU4的电力供应。
[0042]在从液体冷却系统运行控制单元22接收到液体冷却系统I停止运行的通知时,CPU电力供应控制单元21激活液体冷却系统保护控制器3。之后,为了保护液体冷却系统LCPU电力供应控制单元21停止对CPU4的电力供应的控制。CPU电力供应控制单元21提供“第一控制单元”的示例。
[0043]当液体冷却系统I运行时,液体冷却系统保护控制器3接收来自CPU电力供应控制单元21的运行停止指令。此时,液体冷却系统保护控制器3停止其运行,并且即使作为来自温度传感器6的信号接收到任何信号也不向电力供应单元5通知用于停止对CPU4的电力供应的指令。
[0044]与此相反,当液体冷却系统I停止运行时,液体冷却系统保护控制器3接收来自CPU电力供应控制单元21的运行指令。当来自温度传感器6的输入信号中断时,液体冷却系统保护控制器3确定液体冷却系统I的温度超过阈值,从而确定在液体冷却系统I中出现了异常。之后,液体冷却系统保护控制器3向电力供应单元5通知用于停止对CPU4的电力供应的指令,从而停止对CPU4的电力供应。温度传感器6是PTC热敏电阻器,并且液体冷却系统保护控制器3仅基于存在或不存在发送自温度传感器6的信号来确定温度异常。因而,可以将由液体冷却系统保护控制器3执行的处理最小化,这使得液体冷却系统保护控制器3能够具有简单的配置。这意味着液体冷却系统保护控制器3不太可能失控。因此,可以改进液体冷却系统保护控制器3防御液体冷却系统I的异常发热的保护功能的连续性。液体冷却系统保护控制器3提供“第一控制单元”的示例。
[0045]电力供应单元5向CPU4供应电力。图1用虚线示出对CPU4的电力供应。当从液体冷却系统保护控制器3或CPU电力供应控制单元21接收到停止对CPU4的电力供应的通知时,电力供应单元5停止对CPU4的电力供应。
[0046]在接收到来自电力供应单元5的电力供应时,CPU4执行各种处理。另外,在来自电力供应单元5的电力供应停止时,CPU4停止运行。例如,当来自电力供应单元5的电力供应停止时,即使CPU4处于处理过程中,CPU4也立即停止运行而不执行用于当前执行的处理的任何终止处理。在这样的情况下,存在损坏数据的高可能性。与此相反,如果由系统监视控制器2或其它单元来执行关闭,则CPU4在执行了用于当前执行的处理的终止处理之后停止运行,这可以防止数据损坏。
[0047]当CPU的温度超过阈值或液体冷却系统的温度超过阈值时,根据本实施方式的电力控制设备停止对CPU的电力供应。换言之,当CPU的温度超过阈值或液体冷却系统的温度超过阈值时,根据本实施方式的电力控制设备确定存在异常发热。在下面的描述中,CPU的温度超过阈值或液体冷却系统的温度超过阈值的状态可以被称为“异常发热”。此外,在CPU的温度超过阈值或液体冷却系统的温度超过阈值时停止对CPU的电力供应的处理可以被称为“异常发热避免处理”。
[0048]图2是示出在液体冷却系统运行的情况下对CPU的电力供应控制的图。图3是示出在液体冷却系统停止运行的情况下对CPU的电力供应控制的图。在图2和图3中,用虚线示出未运行的部分。从风扇12指向散热器11的箭头示出风扇12向散热器11输送风的操作。
[0049]当液体冷却系统I运行时,如图2所示,停止液体冷却系统保护控制器3的操作。在这样的情况下,仅CPU电力供应控制单元21控制从电力供应单元5到CPU4的电力供应。当液体冷却系统I运行时,即使在液体冷却系统I的温度被增加至导致冷却剂的高温的情况下,在液体冷却系统I被损坏之前仍然存在足够的时间。因而,仅在由CPU电力供应控制单元21执行关闭之后停止对CPU4的电力供应将是足够的。
[0050]与此相反,当液体冷却系统I停止运行时,如图3所示,停止CPU电力供应控制单元21的运行。在这样的情况下,仅液体冷却系统保护控制器3控制从电力供应单元5到CPU4的电力供应。当液体冷却系统I停止运行时,没有方法可用于对在冷却板14处已变为高温的冷却剂进行冷却。因而,除非立即停止至冷却剂的热量供应,否则液体冷却系统I将被损坏。因此,优选地配置一些布置,使得在液体冷却系统I停止运行时,可以通过液体冷却系统保护控制器3立即停止对CPU4的电力供应。
[0051]接下来,将参照图4描述在根据本实施方式的电力控制设备中的异常发热避免处理的流程。图4是根据第一实施方式的电力控制设备中的异常发热避免处理的流程图。
[0052]液体冷却系统运行控制单元22确定CPU4是否在运行(步骤SI )。如果CPU4停止运行(在步骤SI处为“否”),则液体冷却系统运行控制单元22停止风扇12和泵13 (步骤S2)。此外,液体冷却系统运行控制单元22向CPU电力供应控制单元21通知液体冷却系统I停止运行。
[0053]CPU电力供应控制单元21激活液体冷却系统保护控制器3 (步骤S3)。
[0054]液体冷却系统保护控制器3使用温度传感器6监视液体冷却系统I中的异常发热(步骤S4)。液体冷却系统保护控制器3基于存在或不存在来自温度传感器6的信号输入来确定液体冷却系统I的温度是否超过阈值(步骤S5)。当液体冷却系统I的温度超过阈值时(在步骤S5处为“是”),液体冷却系统保护控制器3将用于停止对CPU4的电力供应的指令通知给电力供应单元5。电力供应单元5接收电力供应停止通知并且停止对CPU4的电力供应(步骤S6)。与此相反,当液体冷却系统I的温度等于或低于阈值时(在步骤S5处为“否”),液体冷却系统保护控制器3行进至步骤S15。
[0055]当CPU运行时(在步骤SI处为“是”),液体冷却系统运行控制单元22激活风扇12和泵13 (步骤S7)。液体冷却系统运行控制单元22向CPU电力供应控制单元21通知液体冷却系统I在运行中。[0056]CPU电力供应控制单元21使液体冷却系统保护控制器3停止运行(步骤S8)。
[0057]CPU电力供应控制单元21使用温度传感器7来监视CPU4中的异常发热(步骤S9)。CPU电力供应控制单元21基于从温度传感器7接收的电压输入来计算CPU4的温度,以确定CPU4的温度是否超过阈值(步骤S10)。当CPU4的温度超过阈值时(在步骤SlO处为“是”),CPU电力供应控制单元21增加风扇12和泵13的速度以增加液体冷却系统I的冷却能力(步骤SI I)。
[0058]接下来,CPU电力供应控制单元21执行关闭(步骤S12)。
[0059]之后,CPU电力供应控制单元21向电力供应单元5通知停止对CPU4的电力供应。电力供应单元5接收电力供应停止通知并且停止对CPU4的电力供应(步骤S13)。
[0060]液体冷却系统运行控制单元22使风扇12和泵13停止(步骤S14)。
[0061]与此相反,当CPU4的温度等于或低于阈值时(在步骤SlO处为“否”),CPU电力供应控制单元21前进至步骤S15。
[0062]系统监视控制器2确定信息处理设备的运行是否停止(步骤S15)。此时,信息处理设备的运行停止不仅可以包括由于异常发热生成所导致的停止,还可以包括基于用户的关闭指令的停止。当信息处理设备的运行停止时(在步骤S15处为“是”),信息处理设备结束异常发热避免处理。与此相反,当信息处理设备的运行未停止时(在步骤S15处为“否”),信息处理设备返回步骤SI。
[0063]如上所述,当在CPU运行时(也就是说,在液体冷却系统运行时)在CPU中生成异常温度的情况下,根据本实施方式的电力控制设备在执行关闭之后停止对CPU的电力供应。此外,当在CPU停止运行时间(也就是说,在液体冷却系统停止运行时)在冷却板中生成异常温度的情况下,根据本实施方式的电力控制设备立即停止对CPU的电力供应。如果在液体冷却系统被损坏之前存在足够的时间,那么在备份数据之后停止对CPU的电力供应。如果在液体冷却系统被损坏之前不存在足够的时间,那么停止对CPU的电力供应而不备份数据。因此,可以尽可能地保护数据,并且可以提供符合信息处理设备的运行状况的保护功能,从而确保信息装置的可靠性。因为液体冷却系统保护控制器具有简单的配置,所以不同于CPU电力供应控制单元,液体冷却系统保护控制器较少可能不可控,由此可以确保对于液体冷却系统的保护功能的连续性。因此,根据本实施方式的电力控制设备可以安全且准确地停止系统而不会损和害系统的可靠性。
[0064]「bl第二实施方式
[0065]图5是根据第二实施方式的电力控制设备的框图。根据本实施方式的电力控制设备与第一实施方式中的电力控制设备的不同之处在于:该电力控制设备确定CPU电力供应控制单元21是否处于不可控状态,并且如果CPU电力供应控制单元21处于不可控状态,则激活液体冷却系统保护控制器3。在下面的描述中,将略去与第一实施方式具有相同功能的部分的说明。
[0066]在根据本实施方式的电力控制设备中,除第一实施方式中的电力控制设备之外,提供控制可用性确定单元8。
[0067]当通过根据CPU4的停止而停止的风扇12和泵13来停止液体冷却系统I时,CPU电力供应控制单元21将用于激活液体冷却系统保护控制器3的指令发送至控制可用性确定单元8。当CPU4在运行并且利用运行的风扇12和泵13来运行液体冷却系统I时,CPU电力供应控制单元21将用于停止液体冷却系统保护控制器3的指令发送至控制可用性确定单元8。
[0068]然而,当CPU电力供应控制单元21例如由于负载增加而处于不可控状态时,CPU电力供应控制单元21难以向液体冷却系统保护控制器3发送适当的指令。例如,存在如下风险:尽管液体冷却系统I处于停止状态,但是CPU电力供应控制单元21仍向液体冷却系统保护控制器3发送停止指令。
[0069]控制可用性确定单元8从CPU电力供应控制单元21接收用于液体冷却系统保护控制器3的运行指令或停止指令。控制可用性确定单元8确定CPU电力供应控制单元21是否处于不可控状态。如果CPU电力供应控制单元21并非处于不可控状态,则控制可用性确定单元8将从CPU电力供应控制单元21接收的指令通知液体冷却系统保护控制器3。
[0070]与此相反,当确定CPU电力供应控制单元21处于不可控状态时,控制可用性确定单元8将运行指令通知给液体冷却系统保护控制器3而不考虑从CPU电力供应控制单元21接收的指令。因此,即使当CPU电力供应控制单元21由于其处于不可控状态而未将适当指令通知给液体冷却系统保护控制器3时,至少液体冷却系统保护控制器3可以运行,这可以防止对液体冷却系统I的损坏。
[0071]液体冷却系统保护控制器3从控制可用性确定单元8接收运行指令或停止指令。在接收到运行指令时,液体冷却系统保护控制器3基于从温度传感器6接收的信号来确定液体冷却系统I的温度是否超过阈值。如果液体冷却系统I的温度超过阈值,则液体冷却系统保护控制器3将电力供应停止指令通知给电力供应单元5。例如,当CPU电力供应控制单元21处于不可控状态时,液体冷却系统保护控制器3不断地从控制可用性确定单元8接收运行指令。在这样的情况下,液体冷却系统保护控制器3监视温度传感器6并且控制对CPU4的电力供应。
[0072]与此相反,当接收到停止指令时,液体冷却系统保护控制器3不基于从温度传感器6接收的信号来控制对CPU4的电力供应。
[0073]将参照图6来描述控制可用性确定单元8的具体示例。图6是示出控制可用性确定单元的示例的图。控制可用性确定单元8例如包括控制电阻器81和看门狗定时器82。
[0074]控制电阻器81例如为D型触发器(FF)。控制电阻器81保留在从CPU电力供应控制单元21输入的时钟的上升沿处的值,并且将该值输出至液体冷却系统保护控制器3。当从看门狗定时器82输入了清除信号时,控制电阻器81强制性地向液体冷却系统保护控制器3输出运行指令。
[0075]看门狗定时器82包括用于保持测量设定时间段的定时器。如果在被测量的设定时间段期间从CPU电力供应控制单元21发送了信号并且在经过该设定时间之后,看门狗定时器82开始对下一设定时间段进行测量。与此相反,如果在设定时间段期间未从CPU电力供应控制单元21发送信号,则看门狗定时器82确定CPU电力供应控制单元21处于不可控状态,并且向控制电阻器81输出清除信号。
[0076]在CPU电力供应控制单元21从不可控状态恢复之后,看门狗定时器82继续向控制电阻器81输出清除信号。当CPU电力供应控制单元21从不可控状态恢复时,为了使液体冷却系统保护控制器3再次处于CPU电力供应控制单元21的控制下,例如重新启动整个信息处理设备。[0077]接下来,将参照图7描述在根据本实施方式的电力控制设备中的异常发热避免处理的流程。图7是在根据第二实施方式的电力控制设备中的异常发热避免处理的流程图。
[0078]控制可用性确定单元8确定CPU电力供应控制单元21的状态为不可控状态还是从不可控状态恢复的状态(步骤S101)。如果CPU电力供应控制单元21的状态为不可控状态或从不可控状态恢复的状态(在步骤SlOl处为“是”),则控制可用性确定单元8将运行指令通知液体冷却系统保护控制器3以激活液体冷却系统保护控制器3 (步骤S102)。
[0079]液体冷却系统保护控制器3使用温度传感器6来监视液体冷却系统I中的异常发热(步骤S103)。
[0080]系统监视控制器2将其自身重启以执行初始化处理(步骤S104)。
[0081]当CPU电力供应控制单元21的状态既不是不可控状态也不是从不可控状态恢复的状态时(在步骤SlOl处为“否”),液体冷却系统运行控制单元22确定CPU4是否在运行(步骤S105)。如果CPU4停止(步骤S105处为“否”),则液体冷却系统运行控制单元22使风扇12和泵13停止(步骤S106)。此外,液体冷却系统运行控制单元22通知CPU电力供应控制单元21 “液体冷却系统I停止”。CPU电力供应控制单元21向控制可用性确定单元8输出用于激活液体冷却系统保护控制器3的指令。
[0082]控制可用性确定单元8向液体冷却系统保护控制器3输出运行指令以激活液体冷却系统保护控制器3 (步骤S107)。
[0083]液体冷却系统保护控制器3使用温度传感器6来监视液体冷却系统I中的异常发热(步骤S108)。
[0084]与此相反,当CPU在运行时(在步骤S105处为“是”),液体冷却系统运行控制单元22激活风扇12和泵13 (步骤S109)。此外,液体冷却系统运行控制单元22向CPU电力供应控制单元21发送“液体冷却系统I在运行”的通知。
[0085]CPU电力供应控制单元21停止液体冷却系统保护控制器3 (步骤S110)。CPU电力供应控制单元21使用温度传感器7来监视CPU4中的异常发热(步骤S111)。
[0086]系统监视控制器2和液体冷却系统保护控制器3确定信息处理设备的运行是否停止(步骤S112)。该运行停止不仅包括由于异常发热所导致的运行停止,而且包括根据用户的关闭指令的运行停止。当信息处理设备的运行停止时(在步骤S112处为“是”),系统监视控制器2和液体冷却系统保护控制器3结束异常发热避免处理。当信息处理设备的运行未停止时(在步骤S112处为“否”),系统监视控制器2和液体冷却系统保护控制器3返回至步骤 SlOl。
[0087]夺型
[0088]接下来,将描述第二实施方式的变型。本变型表示在第二实施方式中将系统监视控制器2制成冗余的情况。
[0089]在本变型中,系统监视控制器2被制成冗余的。因此,将发生故障之前正运行的系统监视控制器2称为运行系统,而将在运行系统中发生故障时要运行的系统监视控制器2称为待机系统。
[0090]在陷入不可控状态之前,运行系统的系统监视控制器2执行与在第二实施方式中所描述的系统监视控制器2的操作相同的操作。
[0091]当运行系统的系统监视控制器2陷入不可控状态时,待机系统的系统监视控制器2开始用于接管已经由运行系统的系统监视控制器2执行的对整个系统的监视控制的操作。例如,待机系统的系统监视控制器2可以通过监视运行系统的系统监视控制器2的运行来确定运行系统的系统监视控制器2是否陷入不可控状态。之后,待机系统的系统监视控制器2执行与在第二实施方式中所描述的系统监视控制器2的操作相同的操作。
[0092]在发生故障之前,控制可用性确定单元8从运行系统的系统监视控制器2的CPU电力供应控制单元21 (在下文中,被称为“运行系统的CPU电力供应控制单元21”)接收用于液体冷却系统保护控制器3的运行指令或停止指令。此外,控制可用性确定单元8确定运行系统的CPU电力供应控制单元21是否处于不可控状态。当运行系统的CPU电力供应控制单元21不处于不可控状态时,控制可用性确定单元8将从运行系统的CPU电力供应控制单元21接收的指令通知给液体冷却系统保护控制器3。
[0093]与此相反,当控制可用性确定单元8确定运行系统的CPU电力供应控制单元21处于不可控状态时,控制可用性确定单元8将运行指令通知给液体冷却系统保护控制器3而不考虑从运行系统的CPU电力供应控制单元21接收的指令。
[0094]当待机系统的CPU电力供应控制单元21在运行系统的CPU电力供应控制单元21陷入不可控状态之后开始运行时,控制可用性确定单元8从待机系统的CPU电力供应控制单元21接收用于液体冷却系统保护控制器3的运行指令或停止指令。此外,控制可用性确定单元8确定待机系统的CPU电力供应控制单元21是否处于不可控状态。当控制可用性确定单元8确定待机系统的CPU电力供应控制单元21不处于不可控状态时,控制可用性确定单元8将从待机系统的CPU电力供应控制单元21接收的指令通知给液体冷却系统保护控制器3。
[0095]与此相反,当控制可用性确定单元8确定待机系统的CPU电力供应控制单元21处于不可控状态时,控制可用性确定单元8将运行指令通知给液体冷却系统保护控制器3而不考虑从待机系统的CPU电力供应控制单元21接收的指令。
[0096]在本变型中,已经描述了系统监视控制器2处于不可控状态的情况。然而,可以将CPU电力供应控制单元21制成冗余的,并且当运行系统的CPU电力供应控制单元21陷入不可控状态时,待机系统的CPU电力供应控制单元21可以运行。
[0097]接下来,将参照图8描述在根据本变型的电力控制设备中的异常发热避免处理的流程。图8是在根据第二实施方式的变型的电力控制设备中的异常发热避免处理的流程图。
[0098]控制可用性确定单元8确定系统监视控制器2是否处于不可控状态(步骤S201)。如果系统监视控制器2处于不可控状态(在步骤S201处为“是”),则控制可用性确定单元8将运行指令通知给液体冷却系统保护控制器3以激活液体冷却系统保护控制器3 (步骤S202)。
[0099]液体冷却系统保护控制器3使用温度传感器6来监视液体冷却系统I中的异常发热(步骤S203)。
[0100]系统监视控制器2执行冗余系统的切换(步骤S204)。换言之,运行系统的系统监视控制器2停止而待机系统的系统监视控制器2运行。
[0101]当系统监视控制器2不处于不可控状态时(在步骤S201处为“否”),液体冷却系统运行控制单元22确定CPU4是否在运行(步骤S205)。当CPU4停止时(在步骤S205处为“否”),液体冷却系统运行控制单元22使风扇12和泵13停止(步骤S206)。此外,液体冷却系统运行控制单元22通知CPU电力供应控制单元21 “液体冷却系统I停止”。CPU电力供应控制单元21向控制可用性确定单元8输出用于激活液体冷却系统保护控制器3的指令。
[0102]控制可用性确定单元8向液体冷却系统保护控制器3输出运行指令以激活液体冷却系统保护控制器3 (步骤S207)。
[0103]液体冷却系统保护控制器3使用温度传感器6来监视液体冷却系统I中的异常发热(步骤S208)。
[0104]与此相反,当CPU在运行时(在步骤S205处为“是”),液体冷却系统运行控制单元22激活风扇12和泵13 (步骤S209)。此外,液体冷却系统运行控制单元22向CPU电力供应控制单元21发送“液体冷却系统I在运行”的通知。
[0105]CPU电力供应控制单元21使液体冷却系统保护控制器3停止(步骤S210)。CPU电力供应控制单元21使用温度传感器7来监视CPU4中的异常发热(步骤S211)。
[0106]系统监视控制器2和液体冷却系统保护控制器3确定信息处理设备的运行是否停止(步骤S212)。该运行停止不仅包括由于异常发热所导致的运行停止,而且包括根据用户的关闭指令的运行停止。当信息处理设备的运行停止时(在步骤S212处为“是”),系统监视控制器2和液体冷却系统保护控制器3结束异常发热避免处理。当信息处理设备的运行没有停止时(在步骤S212处为“否”),系统监视控制器2和液体冷却系统保护控制器3返回至步骤S201。
[0107]如上所述,根据本实施方式和本变型的电力控制设备在系统监视控制器陷入不可控状态时强制性地激活液体冷却系统保护控制器。因此,当复杂且承载高负载的系统监视控制器陷入不可控状态时,处于不可控状态的系统监视控制器被剥夺控制,该控制被转移至由具有简单配置并且不可能陷入不可控状态的液体冷却系统保护控制器所执行的异常发热避免处理的控制。这提高了异常发热避免处理的连续性。
[0108]在根据本变型的电力控制设备中,系统监视控制器被制为冗余的。因而,即使运行系统陷入不可控状态,待机系统的系统监视控制器也可以接管异常发热避免处理。这可以根据液体冷却系统的状态提高适当的异常发热避免处理的连续性。
[0109]「Cl第三实施方式
[0110]图9是根据第三实施方式的电力控制设备的框图。根据本实施方式的电力控制设备与第一实施方式中的电力控制设备的不同之处在于:系统监视控制器2执行液体冷却系统保护控制器3的诊断。在下面的描述中,将略去与第一实施方式中具有相同功能的部分的说明。
[0111]除CPU电力供应控制单元21和液体冷却系统运行控制单元22之外,根据本实施方式的电力控制设备的系统监视控制器2包括诊断单元23。根据本实施方式的电力控制设备的系统监视控制器2还包括开关91和92。
[0112]开关91被布置在从温度传感器6至液体冷却系统保护控制器3的信号的传输路径上。当接通开关91时,从温度传感器6输出的信号被输入到液体冷却系统保护控制器3中。与此相反,当断开开关91时,从温度传感器6输出的信号不会被输入到液体冷却系统保护控制器3中。在本实施方式中,当从温度传感器6输入信号时,液体冷却系统保护控制器3确定尚未发生异常发热;并且当未从温度传感器6输入信号时,液体冷却系统保护控制器3确定发生了异常发热。
[0113]开关92被布置在从液体冷却系统保护控制器3至电力供应单元5的信号的传输路径上。当接通开关92时,从液体冷却系统保护控制器3输出的用于停止电力供应的指令的信号被输入到电力供应单元5中。与此相反,当断开开关92时,没有从温度传感器6输出的用于停止电力供应的指令的信号被输入到电力供应单元5中。
[0114]诊断单元23周期性地(如每周)执行关于液体冷却系统保护控制器3的运行是否正常的诊断。诊断可以周期性地执行,或者可以由用户指令触发来执行诊断。在下面的描述中,将描述由诊断单元23执行的诊断处理。
[0115]诊断单元23断开开关92。接下来,诊断单元23断开开关91。之后,诊断单元23确定是否从液体冷却系统保护控制器3输出了 “停止电力供应”的通知。
[0116]在从液体冷却系统保护控制器3接收到“停止电力供应”的通知时,诊断单元23确定液体冷却系统保护控制器3正常地运行。然后,诊断单元接通开关91并进一步接通开关92。这使得对液体冷却系统保护控制器3的连接返回至正常状态。
[0117]与此相反,当诊断单元23未从液体冷却系统保护控制器3接收到任何“停止电力供应”的通知时,诊断单元23确定液体冷却系统保护控制器3处于异常状态。此外,诊断单元23将“液体冷却系统保护控制器3中发生了异常”通知给管理者,例如以促进液体冷却系统保护控制器3的替换。诊断单元23提供“运行测试单元”的示例。
[0118]当断开开关91时,液体冷却系统保护控制器3将不再从温度传感器6接收信号。因而,液体冷却系统保护控制器3确定在冷却板14处发生了异常发热。液体冷却系统保护控制器3还输出用于停止电力供应的指令。此时,因为开关92断开,所以从液体冷却系统保护控制器3输出的用于停止电力供应的指令未被发送至电力供应单元5而仅被发送至诊断单元23。
[0119]接下来,将参照图10描述由根据本实施方式的电力控制设备执行的诊断处理的流程。图10是在根据第三实施方式的电力控制设备中的诊断处理的流程图。
[0120]诊断单元23断开开关92 (步骤S301)。诊断单元23断开开关91 (步骤S302)。
[0121]接下来,液体冷却系统保护控制器3监视液体冷却系统I中的异常发热(步骤S303)。
[0122]诊断单元23确定诊断单元23是否从液体冷却系统保护控制器3接收到用于停止电力供应的指令(步骤S304)。在接收到用于停止电力供应的指令时(在步骤S304处为“是”),诊断单元23确定液体冷却系统保护控制器3处于正常状态(步骤S305)。
[0123]诊断单元23接通开关91 (步骤S306),并且接通开关92 (步骤S307)。
[0124]与此相反,当诊断单元23尚未接收到用于停止电力供应的任何指令时(在步骤S304处为“否”),诊断单元23确定液体冷却系统保护控制器3处于异常状态(步骤S308)。
[0125]诊断单元23将液体冷却系统保护控制器3的异常状态通知给例如信息处理设备的管理者(步骤S309)。
[0126]如上所述,根据本实施方式的电力控制设备可以使用系统监视控制器来执行液体冷却系统保护控制器的运行测试。这使得能够较早地检测到液体冷却系统保护控制器的异常,从而防止生成其中由于液体冷却系统保护控制器的异常而使发热避免功能失效的状态。因此,可以提高系统的可靠性。[0127]rdl第四实施方式
[0128]图11是根据第四实施方式的电力控制设备的框图。根据本实施方式的电力控制设备与第一实施方式中的电力控制设备的不同之处在于:液体冷却系统保护控制器3还使用来自温度传感器7的信息来检测液体冷却系统I中的异常发热。在以下描述中,将略去与第一实施方式中具有相同功能的部分的说明。
[0129]根据本实施方式的电力控制设备与第一实施方式中的电力控制设备的不同之处在于:根据本实施方式的电力控制设备不包括温度传感器6,并且来自温度传感器7的信号被输入到液体冷却系统保护控制器3和CPU电力供应控制单元21中。
[0130]液体冷却系统保护控制器3从温度传感器7接收电压输入。液体冷却系统保护控制器3根据该电压输入来确定CPU4的温度。冷却板14从CPU4接收热量并且冷却板14的温度随之升高。换言之,可以通过测量CPU4的温度来估计液体冷却系统I的近似温度。在本实施方式中,液体冷却系统保护控制器3使用CPU4的温度来执行液体冷却系统I的保护控制。然而,在本实施方式中,液体冷却系统保护控制器3从温度传感器7接收连续信号输入,并且将该信号转换为温度以获得CPU4的温度。由于要执行如此复杂的处理,所以液体冷却系统保护控制器3与第一实施方式中的液体冷却系统保护控制器3相比具有复杂的配置。
[0131]液体冷却系统保护控制器3预先在其中存储针对CPU4的温度的上限阈值。当根据来自温度传感器7的电压输入获得的温度超过如此存储的阈值时,液体冷却系统保护控制器3将停止对CPU4的电力供应的指令通知给电力供应单元5,从而停止对CPU4的电力供应。
[0132]如上所述,根据本实施方式的液体冷却系统保护控制器和CPU电力供应控制单元各自均使用单个温度传感器来控制电力供应。因而,仅提供一个温度传感器,这使电力控制设备和信息处理设备更紧凑。
[0133]在上述实施方式中,液体冷却系统保护控制器3使用温度传感器6和温度传感器7来检测液体冷却系统I的异常发热。然而,可以使用检测其它信息的传感器作为传感器。
[0134]例如,可以提供用于测量冷却板14或管15的内部压力的压力传感器来代替温度传感器6。当冷却剂沸腾时,冷却板14和管15中的内部压力增加。然后,液体冷却系统保护控制器3可以使用来自压力传感器的信息来检测液体冷却系统的异常发热。
[0135]此外,例如可以提供用于检测冷却板14和管15的振动的振动传感器来代替温度传感器6。当冷却剂沸腾时,在冷却板14和管15处生成振动。然后,液体冷却系统保护控制器3可以使用来自振动传感器的信息来检测液体冷却系统的异常发热。
[0136]因此,压力传感器或振动传感器可以用于迅速地检测作为最严重异常现象的冷却剂的沸腾。因此,可以迅速地执行发热避免处理,从而保持系统的可靠性。
[0137]硬件配置
[0138]接下来,将参照图12描述其中安装有根据本实施方式的电力控制设备的信息处理设备的硬件配置。图12是信息处理设备的硬件配置图。
[0139]如图12所示,信息处理设备包括CPU901、监视处理器902、存储器903、输入/输出(I/O) 904、硬盘905、风扇906、泵907、紧急电力停止电路908、传感器909以及电力供应单元 910。[0140]CPU901、监视处理器902、存储器903、输入/输出(I/O) 904、硬盘905、风扇906、泵907、紧急电力停止电路908、传感器909以及电力供应单元910经由总线连接。
[0141]CPU901对应于图1中的CPU4。风扇906对应于图1中的风扇12。泵907对应于图1中的泵13。传感器909执行温度传感器6和7的功能。
[0142]1/0904例如为键盘或监视器。
[0143]监视处理器902和存储器903例如执行图1中的系统监视控制器2的功能。存储器903例如在其中存储各种计算机程序,如实现系统监视控制器2的功能的计算机程序。监视处理器902读出存储在硬盘905中的计算机程序,并且在读出存储器3中加载如此读出的程序并执行此程序,从而实现系统监视控制器2的功能。
[0144]紧急电力停止电路908例如执行图1中所示的液体冷却系统保护控制器3的功能。紧急电力停止电路908例如为紧急断电(EPO)开关。
[0145]将再次参照图13来描述根据本实施方式的电力控制设备的具体硬件配置。图13是示出液体冷却系统的具体硬件配置的透视图。
[0146]电力控制设备包括风扇906、泵907、冷却板911、管912、散热器913以及贮存罐914。
[0147]冷却板911对应于图1所示的冷却板14。管912对应于图1所示的管15。散热器913对应于图1所示的散热器11。
[0148]冷却板911被螺接到CPU901上,从而带走CPU901的热量。泵907、冷却板911、散热器913以及贮存罐914通过管912连接。冷却剂在泵907、冷却板911、管912、散热器913以及贮存罐914中循环。
[0149]贮存罐914是用于确保额外的冷却剂的罐,以使得不会由于冷却剂降到规定水平以下而停止冷却处理。
[0150]根据实施方式的一个方面,电力控制设备、信息处理设备以及电力控制方法可以安全且准确地停止系统,而不会损害系统的可靠性。
【权利要求】
1.一种电力控制设备,包括: 第一传感器,其对用于冷却电路元件的冷却单元的状态进行检测; 第二传感器,其检测所述电路元件的状态; 确定单元,其确定所述冷却单元是否在运行; 第一控制器,其在所述确定单元确定所述冷却单元停止运行时,基于由所述第一传感器检测到的状态来控制对所述电路元件的电力供应;以及 第二控制器,其在所述确定单元确定所述冷却单元在运行时,基于由所述第二传感器检测到的状态来控制对所述电路元件的电力供应。
2.根据权利要求1所述的电力控制设备,其中, 当所述确定单元确定所述冷却单元停止运行时,所述第二控制器使所述第一控制器运行,并且停止所述第二控制器对所述电路元件的电力供应控制;以及 当所述确定单元确定所述冷却单元在运行时,所述第二控制器停止所述第一控制器,并且执行所述第二控制器对所述电路元件的电力供应控制。
3.根据权利要求1所述的电力控制设备,还包括:故障处理单元,所述故障处理单元监视所述第二控制器的运行,并且在所述第二控制器陷入不可控状态时使所述第一控制器运行。
4.根据权利要求1所述的电力控制设备,还包括: 运行测试单元,其对所述 第一控制器的运行进行测试,其中, 当所述运行测试单元确定在所述第一控制器中发生故障时,所述第二控制器停止所述第一控制器并且执行所述第二控制器对所述电路元件的电力供应控制。
5.根据权利要求1所述的电力控制设备,其中, 所述第一传感器是用于测量所述冷却单元的温度的温度传感器, 当由所述第一传感器测量到的温度超过第一阈值时,所述第一控制器停止对所述电路元件的电力供应, 所述第二传感器是用于测量所述电路元件的温度的温度传感器,以及当由所述第二传感器测量到的温度超过第二阈值时,所述第二控制器停止对所述电路元件的电力供应。
6.根据权利要求1所述的电力控制设备,其中, 所述第一传感器和所述第二传感器分别为用于测量所述电路元件的温度的同一传感器, 当由所述第一传感器测量到的温度超过第一阈值时,所述第一控制器确定检测到异常,以停止对所述电路元件的电力供应,以及 当由所述第二传感器测量到的温度超过第二阈值时,所述第二控制器停止对所述电路元件的电力供应。
7.根据权利要求1所述的电力控制设备,其中, 所述第一传感器是用于测量所述冷却单元的压力的压力传感器,以及当由所述第一传感器测量到的压力超过预定压力时,所述第一控制器停止对所述电路元件的电力供应。
8.根据权利要求1所述的电力控制设备,其中,所述第一传感器是用于测量所述冷却单元的振动的振动传感器,以及当所述第一传感器的测量结果超过预定振动时,所述第一控制器停止对所述电路元件的电力供应。
9.一种信息处理设备,包括: 中央处理单元CPU ; 电力供应单元,其向所述CPU供应电力; 冷却单元,其对所述CPU进行冷却; 第一传感器,其检测所述冷却单元的状态; 第二传感器,其检测所述CPU的状态; 确定单元,其确定所述冷却单元是否在运行; 第一控制器,其在所述确定单元确定所述冷却单元停止运行时,基于由所述第一传感器检测到的状态来控制从所述电力供应单元到所述CPU的电力供应;以及 第二控制器,其在所述确定单元确定所述冷却单元在运行时,基于由所述第二传感器检测到的状态来控制从所述电力供应单元到所述CPU的电力供应。
10.一种电力控制方法,包括: 利用第一传感器检测电路元件的状态; 利用第二传感器对用于冷 却所述电路元件的冷却机构的状态进行检测; 确定所述冷却机构是否在运行; 当确定所述冷却机构在运行时,基于由所述第一传感器检测到的状态来控制对所述电路元件的电力供应;以及 当确定所述冷却机构停止运行时,基于由所述第二传感器检测到的状态来控制对所述电路元件的电力供应。
【文档编号】G05D23/30GK103677014SQ201310258103
【公开日】2014年3月26日 申请日期:2013年6月26日 优先权日:2012年8月31日
【发明者】轮岛荣二 申请人:富士通株式会社

最新回复(0)