一种语音控制的系统、遥控器及服务器的制造方法

xiaoxiao2021-2-23 173

一种语音控制的系统、遥控器及服务器的制造方法
【技术领域】
[0001]本发明涉及语音处理技术领域，尤其涉及一种语音控制的系统、遥控器及服务器。
【背景技术】
[0002]语音识别技术，也被称为自动语音识别(Automatic Speech Recognit1n，ASR)，其目标为将人类的语音中的语义内容转换为计算机可读的信息输入，比如二进制编码或者字符序列。语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。通过与其他自然语音处理技术结合使用，比如机器翻译及语音合成技术，语音识别技术可以构建更加复杂的应用，例如语音至语音的翻译应用。语音特征信息是语音识别中的一种基本因素，语音识别系统常用的语音特征信息有线性预测系数、倒频谱系数、平均过零率、能量、短时频谱、共振峰频率及带宽等。而作为一种非常方便有效的控制方法，语音控制一直是许多智能设备的优选控制方法。
[0003]但是，当前的语音识别存在误识别且识别率较低的情况，会影响语音控制在智能设备控制上的广泛应用，因而智能语音识别率及效率低的问题亟待解决。

【发明内容】

[0004]本发明解决的问题是如何提高语音识别的效率及成功率。
[0005]为解决上述问题，本发明提供一种语音控制的系统，所述系统包括:遥控器、主机及服务器，其中:
[0006]所述遥控器，适于对用户进行身份特征识别以获取所述用户的识别码，接收来自所述用户的语音数据，将所述用户的识别码添加至所述用户的语音数据并传输至所述主机；
[0007]所述主机，适于接收来自所述遥控器的具有所述用户的识别码的语音数据，并将所述具有识别码的语音数据传输至所述服务器，接收来自所述服务器的语音识别结果，将所述语音识别结果转化为语音控制指令，并按照所述语音控制指令相应地执行操作；
[0008]所述服务器，适于接收来自所述主机的语音数据，解析得到用户的识别码，根据所述用户的识别码确定所述用户是否为新用户，当所述用户为新用户时，建立所述用户的数据库，并对所述数据库进行语音学习，当所述用户非新用户时，对已建立的所述用户的数据库进行语音学习，并根据所述用户的数据库对所述语音数据进行语音识别，得到语音识别结果，将所述语音识别结果传输至所述主机。
[0009]可选地，所述遥控器，适于利用以下至少一种方式对用户进行身份特征识别:人脸识别及指纹识别。
[0010]可选地，所述遥控器，通过以下至少一种方式与所述主机连接:蓝牙或基于紫蜂协议的通讯。
[0011]本发明实施例提供一种遥控器，所述遥控器包括:
[0012]识别单元，适于对用户进行身份特征识别，并获取所述用户的识别码；
[0013]第一接收单元，适于接收来自所述用户的语音数据；
[0014]添加单元，适于将所述识别单元获取的所述用户的识别码添加至所述第一接收单元接收的所述用户的语音数据；
[0015]第一传输单元，适于把所述添加单元处理后的带有所述用户识别码的用户的语音数据传输至主机。
[0016]可选地，所述识别单元，包括以下至少一个子单元:人脸识别子单元及指纹识别子单元，其中:
[0017]所述人脸识别子单元，适于对对用户的人脸特征进行识别；
[0018]所述指纹识别子单元，适于对对用户的指纹特征进行识别。
[0019]可选地，所述遥控器通过以下至少一种方式与所述主机连接:蓝牙或基于紫蜂协议的通讯。
[0020]可选地，所述遥控器为手机。
[0021 ]本发明实施例提供了一种服务器，所述服务器包括:
[0022]第二接收单元，适于接收来自主机的语音数据；
[0023]解析单元，适于解析得到用户的识别码，并根据所述用户的识别码确定所述用户是否为新用户；
[0024]数据库建立单元，适于当所述解析单元确定所述用户为新用户时，建立所述用户的数据库；
[0025]语音学习单元，适于当所述解析单元确定所述用户为新用户时，对所述数据库建立单元建立的所述用户的数据库进行语音学习，并根据所述用户的数据库对所述语音数据进行语音识别，得到语音识别结果;并适于当所述解析单元确定所述用户非新用户时，对已建立的所述用户的数据库进行语音学习，并根据所述用户的数据库对所述语音数据进行语音识别，得到语音识别结果；
[0026]第二传输单元，适于将所述语音学习单元得到的语音识别结果传输至所述主机。
[0027]与现有技术相比，本发明的技术方案具有以下优点:
[0028]通过遥控器对用户进行身份特征识别以获取所述用户的识别码，并将所述用户的识别码添加至所述用户的语音数据并传输至主机，再由所述主机将所述具有识别码的语音数据转发至服务器，接着由所述服务器解析得到用户的识别码，根据所述用户的识别码确定所述用户是否为新用户。当所述用户为新用户时，所述服务器建立所述用户的数据库，并对所述数据库进行语音学习，当所述用户非新用户时，所述服务器对已建立的所述用户的数据库进行语音学习，并根据所述用户的数据库对所述语音数据进行语音识别，得到语音识别结果，将所述语音识别结果传输至所述主机，以控制所述主机执行与所述语音数据对应的操作。由于可以有针对性的对用户的语音进行学习并识别，故可以了解关于每个用户更多的语音特征信息，从而可以提高语音控制的效率及成功率。
【附图说明】
[0029]图1是本发明实施例中的一种语音控制的系统的结构示意图；
[0030]图2是本发明实施例中的一种语音控制的系统的信令流程示意图；
[0031 ]图3是本发明实施例中的一种遥控器的结构示意图；
[0032]图4是本发明实施例中的一种服务器的结构示意图。
【具体实施方式】
[0033]作为一种非常方便有效的控制方法，语音控制一直是许多智能设备的优选控制方法。但是，当前的语音识别存在误识别且识别率较低的情况，会影响语音控制在智能设备控制上的广泛应用，因而智能语音识别率及效率低的问题亟待解决。
[0034]为解决上述问题，本发明实施例提供了语音控制的系统，通过有针对性的对用户的语音进行学习并识别，故可以得到关于每个用户更多的语音特征信息，从而可以提高语音控制的效率。
[0035]为使本发明的上述目的、特征和优点能够更为明显易懂，下面结合附图对本发明的具体实施例做详细的说明。
[0036]图1示出了本发明实施例中的一种语音控制的系统的结构示意图，所述系统可以包括:遥控器1、主机2及服务器3，其中:
[0037]所述遥控器1，适于对用户进行身份特征识别以获取所述用户的识别码，接收来自所述用户的语音数据，将所述用户的识别码添加至所述用户的语音数据并传输至所述主机2；
[0038]所述主机2，适于接收来自所述遥控器1的具有所述用户的识别码的语音数据，并将所述具有识别码的语音数据传输至所述服务器3，接收来自所述服务器3的语音识别结果，将所述语音识别结果转化为语音控制指令，并按照所述语音控制指令相应地执行操作；
[0039]所述服务器3，适于接收来自所述主机2的语音数据，解析得到用户的识别码，根据所述用户的识别码确定所述用户是否为新用户，当所述用户为新用户时，建立所述用户的数据库，并对所述数据库进行语音学习，当所述用户非新用户时，对已建立的所述用户的数据库进行语音学习，并根据所述用户的数据库对所述语音数据进行语音识别，得到语音识别结果，将所述语音识别结果传输至所述主机2。
[0040]在具体实施中，所述遥控器1可以通过多种方式与用户进行身份特征识别，比如可以通过人脸这种身份特征对用户进行识别，也可以通过指纹这种身份特征对用户进行识另IJ，还可以通过把人脸及指纹这两种身份特征结合对用户进行识别。
[0041]在具体实施中，所述遥控器1可以通过多种方式与所述主机2进行短距离的通讯，比如可以通过蓝牙和所述主机2连接并进行短距离的通讯，也可以通过紫蜂(Zigbee)协议与所述主机2建立连接并通讯。
[0042]为使得本领域的技术人员更好地理解和实现本发明，图2示出了本发明实施例中的一种语音控制的系统的工作流程图，以下结合图2对所述系统的工作原理进行详细介绍。
[0043]S21:遥控器对用户进行身份特征识别以获取所述用户的识别码。
[0044]在具体实施中，如图2所示，当用户4使用所述遥控器1语音控制所述主机2时，首先所述遥控器1可以设置相关的功能键，用以采集所述用户4的身份特征，并对所述身份特征进行识别，从而获取所述用户4的专属的识别码。
[0045]S22:用户发送语音数据。
[0046]S23:遥控器将所述用户的识别码添加至所述用户的语音数据。
[0047]在具体实施中，所述遥控器1可以接收来自所述用户4的语音数据，然后将所述用户4的识别码添加到所述用户4的语音数据上。
[0048]S24:遥控器将具有所述用户的识别码的所述用户的语音数据传输至所述主机。
[0049]为了节约成本，所述遥控器1无需具备无线连接功能，而所述遥控器1可以与所述主机2进行近距离的通讯，故所述遥控器1通过所述近距离的通讯方式可以把所述带有所述用户的专属的识别码的语音数据发送给所述主机2。
[0050]需要说明的，所述遥控器1可以利用以下至少一种方式对用户进行身份特征识别:人脸识别及指纹识别。并且，也可以通过以下至少一种方式与所述主机2连接:蓝牙或基于紫蜂协议的通讯。本领域技术人员可以根据实际需要进行选择，具体所述遥控器1使用哪种方式对用户进行身份识别，还是使用哪种方式与所述主机2连接，均不对本发明构成任何限制。
[0051]S25:主机接收来自所述遥控器的具有所述用户的识别码的语音数据，并将所述具有识别码的语音数据传输至所述服务器。
[0052]所述电视等主机2可以接收来自所述遥控器1的具有所述用户的识别码的语音数据，由于现在的电视等主机2设备一般均具备无线传输功能，且可以支持云端服务器3，故所述主机2可以将所述具有识别码的语音数据传输至所述服务器3，使得所述服务器3可以对所述语音数据做相应的处理。
[0053]S26:服务器接收来自所述主机的语音数据，解析得到用户的识别码，根据所述用户的识别码确定所述用户是否为新用户，当所述用户为新用户时，建立所述用户的数据库，并对所述数据库进行语音学习，当所述用户非新用户时，对已建立的所述用户的数据库进行语音学习，并根据所述用户的数据库对所述语音数据进行语音识别，得到语音识别结果。
[0054]在具体实施中，所述服务器3通过无线传输通道从所述主机2接收到语音数据之后，可以对所述语音数据进行解析，获得所述用户的识别码，接着将所述用户的识别码与系统中已有的识别码进行对比，从而确定所述用户是否为新用户。
[0055]在具体实施中，如果根据所述识别码确定所述用户为新用户时，所述服务器3可以为所述新用户建立一个专属的数据库，并对所述数据库进行语音学习，由于所述专属的数据库中仅仅包括关于所述用户的语音信息，故所述语音学习会更加有针对性，从而可以了解关于所述新用户的更多的信息，然后根据所述用户的数据库对所述语音数据进行语音识另IJ，得到更加精确的语音识别结果。
[0056]在具体实施中，而如果根据所述识别码确定所述用户并非新用户时，所述服务器3可以对已建立的所述用户的数据库进行语音学习，并根据已有的所述用户的数据库对所述语音数据进行语音识别，得到语音识别结果，由于所述数据库中已经包括了很多关于所述用户的信息，故所述语音识别结果会更加接近所述用户的真实控制意愿，也就是更加准确，从而可以提高语音控制的效率及成功率。
[0057]S27:服务器将所述语音识别结果传输至所述主机。
[0058]在具体实施中，所述服务器3可以通过所述无线通信通道将所述语音识别结果传输至所述主机2。
[0059]S28:所述主机接收来自所述服务器的语音识别结果，将所述语音识别结果转化为语音控制指令，并按照所述语音控制指令相应地执行操作。
[0060]所述主机2可以接收来自所述服务器3的语音识别的结果，但是可能所述语音识别的结果和所述主机2的实际可执行指令的格式不同，故可以接着将所述语音识别结果转化为语音控制指令，最后再按照所述语音控制指令相应地执行操作。
[0061]由上所述可知，通过遥控器1对用户进行身份特征识别以获取所述用户的识别码，将所述用户的识别码添加至所述用户的语音数据并传输至主机2，所述主机2将所述具有识别码的语音数据转发至服务器3，所述服务器3解析得到用户的识别码，根据所述用户的识别码确定所述用户是否为新用户，当所述用户为新用户时，建立所述用户的数据库，并对所述数据库进行语音学习，当所述用户非新用户时，对已建立的所述用户的数据库进行语音学习，并根据所述用户的数据库对所述语音数据进行语音识别，得到语音识别结果，将所述语音识别结果传输至所述主机2，以控制所述主机2执行与所述语音数据对应的操作，由于可以有针对性的对用户的语音进行学习并识别，故可以了解关于每个用户更多的信息，从而可以提高语音控制的效率及成功率。
[0062]在具体实施中，所述主机可以为电视、冰箱、空调、灯具等智能家电设备，也可以是电脑、平板电脑、车载终端等终端设备。可以理解的是，以上举例说明只是用于说明本发明实施例所适用的一些场景，以便于本领域技术人员理解及实施，并不用于限定本发明的保护范围，所述主机只要能够采用遥控装置进行语音遥控并与服务器进行通信即可。
[0063]为使得本领域的技术人员更好地理解和实现本发明，本发明实施例还提供了相应的遥控设备，如图3所示，在具体实施中，遥控器1可以包括:识别单元31、第一接收单元32、添加单元33及第一传输单元34，其中:
[0064]所述识别单元31，适于对用户进行身份特征识别，并获取所述用户的识别码；
[0065]所述第一接收单元32，适于接收来自所述用户的语音数据；
[0066]所述添加单元33，适于将所述识别单元31获取的所述用户的识别码添加至所述第一接收单元32接收的所述用户的语音数据；
[0067]所述第一传输单元34，适于把所述添加单元33处理后的带有所述用户识别码的用户的语音数据传输至主机2。
[0068]在具体实施中，所述识别单元31，可以采用人脸识别，也可以采用指纹指纹识别或者其他的身份特征识别方式。如图3所示，所述识别单元31可以包括以下至少一个子单元:人脸识别子单元311及指纹识别子单元312，其中:所述人脸识别子单元311，适于对对用户的人脸特征进行识别，所述指纹识别子单元312，适于对对用户的指纹特征进行识别。
[0069]在具体实施中，所述遥控器1可以通过以下至少一种方式与所述主机连接:蓝牙或基于紫蜂协议的通讯。
[0070]为使得本领域的技术人员更好地理解和实现本发明，图4示出了本发明实施例中的一种服务器3，所述服务器3可以包括:第二接收单元41、解析单元42、数据库建立单元43、语音学习单元44及第二传输单元45，其中:
[0071 ]所述第二接收单元41，适于接收来自主机2的语音数据；
[0072]所述解析单元42，适于解析得到用户的识别码，并根据所述用户的识别码确定所述用户是否为新用户；
[0073]所述数据库建立单元43，适于当所述解析单元42确定所述用户为新用户时，建立所述用户的数据库；
[0074]所述语音学习单元44，适于当所述解析单元42确定所述用户为新用户时，对所述数据库建立单元43建立的所述用户的数据库进行语音学习，并根据所述用户的数据库对所述语音数据进行语音识别，得到语音识别结果;还适于当所述解析单元42确定所述用户非新用户时，对已建立的所述用户的数据库进行语音学习，并根据所述用户的数据库对所述语音数据进行语音识别，得到语音识别结果；
[0075]所述第二传输单元45，适于将所述语音学习单元44及得到的语音识别结果传输至所述主机2。
[0076]本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于以计算机可读存储介质中，存储介质可以包括:R0M、RAM、磁盘或光盘等。
[0077]虽然本发明披露如上，但本发明并非限定于此。任何本领域技术人员，在不脱离本发明的精神和范围内，均可作各种更动与修改，因此本发明的保护范围应当以权利要求所限定的范围为准。
【主权项】
1.一种语音控制的系统，其特征在于，包括:遥控器、主机及服务器，其中:所述遥控器，适于对用户进行身份特征识别以获取所述用户的识别码，接收来自所述用户的语音数据，将所述用户的识别码添加至所述用户的语音数据并传输至所述主机；所述主机，适于接收来自所述遥控器的具有所述用户的识别码的语音数据，并将所述具有识别码的语音数据传输至所述服务器，接收来自所述服务器的语音识别结果，将所述语音识别结果转化为语音控制指令，并按照所述语音控制指令相应地执行操作；所述服务器，适于接收来自所述主机的语音数据，解析得到用户的识别码，根据所述用户的识别码确定所述用户是否为新用户，当所述用户为新用户时，建立所述用户的数据库，并对所述数据库进行语音学习，当所述用户非新用户时，对已建立的所述用户的数据库进行语音学习，并根据所述用户的数据库对所述语音数据进行语音识别，得到语音识别结果，将所述语音识别结果传输至所述主机。2.根据权利要求1所述的语音控制的系统，其特征在于，所述遥控器，适于利用以下至少一种方式对用户进行身份特征识别:人脸识别及指纹识别。3.根据权利要求1所述的语音控制的系统，其特征在于，所述遥控器，通过以下至少一种方式与所述主机连接:蓝牙或基于紫蜂协议的通讯。4.一种遥控器，其特征在于，包括: 识别单元，适于对用户进行身份特征识别，并获取所述用户的识别码；第一接收单元，适于接收来自所述用户的语音数据；添加单元，适于将所述识别单元获取的所述用户的识别码添加至所述第一接收单元接收的所述用户的语音数据；第一传输单元，适于把所述添加单元处理后的带有所述用户识别码的用户的语音数据传输至主机。5.根据权利要求4所述的遥控器，其特征在于，所述识别单元，包括以下至少一个子单元:人脸识别子单元及指纹识别子单元，其中: 所述人脸识别子单元，适于对对用户的人脸特征进行识别；所述指纹识别子单元，适于对对用户的指纹特征进行识别。6.根据权利要求4所述的遥控器，其特征在于，通过以下至少一种方式与所述主机连接:蓝牙或基于紫蜂协议的通讯。7.根据权利要求4所述的遥控器，其特征在于，所述遥控器为手机。8.一种服务器，其特征在于，包括: 第二接收单元，适于接收来自主机的语音数据；解析单元，适于解析得到用户的识别码，并根据所述用户的识别码确定所述用户是否为新用户；数据库建立单元，适于当所述解析单元确定所述用户为新用户时，建立所述用户的数据库；语音学习单元，适于当所述解析单元确定所述用户为新用户时，对所述数据库建立单元建立的所述用户的数据库进行语音学习，并根据所述用户的数据库对所述语音数据进行语音识别，得到语音识别结果;并适于当所述解析单元确定所述用户非新用户时，对已建立的所述用户的数据库进行语音学习，并根据所述用户的数据库对所述语音数据进行语音识另|J，得到语音识别结果;第二传输单元，适于将所述语音学习单元得到的语音识别结果传输至所述主机。
【专利摘要】一种语音控制的系统、遥控器及服务器，所述系统包括：遥控器、主机及服务器，其中：所述遥控器，适于对用户进行身份特征识别以获取所述用户的识别码，将所述用户的识别码添加至所述用户的语音数据并传输至所述主机；所述主机，适于将所述具有识别码的语音数据传输至所述服务器，接收来自所述服务器的语音识别结果，相应地执行操作；所述服务器，适于当所述用户为新用户时，建立所述用户的数据库，并对所述数据库进行语音学习，当所述用户非新用户时，对已建立的所述用户的数据库进行语音学习，并进行语音识别，得到语音识别结果，将所述语音识别结果传输至所述主机。采用上述方案可以提高语音识别的效率及成功率。
【IPC分类】G10L15/26, G10L15/22
【公开号】CN105489218
【申请号】CN201510828285
【发明人】乔磊, 龙涛, 滕敏
【申请人】江苏惠通集团有限责任公司
【公开日】2016年4月13日
【申请日】2015年11月24日

2012-2014专利技术

最新回复(0)