本发明涉及语音处理,具体涉及一种应急语言自动生成方法。
背景技术:
1、随着人工智能和语音合成技术的发展,自动生成语音已经成为信息传递的重要手段。在紧急情况下,如自然灾害、事故现场或安全预警中,及时、准确地传达关键信息至关重要。传统的语音合成系统通常关注于语音的自然度和清晰度,但在应急情境下,除了这些基本要求之外,还需要确保信息的紧迫性和重要性能够得到有效的传达。
2、现有的语音合成系统往往缺乏对应急语言特点的充分考虑,例如在紧急情况下,某些关键词汇需要被强调以引起听众的注意,而传统系统可能无法做到这一点。
技术实现思路
1、针对现有技术中的上述不足,本发明提供的一种应急语言自动生成方法解决了现有的语音合成技术缺乏强调关键信息的能力的问题。
2、为了达到上述发明目的,本发明采用的技术方案为:一种应急语言自动生成方法,包括以下步骤:
3、s1、将应急语言文本拆分成句;
4、s2、根据每句文本中词关注度和句重要度,得到每个词情绪值;
5、s3、根据各个词情绪值,基于幅值调整函数和语速调整函数,配置待生成语音中对应词的幅值和语速;
6、s4、根据待生成语音中对应词的幅值和语速,将待生成语音分成幅值异常段、语速异常段和正常段;
7、s5、对幅值异常段和语速异常段进行优化,结合正常段,生成应急语言语音。
8、本发明的有益效果为:本发明通过分析应急文本中的词关注度和句重要度,分配每个词的词情绪值,根据每个词的词情绪值,通过幅值调整函数和语速调整函数,对每个词赋予幅值和语速,考虑到听众的舒适度,筛选出幅值异常段和语速异常段,对幅值异常段和语速异常段进行优化处理,使得生成的语音在保持自然度的同时,也具有让听众舒适的感觉。本发明考虑每个词的词情绪值,同时考虑语音舒适性,使得生成的应急语言语音具备强调关键信息的能力,同时使得听众舒适。
9、进一步地,所述s2包括以下分步骤:
10、s21、统计每句文本中的词在应急语言文本中出现次数;
11、s22、根据词出现次数和词重要度,计算词关注度;
12、s23、将每句文本中各词关注度累加,得到句重要度;
13、s24、根据句重要度,对每句文本分配基础情绪值;
14、s25、根据每句文本的基础情绪值和词关注度,计算词情绪值。
15、上述进一步地方案的有益效果为:本发明根据词出现次数和词重要度,计算词关注度,从而得到每句文本的句重要度,对每句文本分配基础情绪值,再结合词关注度,得到每个词的词情绪值,体现每个词在语音中的重要性。
16、进一步地,所述s22中计算词关注度的公式为:,其中,wordsm为第m个词的关注度,rm为第m个词在应急语言文本中出现次数,zm为第m个词的词重要度,m为正整数,zth为词重要度门限。
17、上述进一步地方案的有益效果为:本发明在计算词关注度时,在词重要度低于词重要度门限时,该词可能属于常用的连接词等,赋予的词关注度为0,在词重要度大于词重要度门限时,该词出现次数越高,词关注度越高。
18、进一步地,所述s24中分配基础情绪值的公式为:,其中,ei为第i句文本的基础情绪值,si为第i句文本的句重要度,i为正整数,n为应急语言文本中句子数量,h为情绪值长度。
19、上述进一步地方案的有益效果为:本发明根据每句文本的句重要度的占比,对各句文本分配基础情绪值。
20、进一步地,所述s25中计算词情绪值的公式为:,其中,cm为每句文本中第m个词的词情绪值,wordsm为第m个词的关注度,ei为第i句文本的基础情绪值,ε为分母系数,m为正整数。
21、上述进一步地方案的有益效果为:本发明为各句文本分配了基础情绪值,再结合每个词的关注度,分配不同的词情绪值,实现不同关键词具备不同的词情绪值。
22、进一步地,所述s3中幅值调整函数的表达式为:,其中,fm为待生成语音中第m个词的幅值,cm为每句文本中第m个词的词情绪值,fo为基础幅值,e为自然常数,μ1为第一调节系数;
23、所述s3中语速调整函数的表达式为:,其中,vm为待生成语音中第m个词的语速,vo为基础语速,μ2为第二调节系数。
24、上述进一步地方案的有益效果为:本发明构建幅值调整函数,实现根据不同词的词情绪值分配不同幅值,使得词情绪值高的词具备高的幅值,构建语速调整函数,实现根据不同词的词情绪值分配不同语速,使得词情绪值高的词具备较缓的讲解语速。
25、进一步地,所述s4包括以下分步骤:
26、s41、设置长度为l的滑动窗口,采用滑动窗口在待生成语音上滑动,每次滑动时,覆盖l个词;
27、s42、在每次滑动时,计算幅值变化系数和语速变化系数;
28、s43、在幅值变化系数大于第一阈值时,标注滑动窗口下该段语音为幅值异常段;
29、s44、在语速变化系数大于第二阈值时,标注滑动窗口下该段语音为语速异常段;
30、s45、在幅值变化系数小于等于第一阈值,且语速变化系数小于等于第二阈值时,标注滑动窗口下该段语音为正常段。
31、进一步地,所述s42中计算幅值变化系数和语速变化系数的公式均为:,其中,α为幅值变化系数或语速变化系数,xm为滑动窗口下第m个词的幅值或滑动窗口下第m个词的语速,m为正整数,| |为绝对值运算。
32、上述进一步地方案的有益效果为:本发明滑动窗口每次前进1个词距离,根据滑动窗口每次滑动后,滑动窗口下所覆盖的l个词,计算出l个词的幅值变化系数和语速变化系数,找到幅值或语速剧烈变化的段。
33、进一步地,所述s5包括以下分步骤:
34、s51、根据幅值异常段的幅值变化系数,对幅值异常段进行幅值优化处理;
35、s52、根据语速异常段的语速变化系数,对语速异常段进行语速优化处理;
36、s53、根据优化处理后的幅值和语速,结合正常段的幅值和语速,生成应急语言语音。
37、进一步地,所述s51中优化处理的公式为:,其中,为第m个词优化后的幅值,为幅值异常段中滑动窗口所覆盖的第m个词的幅值,αf为幅值变化系数,m为正整数;
38、所述s52中优化处理的公式为:,其中,为第m个词优化后的语速,为语速异常段中滑动窗口所覆盖的第m个词的语速,αv为语速变化系数。
39、上述进一步地方案的有益效果为:本发明根据幅值异常段的幅值变化系数,结合词的幅值和该滑动窗口下的均值,对幅值异常段进行幅值优化,使得整体变化趋于平缓。本发明根据语速异常段的语速变化系数,结合词的语速和该滑动窗口下的均值,对语速异常段进行语速优化,使得整体变化趋于平缓。通过语速和幅值的调整,提高听众舒适度。
1.一种应急语言自动生成方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的应急语言自动生成方法,其特征在于,所述s2包括以下分步骤:
3.根据权利要求2所述的应急语言自动生成方法,其特征在于,所述s22中计算词关注度的公式为:,其中,wordsm为第m个词的关注度,rm为第m个词在应急语言文本中出现次数,zm为第m个词的词重要度,m为正整数,zth为词重要度门限。
4.根据权利要求2所述的应急语言自动生成方法,其特征在于,所述s24中分配基础情绪值的公式为:,其中,ei为第i句文本的基础情绪值,si为第i句文本的句重要度,i为正整数,n为应急语言文本中句子数量,h为情绪值长度。
5.根据权利要求2所述的应急语言自动生成方法,其特征在于,所述s25中计算词情绪值的公式为:,其中,cm为每句文本中第m个词的词情绪值,wordsm为第m个词的关注度,ei为第i句文本的基础情绪值,ε为分母系数,m为正整数。
6.根据权利要求1所述的应急语言自动生成方法,其特征在于,所述s3中幅值调整函数的表达式为:,其中,fm为待生成语音中第m个词的幅值,cm为每句文本中第m个词的词情绪值,fo为基础幅值,e为自然常数,μ1为第一调节系数;
7.根据权利要求1所述的应急语言自动生成方法,其特征在于,所述s4包括以下分步骤:
8.根据权利要求7所述的应急语言自动生成方法,其特征在于,所述s42中计算幅值变化系数和语速变化系数的公式均为:,其中,α为幅值变化系数或语速变化系数,xm为滑动窗口下第m个词的幅值或滑动窗口下第m个词的语速,m为正整数,| |为绝对值运算。
9.根据权利要求7所述的应急语言自动生成方法,其特征在于,所述s5包括以下分步骤:
10.根据权利要求9所述的应急语言自动生成方法,其特征在于,所述s51中优化处理的公式为:,其中,为第m个词优化后的幅值,为幅值异常段中滑动窗口所覆盖的第m个词的幅值,αf为幅值变化系数,m为正整数;