文档生成方法、装置、设备和存储介质与流程

xiaoxiao10天前  18


本发明涉及数据处理,尤其涉及一种文档生成方法、装置、设备和存储介质。


背景技术:

1、在文档编辑领域的许多场景中,需要基于超文本置标语言(hypertext markuplanguage,html)文档内容生成docx文档,docx是word2007之后使用的文档文件格式。

2、现有技术中,html文档生成docx文档的方式是将一整个html文档输入至文档生成工具(例如docx4j-importxhtml,一种可以将html文件转换为docx文件的工具)中,对应地,工具会输出对应的一整篇docx文档。

3、然而,由于是输入一整个html文档对应输出一整篇docx文档,所以无法对其内容做功能性的区分,也就无法独立控制不同的功能部分,对于比较复杂场景,无法做精细化控制操作,灵活性较差。


技术实现思路

1、本发明提供一种文档生成方法、装置、设备和存储介质,用以解决现有技术中灵活性较差的缺陷,提升了文档生成的灵活性。

2、第一方面,本发明提供一种文档生成方法,该方法包括:

3、获取至少一个第一文档片段;

4、针对任一所述第一文档片段,根据所述第一文档片段的第一类型和预设的渲染配置信息列表,确定所述第一文档片段对应的第一渲染配置信息;所述预设的渲染配置信息列表用于存储文档片段的类型和对应的渲染配置信息;

5、根据所述第一文档片段对应的第一渲染配置信息,对所述第一文档片段进行渲染,得到所述第一文档片段的目标渲染结果;

6、基于各所述第一文档片段的目标渲染结果,生成目标文档。

7、可选地,所述针对任一所述第一文档片段,根据所述第一文档片段的第一类型和预设的渲染配置信息列表,确定所述第一文档片段对应的第一渲染配置信息,包括:

8、将所述第一文档片段的第一类型与所述预设的渲染配置信息列表中的文档片段的类型进行匹配;

9、将匹配成功的文档片段的类型对应的渲染配置信息,确定为所述第一文档片段对应的第一渲染配置信息。

10、可选地,在所述文档片段的类型为前言类型和/或注释类型的情况下,所述前言类型和/或注释类型对应的第二渲染配置信息为样式配置信息;所述样式配置信息包括字体、字号、段落行间距和段落首行缩进中至少一项;

11、在所述文档片段的类型为正文类型的情况下,所述正文类型对应的渲染配置信息包含样式配置信息和内容配置信息;所述内容配置信息包括替换文字、增加文字和删除文字中至少一项;

12、根据所述前言类型和/或注释类型对应的渲染配置信息,以及所述正文类型对应的渲染配置信息,确定所述预设的渲染配置信息列表。

13、可选地,所述第一渲染配置信息包含样式配置信息和内容配置信息;所述根据所述第一文档片段对应的第一渲染配置信息,对所述第一文档片段进行渲染,得到所述第一文档片段的目标渲染结果,包括:

14、利用所述样式配置信息对所述第一文档片段进行样式渲染,得到样式渲染后的第一文档片段;

15、利用所述内容配置信息,对所述样式渲染后的第一文档片段进行内容渲染,得到所述第一文档片段的渲染结果。

16、可选地,所述获取至少一个第一文档片段,包括:

17、获取第一文档;

18、基于预设的片段标记对所述第一文档进行切片分段,得到所述至少一个第一文档片段。

19、获取第一文档,所述第一文档为超文本置标语言html文档;

20、对所述第一文档进行分段,得到所述至少一个第一文档片段。

21、可选地,所述针对任一所述第一文档片段,根据所述第一文档片段的第一类型和预设的渲染配置信息列表,确定所述第一文档片段对应的第一渲染配置信息之前,还包括:

22、针对各所述第一文档片段,根据所述第一文档片段的第一注释信息以及所述预设的注释信息列表,确定各所述第一文档片段的第一类型;

23、其中,所述预设的注释信息列表中包含各所述文档片段的类型以及各所述文档片段的类型对应的注释信息。

24、可选地,所述第一文档为html文档,所述基于各所述第一文档片段的目标渲染结果,生成目标文档,包括:

25、将各所述html文档片段的目标渲染结果写入空白的预设文档模板中;

26、将写入目标渲染结果后的预设文档确定为所述目标文档;所述目标文档为docx文档。

27、第二方面,本发明还提供一种文档生成装置,该装置包括:

28、获取模块,用于获取至少一个第一文档片段;

29、确定模块,用于针对任一所述第一文档片段,根据所述第一文档片段的第一类型和预设的渲染配置信息列表,确定所述第一文档片段对应的第一渲染配置信息;所述预设的渲染配置信息列表用于存储文档片段的类型和对应的渲染配置信息;

30、生成模块,用于根据所述第一文档片段对应的第一渲染配置信息,对所述第一文档片段进行渲染,得到所述第一文档片段的目标渲染结果;将各所述第一文档片段的目标渲染结果写入第二文档中,生成目标文档;基于各所述第一文档片段的目标渲染结果,生成目标文档。

31、第三方面,本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述文档生成方法。

32、第四方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述文档生成方法。

33、第五方面,本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述文档生成方法。

34、本发明提供的文档生成方法、装置、设备和存储介质,通过获取至少一个第一文档片段;然后,针对任一第一文档片段,根据第一文档片段的第一类型和预设的渲染配置信息列表,确定第一文档片段对应的第一渲染配置信息,其中,预设的渲染配置信息列表用于文档片段的类型对应的渲染配置信息;进而,根据第一文档片段对应的第一渲染配置信息,对第一文档片段进行渲染,得到第一文档片段的目标渲染结果;之后,基于各第一文档片段的目标渲染结果,生成目标文档。

35、本发明中因是针对各个第一文档片段逐个片段进行配置信息确定以及基于各第一文档片段对应的配置信息对第一文档片段进行渲染,先得到各第一文档片段的目标渲染结果,进而,基于各第一文档片段的目标渲染结果生成目标文档,本发明中因采用对先对各第一文档片段进行逐段渲染而后再拼接的方式生成目标文档,提升了文档生成的灵活性。



技术特征:

1.一种文档生成方法,其特征在于,包括:

2.根据权利要求1所述的文档生成方法,其特征在于,所述针对任一所述第一文档片段,根据所述第一文档片段的第一类型和预设的渲染配置信息列表,确定所述第一文档片段对应的第一渲染配置信息,包括:

3.根据权利要求2所述的文档生成方法,其特征在于,在所述文档片段的类型为前言类型和/或注释类型的情况下,所述前言类型和/或注释类型对应的渲染配置信息为样式配置信息;所述样式配置信息包括字体、字号、段落行间距和段落首行缩进中至少一项;

4.根据权利要求1所述的文档生成方法,其特征在于,所述第一渲染配置信息包含样式配置信息和内容配置信息;所述根据所述第一文档片段对应的第一渲染配置信息,对所述第一文档片段进行渲染,得到所述第一文档片段的目标渲染结果,包括:

5.根据权利要求1-4任一项所述的文档生成方法,其特征在于,所述获取至少一个第一文档片段,包括:

6.根据权利要求1-4任一项所述的文档生成方法,其特征在于,所述针对任一所述第一文档片段,根据所述第一文档片段的第一类型和预设的渲染配置信息列表,确定所述第一文档片段对应的第一渲染配置信息之前,还包括:

7.根据权利要求1-4任一项所述的文档生成方法,其特征在于,所述第一文档为html文档,所述基于各所述第一文档片段的目标渲染结果,生成目标文档,包括:

8.一种文档生成装置,其特征在于,包括:

9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述文档生成方法。

10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述文档生成方法。


技术总结
本发明属于数据处理技术领域,提供一种文档生成方法、装置、设备和存储介质,所述方法包括:获取至少一个第一文档片段;针对任一第一文档片段,根据第一文档片段的第一类型和预设的渲染配置信息列表,确定第一文档片段对应的第一渲染配置信息;预设的渲染配置信息列表用于存储文档片段的类型和对应的渲染配置信息;根据第一文档片段对应的第一渲染配置信息,对第一文档片段进行渲染,得到第一文档片段的目标渲染结果;基于各第一文档片段的目标渲染结果,生成目标文档。本发明中因采用对先对各第一文档片段进行逐段渲染而后再拼接的方式生成目标文档,提升了文档生成的灵活性。

技术研发人员:王泓崴,刘炜炜
受保护的技术使用者:奇安信科技集团股份有限公司
技术研发日:
技术公布日:2024/9/23

最新回复(0)