本申请属于图像处理,具体涉及一种图像生成方法及其装置。
背景技术:
::1、随着图像技术的发展,带有文字的图像(以下简称为文字图像)在生活中越来越常见,例如,海报、封面、带有文字的照片等,用户在创建文字图像时往往需要使用专业的制图软件进行复杂的操作,费时费力。2、随着生成式人工智能(artificial intelligence generated content,aigc)的发展,利用稳定扩散(stable diffusion,sd)模型,用户只需要输入一段文字就可以生成文字图像。但是,目前通过sd模型生成的文字图像中的文字仅仅是字符(字母、数字和符号)。当需要生成指定语种(例如,中文,日语和韩语等)的文字时,生成的文字图像中的文字是乱码,生成的文字图像效果较差。技术实现思路1、本申请实施例的目的是提供一种图像生成方法及其装置,能够解决生成的文字图像中的文字是乱码,生成的文字图像效果差的问题。2、第一方面,本申请实施例提供了一种图像生成方法,包括:3、接收用户的第一输入;4、根据第一输入对应的文本信息,确定第一图像的图像描述信息,其中,第一图像为根据第一输入生成的图像,图像描述信息至少包括文字信息,文字信息包括用在第一图像中添加的目标文字;5、从多个语种对应的字库文件中,确定与目标文字所属语种对应的第一字库文件;6、根据第一字库文件,绘制目标文字对应的字形图;7、根据字形图,生成第一图像。8、第二方面,本申请实施例提供了一种图像生成装置,包括:9、接收模块,用于接收用户的第一输入;10、第一确定模块,用于根据第一输入对应的文本信息,确定第一图像的图像描述信息,其中,第一图像为根据第一输入生成的图像,图像描述信息至少包括文字信息,文字信息包括在第一图像中添加的目标文字;11、第二确定模块,用于从多个语种对应的字库文件中,确定与目标文字所属语种对应的第一字库文件;12、绘制模块,用于根据第一字库文件,绘制目标文字对应的字形图;13、第一生成模块,用于根据字形图,生成第一图像。14、第三方面,本申请实施例提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如本申请实施例提供的图像生成方法的步骤。15、第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如本申请实施例提供的图像生成方法的步骤。16、第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如本申请实施例提供的图像生成方法的步骤。17、第六方面,本申请实施例提供一种计算机程序产品,所述程序产品被存储在存储介质中,所述程序产品被至少一个处理器执行以实现如本申请实施例提供的图像生成方法的步骤。18、在本申请实施例中,通过接收用户的第一输入;根据第一输入对应的文本信息,确定第一图像的图像描述信息,其中,第一图像为根据第一输入生成的图像,图像描述信息至少包括文字信息,文字信息包括在第一图像中添加的目标文字;从多个语种对应的字库文件中,确定与目标文字所属语种对应的第一字库文件;根据第一字库文件,绘制目标文字对应的字形图;根据字形图,生成第一图像。如此,用户仅需执行一个第一输入,即可根据用户的第一输入生成具有目标文字的图像,并且能够保证所生成的图像中的目标文字不是乱码,能够提高生成的文字图像的效果。技术特征:1.一种图像生成方法,其特征在于,所述方法包括:2.根据权利要求1所述的方法,其特征在于,所述根据所述字形图,生成所述第一图像之前,所述方法还包括:3.根据权利要求2所述的方法,其特征在于,所述将所述字形图和所述格式化信息进行融合,生成所述第一图像,包括:4.根据权利要求1所述的方法,其特征在于,所述图像描述信息还包括图像意图和文字添加位置;5.根据权利要求4所述的方法,其特征在于,所述根据所述文字添加位置和所述第三交并比,确定目标位置,包括:6.一种图像生成装置,其特征在于,所述装置包括:7.根据权利要求6所述的装置,其特征在于,所述装置还包括:8.根据权利要求7所述的装置,其特征在于,所述第一生成模块具体用于:9.根据权利要求6所述的装置,其特征在于,所述图像描述信息还包括图像意图和文字添加位置;10.根据权利要求9所述的装置,其特征在于,所述第三确定子模块具体用于:技术总结本申请公开了一种图像生成方法及其装置,属于图像处理
技术领域:
:。图像生成方法包括:接收用户的第一输入;根据第一输入对应的文本信息,确定第一图像的图像描述信息,其中,第一图像为根据第一输入生成的图像,图像描述信息至少包括文字信息,文字信息包括在第一图像中添加的目标文字;从多个语种对应的字库文件中,确定与目标文字所属语种对应的第一字库文件;根据第一字库文件,绘制目标文字对应的字形图;根据字形图,生成第一图像。技术研发人员:刘宝铃受保护的技术使用者:维沃移动通信有限公司技术研发日:技术公布日:2024/9/23