一种制药软袋薄膜字符智能切分的方法
【技术领域】
[0001 ]本发明涉及一种制药软袋薄膜字符智能切分的方法。
【背景技术】
[0002] 大冢制药软袋薄膜是输液药品的包装袋,在灌装密封之前需要检测薄膜上打印的 字符,杜绝未喷打字符、喷打错误字符,重打、喷打字符不清楚等现象。在识别字符之前,需 要提取字符模板来训练人工神经网络(以下简称神经网络)。
[0003] 目前,字符模板的提取一种方法是利用开闭运算等形态学算法,但算法稳定性差, 适用性不强,易受字符图像质量的影响。另一种是手动切分,即人工手动在图像上圈定单个 字符,这种方法实现简单,但圈定的字符区域因人而异,虽然人员操作之前经过培训,可还 是导致标准不统一造成的模板失效等问题。以上两种方法都存在很大不足。
【发明内容】
[0004] 针对上述问题,本发明的目的是提供一种制药软袋薄膜字符智能切分的方法。本 发明的技术方案如下:
[0005] 下面结合附图和实施例对本发明的进行详细的描述。
[0006] -种制药软袋薄膜字符智能切分的方法,包括下列步骤:
[0007 ] 1)采集一张制药软袋薄膜字符图像。
[0008] 2)计算单个字符单个字符宽度、字符高度的粗略值,方法如下:
[0009] a)圈定一行字符区域,锁定计算区域;
[0010] b)经过图像预处理得到更加精确的字符区域;
[0011] c)根据b)步骤得到的字符区域的整体的宽度、高度平均求得单个字符宽度、字符 高度,此时只是粗略值;
[0012] 3)应用模式匹配方法将符合特征向量的字符分割开来;
[0013] 4)比较分割的字符个数是否与实际的字符个数相等,如果不相等,则修正字符宽 度和字符高度,若所得字符个数小于产品批号的实际字符个数,则减小字符宽度,反之增加 字符宽度;返回步骤3)重新应用模式匹配,直到每个字符全部分开,得到字符宽度和字符高 度的精确值,此过程称为迭代;
[0014] 5)应用精确的字符宽度和字符高度去匹配整个图像的字符,将符合要求的所有字 符分割出来。
[0015] 本发明由于采取以上技术方案,其具有以下优点:
[0016] (1)本发明相比于以往手动切分,特别是大量字符存在的情况下,非常方便和准 确,并且易于维护。
[0017] (2)本发明能够实现切分出来的模板标准统一,不会出现受员工主观性影响导致 的模板库失效问题。
【附图说明】
[0018]图1是大冢制药软袋薄膜字符图;
[0019]图2是需要处理的字符区域;
[0020] 图3是消除多余边界的字符区域;
[0021] 图4是没有完全将字符分割出来的图像;
[0022] 图5是整行完全将字符分割出来的图像;
[0023] 图6是整个图像的字符分割;
【具体实施方式】
[0024]下面结合附图和实施例对本发明的进行详细的描述。
[0025] 1)采集一张制药软袋薄膜字符图像。如图1所示,图像中共有3行字符,分别是生产 批号、生产日期和有效期。
[0026] 2)计算单个字符的精确宽度和高度,方法如下:
[0027] a)手动圈定一行字符区域,锁定计算区域;
[0028] b)应用中值滤波和动态阈值处理得到更加精确的字符区域;
[0029 ] c)根据b)步骤得到的字符区域整体的宽度、高度平均求得单个字符宽度、字符高 度,此时只是粗略值;
[0030] d)应用模式匹配方法将符合特征向量的字符分割开来。模式匹配需要的特征向量 共14种,分别为:
[0031] 1,字符高度:单个字符的高度;
[0032] 2,字符宽度:单个字符的宽度;
[0033] 3,喷墨点宽度:字符打印的笔画宽度;
[0034] 4,字符高度最大偏差比例:字符高度允许在2中的字符宽度上下偏差的范围;
[0035] 5,极性:字符为黑色,背景为白色或者反之;
[0036] 6,最大行数:字符的最大行数;
[0037] 7,英文字母大写标志量:字符中若存在英文字符,是否全部是大写;
[0038] 8,点打标志量:字符打印效果是否是一个个点组成;
[0039] 9,是否有反射标志量:字符局部是否存在反光;
[0040] 10,水平结构标志量:字符串是否是水平排列;
[0041] 11,是否存在分隔符标志量:字符之间是否存在或'='符号;
[0042]12,是否存在逗号引号标志量:字符之间是否存在','或':'符号;
[0043] 13,是否存在断点标量:例如字符' i '上面的点可能按噪声处理;
[0044] 14,字符结构:例如字符串2013.08.18,字符结构为422,4代表2013,两个2分别代 表08和18,即个数;
[0045] e)比较d)中分割的字符个数是否与实际的字符个数相等,如果不相等,则小幅度 修正d)中的字符宽度和字符高度,若所得字符个数小于产品批号的实际字符个数,则减小 字符宽度,反之增加字符宽度,返回步骤d重新应用模式匹配,直到每个字符全部分开时,得 到字符宽度和字符高度的精确值,此过程称为迭代,迭代得到单个字符的字符宽度和字符 高度的精确值;
[0046] 3)应用e中得到的精确的字符宽度和字符高度去匹配整个图像的字符,将符合要 求的所有字符分割出来。
【主权项】
1. 一种制药软袋薄膜字符智能切分的方法,包括下列步骤: 1) 采集一张制药软袋薄膜字符图像。 2) 计算单个字符单个字符宽度、字符高度的粗略值,方法如下: a) 圈定一行字符区域,锁定计算区域; b) 经过图像预处理得到更加精确的字符区域; c) 根据b)步骤得到的字符区域的整体的宽度、高度平均求得单个字符宽度、字符高度, 此时只是粗略值; 3) 应用模式匹配方法将符合特征向量的字符分割开来; 4) 比较分割的字符个数是否与实际的字符个数相等,如果不相等,则修正字符宽度和 字符高度,若所得字符个数小于产品批号的实际字符个数,则减小字符宽度,反之增加字符 宽度;返回步骤3)重新应用模式匹配,直到每个字符全部分开,得到字符宽度和字符高度的 精确值,此过程称为迭代; 5) 应用精确的字符宽度和字符高度去匹配整个图像的字符,将符合要求的所有字符分 割出来。2. 根据权利要求1所述的一种制药软袋薄膜字符智能切分的方法,其特征在于,步骤3) 中采用的特征向量为: ① 字符高度:单个字符的高度; ② 字符宽度:单个字符的宽度; ③ 喷墨点宽度:字符打印的笔画宽度; ④ 字符高度最大偏差比例:字符高度允许在②中的字符宽度上下偏差的范围; ⑤ 极性:字符为黑色,背景为白色或者反之; ⑥ 最大行数:字符的最大行数; ⑦ 英文字母大写标志量:字符中若存在英文字符,是否全部是大写; ⑧ 点打标志量:字符打印效果是否是一个个点组成; ⑨ 是否有反射标志量:字符局部是否存在反光; ⑩ 水平结构标志量:字符串是否是水平排列; U1是否存在分隔符标志量; 12是否存在逗号或引号标志量; i3是否存在断点标量; 字符结构。
【专利摘要】本发明涉及一种制药软袋薄膜字符智能切分的方法,包括:采集一张制药软袋薄膜字符图像;计算单个字符单个字符宽度、字符高度的粗略值;应用模式匹配方法将符合特征向量的字符分割开来;比较分割的字符个数是否与实际的字符个数相等,如果不相等,则修正d)中的字符宽度和字符高度,若所得字符个数小于产品批号的实际字符个数,则减小字符宽度,反之增加字符宽度;重新应用模式匹配,直到每个字符全部分开,得到字符宽度和字符高度的精确值;应用精确的字符宽度和字符高度去匹配整个图像的字符,将符合要求的所有字符分割出来。本发明可以精确地进行字符切分。
【IPC分类】G06K9/34
【公开号】CN105488508
【申请号】CN201510870461
【发明人】郭大庆, 于振, 任海燕, 马永发
【申请人】天津普达软件技术有限公司
【公开日】2016年4月13日
【申请日】2015年12月1日