文本区域检测模型训练方法、装置、电子设备和存储介质.pdf 立即下载
2023-11-14
约2.2万字
约24页
0
922KB
举报 版权申诉
预览加载中,请您耐心等待几秒...

文本区域检测模型训练方法、装置、电子设备和存储介质.pdf

201910882963.pdf

预览

免费试读已结束,剩余 19 页请下载文档后查看

10 金币

下载文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110610166A(43)申请公布日2019.12.24(21)申请号201910882963.1(22)申请日2019.09.18(71)申请人北京猎户星空科技有限公司地址100025北京市朝阳区姚家园南路一号惠通时代广场8号(72)发明人王杰肖航(74)专利代理机构北京同达信恒知识产权代理有限公司11291代理人朱佳(51)Int.Cl.G06K9/00(2006.01)权利要求书2页说明书16页附图5页(54)发明名称文本区域检测模型训练方法、装置、电子设备和存储介质(57)摘要本申请涉及图像识别领域,特别涉及一种文本区域检测模型训练方法、装置、电子设备和存储介质,用以解决现有技术检测效率低的技术问题。该方法包括:根据文本标注数据,提取出候选文本区域;计算候选文本区域中各个像素点与指定参考位置之间的相对距离值;将相对距离值映射为第一概率值,将第一概率值集合作为样本图像的标注数据,对卷积神经网络进行训练,得到文本区域检测模型。这样,采用本申请训练后的卷积神经网络,对待检测图像进行检测时,更充分地保留了边界处细节信息,检测准确度更高,也无需再基于广度优先搜索执行多次搜索过程,检测速度更快。CN110610166ACN110610166A权利要求书1/2页1.文本区域检测模型训练方法,其特征在于,所述方法包括:获取样本图像,并根据所述样本图像对应的文本标注数据,在所述样本图像中提取出候选文本区域;分别计算所述候选文本区域中各个像素点与所述样本图像中指定参考位置之间的相对距离值;将所述候选文本区域内的各个像素点的相对距离值分别映射为相应的第一概率值,得到所述样本图像对应的第一概率值集合,所述第一概率值表征相应的像素点可能为文本信息的概率;将所述第一概率值集合作为所述样本图像的标注数据,对卷积神经网络进行训练,得到文本区域检测模型。2.如权利要求1所述的方法,其特征在于,所述获取样本图像,包括:获取多个应用场景类别下的样本图像。3.如权利要求1所述的方法,其特征在于,所述获取样本图像,包括:获取第一应用场景类别下的样本图像;在得到文本区域检测模型之后,还包括:获取第二应用场景类别的样本图像;根据所述第二应用场景类别的样本图像,对已得到的文本区域检测模型进行训练,得到适用于所述第二应用场景类别的文本区域检测模型。4.如权利要求1所述的方法,其特征在于,根据所述样本图像对应的文本标注数据,在所述样本图像中提取出候选文本区域,具体包括:根据所述文本标注数据,将被标记为文本的像素点的像素值设置为第一像素值,将未被标记为文本的像素点的像素值设置为不同于所述第一像素值的第二像素值;将被设置为所述第一像素值的像素点组成的区域提取为候选文本区域。5.如权利要求1所述的方法,其特征在于,计算所述候选文本区域中各个像素点与所述样本图像中指定参考位置之间的相对距离值,具体包括:所述指定参考位置为所述候选文本区域的边界,对于所述候选文本区内的任一像素点,计算所述像素点到所述边界的最近距离,以及将所述最近距离作为所述像素点对应的相对距离值;或者,所述指定参考位置为所述候选文本区域的中心像素点,对于所述候选文本区域内的任一像素点,计算所述像素点到所述中心像素点的距离,以及将所述距离作为所述相对距离值。6.如权利要求1所述的方法,其特征在于,将所述候选文本区域内的各个像素点的相对距离值分别映射为相应的第一概率值,具体包括:在所述候选文本区域内的各个像素点对应的相对距离值中,确定出最大值;对于所述候选文本区内的任一像素点,基于所述像素点的所述相对距离值与所述最大值的差值,结合预设的控制参数,计算所述像素点的第一概率值;或者,对于所述候选文本区内的任一像素点,基于所述像素点的所述相对距离值,结合预设的控制参数,计算所述像素点的第一概率值。2CN110610166A权利要求书2/2页7.如权利要求6所述的方法,其特征在于,得到所述样本图像对应的第一概率值集合,还包括:将所述样本图像中的非候选文本区域内的各个像素点对应的第一概率值设置为0;将所述候选文本区域内的各个像素点对应的第一概率值与所述非候选文本区域内的各个像素点对应的第一概率值,形成所述第一概率值集合。8.文本区域检测模型训练装置,其特征在于,包括:提取单元,用于获取样本图像,并根据所述样本图像对应的文本标注数据,在所述样本图像中提取出候选文本区域;转换单元,用于分别计算所述候选文本区域中各个像素点与所述样本图像中指定参考位置之间的相对距离值;映射单元,用于将所述候选文本区域内的各个像素点的相对距离值分别映射为相应的第一概率值,得到所述样本图像对应的第一概率值集合,所述第一概率值表征相应的像素点可能为文本信息的概率;训练单元,用于
查看更多
单篇购买
VIP会员(1亿+VIP文档免费下)

扫码即表示接受《下载须知》

文本区域检测模型训练方法、装置、电子设备和存储介质

文档大小:922KB

限时特价:扫码查看

• 请登录后再进行扫码购买
• 使用微信/支付宝扫码注册及付费下载,详阅 用户协议 隐私政策
• 如已在其他页面进行付款,请刷新当前页面重试
• 付费购买成功后,此文档可永久免费下载
全场最划算
12个月
199.0
¥360.0
限时特惠
3个月
69.9
¥90.0
新人专享
1个月
19.9
¥30.0
24个月
398.0
¥720.0
6个月会员
139.9
¥180.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用