发明授权-2018102818605-用于高性能人脸识别系统的高质量训练数据准备系统.pdf 立即下载
2025-01-15
约4万字
约40页
0
1.6MB
举报 版权申诉
预览加载中,请您耐心等待几秒...

发明授权-2018102818605-用于高性能人脸识别系统的高质量训练数据准备系统.pdf

发明授权-2018102818605-用于高性能人脸识别系统的高质量训练数据准备系统.pdf

预览

免费试读已结束,剩余 35 页请下载文档后查看

10 金币

下载文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN108319938B
(45)授权公告日2022.05.17
(21)申请号201810281860.5(56)对比文件
CN10
(22)申请日2018.04.025138977A,2015.12.09
CN106778684A,2017.05.31
(65)同一申请的已公布的文献号CN107392125A,2017.11.24
申请公布号CN108319938ACN106446872A,2017.02.22
(43)申请公布日2018.07.24CN105654056A,2016.06.08
(30)优先权数据CN107506707A,2017.12.22
15/859,6522017.12.31USCN106407884A,2017.02.15
US2012041725A1,2012.02.16
(73)专利权人奥瞳系统科技有限公司US2008031498A1,2008.02.07
地址加拿大不列颠哥伦比亚省本拿比市巴US2016070989A1,2016.03.10
克斯特街103A,8525,V5A4V7CN106415594A,2017.02.15
(72)发明人易子立王星吴谦伟马怀宇WO2016011204A1,2016.01.21
梁杰夏洋洋等.人脸识别背后的数据清理问题
(74)专利代理机构深圳中细软知识产权代理有研究.《智能系统学报》.2017,第12卷(第5期),第
限公司44528616-622页.
专利代理师袁文英夏洋洋.基于深度学习的非限定条件下人脸
识别研究.《中国优秀硕士学位论文全文数据库
(51)Int.Cl.信息科技辑》.2017,(第7期),第I138-825页.
G06V40/16(2022.01)
G06V40/50(2022.01)审查员郑诗嘉
G06V10/774(2022.01)
G06K9/62(2022.01)权利要求书6页说明书21页附图12页
(54)发明名称准备系统和技术提供了全自动、高度确定的高质
用于高性能人脸识别系统的高质量训练数量训练数据准备程序,无需严重依赖于假设条
据准备系统件。
(57)摘要
提供了用于执行大规模人脸图像训练数据
采集、预处理、清洗、均衡化和后处理的人脸图像
训练数据准备系统的多个示例。公开的训练数据
准备系统用于从互联网采集不同的人的大量的
标注图像,然后生成包括错误标注人脸图像的原
始训练数据集。该训练数据准备系统然后对该原
始训练数据集执行清洗和均衡化操作,从而生成
不具有错误标注的高质量人脸图像训练数据集。
已处理的高质量人脸图像训练数据集随后可用
于训练基于深度神经网络的人脸识别系统,从而
在多种人脸识别应用中实现高性能。与传统的人
CN108319938B
脸识别系统和技术相比,本申请公开的训练数据
CN108319938B权利要求书1/6页

1.一种用于为人脸识别系统准备高质量人脸图像训练数据的方法,其特征在于,所述
方法包括:
接收训练数据集,所述训练数据集包括与多个身份相关的多组相同标注人脸图像;其
中每组相同标注人脸图像均标注有所述多个身份中的一个身份;所述训练数据集还包括不
良图像子集;
对于所述训练数据集中分别对应每个身份的每组相同标注人脸图像:
识别该组相同标注人脸图像中的不良图像子集;
生成所述身份的不包括所述不良图像子集的一组干净的相同标注人脸图像;以及
合并干净的对应于多个身份的多组相同标注人脸图像,获得干净的训练数据集,用于
训练人脸识别模型;
其中,所述识别该组相同标注人脸图像中的不良图像子集,包括:
在该组相同标注人脸图像内识别出高度相似图像子集,并将所述高度相似图像子集作
为第一参考图像集;
将该组相同标注人脸图像内不属于所述第一参考图像集的图像设定为第一候选图像
集;以及
基于所述第一参考图像集,从所述第一候选图像集中识别出不良图像子集;
其中,从所述第一候选图像集中识别出不良图像子集的步骤包括:
在第一候选图像集中识别出符合再收集条件的第一图像子集以及不符合再收集条件
的第二图像子集;以及
在所述不符合再收集条件的第二图像子集中识别出不良图像子集;
其中,在第一候选图像集中识别出符合再收集条件的第一图像子集包括:
对于所述第一候选图像集中的每张图像:
获得所述图像与所述第一参考图像集中的每张图像之间的一组相似度分数;以及
计算出所述图像相对于所述第一参考图像集的总相似度分数;以及
将第二阈值应用于该组总相似度分数,用于将所述第一候选图像集划分为符合再收集
条件的第一图像子集和不符合再收集条件的第二图像子集。
2.根据权利要求1所述的方法,其特征在于,在该组相同标注人脸图像内识别出高度相
似图像子集,并将所述高度相似图像子集作为
查看更多
单篇购买
VIP会员(1亿+VIP文档免费下)

扫码即表示接受《下载须知》

发明授权-2018102818605-用于高性能人脸识别系统的高质量训练数据准备系统

文档大小:1.6MB

限时特价:扫码查看

• 请登录后再进行扫码购买
• 使用微信/支付宝扫码注册及付费下载,详阅 用户协议 隐私政策
• 如已在其他页面进行付款,请刷新当前页面重试
• 付费购买成功后,此文档可永久免费下载
全场最划算
12个月
199.0
¥360.0
限时特惠
3个月
69.9
¥90.0
新人专享
1个月
19.9
¥30.0
24个月
398.0
¥720.0
6个月会员
139.9
¥180.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用