




如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号CN117094327A (43)申请公布日2023.11.21 (21)申请号202311075907.XG06N3/045(2023.01) (22)申请日2023.08.25G06N3/08(2023.01) (71)申请人杭银消费金融股份有限公司 地址310000浙江省杭州市拱墅区潮鸣街 道庆春路38号8层(801、802、803、804 室)、9层、11层(1101、1102室)(自主申 报) (72)发明人李恒奎陈辰王震 (74)专利代理机构浙江维创盈嘉专利代理有限 公司33477 专利代理师李博 (51)Int.Cl. G06F40/30(2020.01) G06Q40/03(2023.01) G06F16/35(2019.01) 权利要求书2页说明书9页附图4页 (54)发明名称 一种人行征信报告敏感词识别方法及系统 (57)摘要 本申请公开了一种人行征信报告敏感词识 别方法及系统。其首先获取待处理人行征信报 告,然后,对所述待处理人行征信报告进行敏感 词识别以得到敏感词识别结果。这样,可以通过 对人行征信报告进行语义编码以得到所述人行 征信报告中各个词的语义信息,进而在语义空间 中与各个敏感词的语义信息进行语义匹配以判 断所述人行征信报告中各个词是否为敏感词,进 而提高对敏感词的检测能力。 CN117094327A CN117094327A权利要求书1/2页 1.一种人行征信报告敏感词识别方法,其特征在于,包括: 获取待处理人行征信报告;以及 对所述待处理人行征信报告进行敏感词识别以得到敏感词识别结果。 2.根据权利要求1所述的人行征信报告敏感词识别方法,其特征在于,对所述待处理人 行征信报告进行敏感词识别以得到敏感词识别结果,包括: 从所述待处理人行征信报告提取待处理人行征信报告文本信息; 对所述待处理人行征信报告文本信息进行预处理以得到预处理后人行征信报告文本 信息;以及 对所述预处理后人行征信报告文本信息进行敏感词识别以得到所述敏感词识别结果。 3.根据权利要求2所述的人行征信报告敏感词识别方法,其特征在于,对所述预处理后 人行征信报告文本信息进行敏感词识别以得到所述敏感词识别结果,包括: 对所述预处理后人行征信报告文本信息进行分词处理以得到人行征信报告描述词的 序列; 将所述人行征信报告描述词的序列通过基于转换器的BERT模型以得到各个人行征信 报告描述词特征向量;以及 对所述各个人行征信报告描述词特征向量进行基于语义匹配的敏感词识别以得到所 述敏感词识别结果。 4.根据权利要求3所述的人行征信报告敏感词识别方法,其特征在于,将所述人行征信 报告描述词的序列通过基于转换器的BERT模型以得到各个人行征信报告描述词特征向量, 包括: 使用所述基于转换器的BERT模型的嵌入层将所述人行征信报告描述词的序列中各个 人行征信报告描述词映射到词向量以获得人行征信报告描述词向量的序列;以及 将所述人行征信报告描述词向量的序列输入所述基于转换器的BERT模型进行基于全 局的上下文语义编码以获得所述各个人行征信报告描述词特征向量。 5.根据权利要求4所述的人行征信报告敏感词识别方法,其特征在于,对所述各个人行 征信报告描述词特征向量进行基于语义匹配的敏感词识别以得到所述敏感词识别结果,包 括: 计算所述各个人行征信报告描述词特征向量与各个敏感词的词特征向量之间的词敏 感匹配关联矩阵;以及 基于所述词敏感匹配关联矩阵,生成所述敏感词识别结果。 6.根据权利要求5所述的人行征信报告敏感词识别方法,其特征在于,基于所述词敏感 匹配关联矩阵,生成所述敏感词识别结果,包括: 将所述词敏感匹配关联矩阵通过分类器以得到分类结果,所述分类结果用于表示与所 述各个人行征信报告描述词特征向量对应的人行征信报告描述词是否为敏感词。 7.根据权利要求6所述的人行征信报告敏感词识别方法,其特征在于,还包括训练步 骤:对所述基于转换器的BERT模型和所述分类器进行训练。 8.根据权利要求7所述的人行征信报告敏感词识别方法,其特征在于,所述训练步骤, 包括: 获取训练数据,所述训练数据包括人行征信报告和人行征信报告中各个词是否为敏感 2 CN117094327A权利要求书2/2页 词的真实值; 使用基于所述转换器的BERT模型对所述人行征信报告进行处理以得到各个训练人行 征信报告描述词特征向量; 计算所述各个训练人行征信报告描述词特征向量与各个训练敏感词的词特征向量之 间的训练词敏感匹配关联矩阵; 将所述训练词敏感匹配关联矩阵通过分类器以得到分类损失函数值; 计算所述训练词敏感匹配关联矩阵的流形凸分解一致性因数;以及 以所述分类损失函数值和所述流形凸分解一致性因数的加权
Ta的资源

2020110359336低致栓颅内血管编织支架及其处理方法

2020110303186一种钙钛矿量子点聚合物粒子的制备方法

2020110124078基于精准医疗的大数据分析系统及方法

2020109651910 应用近红外谷物分析仪建立油莎豆中粗脂肪含量的检测方法

2020109529321一种铝合金用无氟无氯环保粒状精炼剂及其制备和应用

2020108899336一种新能源商用车总装车间线路布局

2020108620703城市燃气管网多输差协同计算模型及应用方法

2020108207369一种微交联阳离子型聚丙烯酰胺絮凝剂及其制备方法与应用

2020108035131一种基于全站仪的激光雷达外部参数标定方法

2020107682859一种内燃机等离子节油器阴阳极的制备方法

13****40
实名认证
内容提供者


最近下载