知识图谱的构建方法、装置及存储介质.pdf 立即下载
2023-06-07
约9.3千字
约11页
0
486KB
举报 版权申诉
预览加载中,请您耐心等待几秒...

知识图谱的构建方法、装置及存储介质.pdf

202211651787.pdf

预览

免费试读已结束,剩余 6 页请下载文档后查看

10 金币

下载文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115879550A(43)申请公布日2023.03.31(21)申请号202211651787.9(22)申请日2022.12.21(71)申请人北京政务科技有限公司地址100000北京市北京经济技术开发区科谷一街10号院8号楼12层1201(北京自贸试验区高端产业片区亦庄组团)(72)发明人刘广睿(74)专利代理机构成都顶峰专利事务所(普通合伙)51224专利代理师曹源(51)Int.Cl.G06N5/025(2023.01)G06N5/022(2023.01)权利要求书2页说明书7页附图1页(54)发明名称知识图谱的构建方法、装置及存储介质(57)摘要本发明公开了一种知识图谱的构建方法、装置及存储介质,涉及知识图谱技术领域。该知识图谱的构建方法包括:从多元异构的数据源中抽取出多个三元组;对多个三元组中的属性和实体进行对齐处理,并将多个三元组中表征同一对象的实体所对应的属性进行聚合,得到处理后的多个三元组;基于处理后的多个三元组构建知识图谱。本发明公开的知识图谱的构建方法、装置及存储介质可避免出现由于同一对象的不同描述而导致所构建的知识图谱的可靠性降的问题,使得通过所构建的知识图谱进行查询时能够准确查找出相应的数据。CN115879550ACN115879550A权利要求书1/2页1.一种知识图谱的构建方法,其特征在于,所述方法包括:从多元异构的数据源中抽取出多个三元组;对所述多个三元组中的属性和实体进行对齐处理,并将所述多个三元组中表征同一对象的实体所对应的属性进行聚合,得到处理后的多个三元组;基于处理后的多个三元组构建知识图谱。2.根据权利要求1所述的知识图谱的构建方法,其特征在于,从多元异构的数据源中抽取出三元组,包括:通过爬虫从多元异构的数据源中抽取出半结构化数据;将所述半结构化数据转换为JSON数据;将所述JSON数据解析为结构化数据并存入关系表;将关系表中的数据映射为三元组。3.根据权利要求2所述的知识图谱的构建方法,其特征在于,将关系表中的数据映射为三元组,包括:根据知识图谱模式层的约束关系,通过D2RQ工具将关系表中的数据映射为三元组。4.根据权利要求1所述的知识图谱的构建方法,其特征在于,所述对所述多个三元组中的属性和实体进行对齐处理,包括:判断所述多个三元组中是否存在表征同一对象的属性,如果存在则将表征同一对象的属性对齐处理;判断所述多个三元组中是否存在表征同一对象的实体,如果存在则将表征同一对象的实体对齐处理。5.根据权利要求1所述的知识图谱的构建方法,其特征在于,所述方法还包括:通过图数据库存储所述知识图谱。6.根据权利要求5所述的知识图谱的构建方法,其特征在于,所述图数据库为Neo4j数据库。7.一种知识图谱的构建装置,其特征在于,所述知识图谱的构建装置包括:抽取单元,用于从多元异构的数据源中抽取出多个三元组;处理单元,用于对所述多个三元组中的属性和实体进行对齐处理,并将所述多个三元组中表征同一对象的实体所对应的属性进行聚合,得到处理后的多个三元组;构建单元,用于基于处理后的多个三元组构建知识图谱。8.根据权利要求7所述的知识图谱的构建装置,其特征在于,处理单元在用于从多元异构的数据源中抽取出三元组时,具体用于:通过爬虫从多元异构的数据源中抽取出半结构化数据;将所述半结构化数据转换为JSON数据;将所述JSON数据解析为结构化数据并存入关系表;将关系表中的数据映射为三元组。9.一种知识图谱的构建装置,其特征在于,包括依次通信相连的存储器、处理器和收发器,其中,所述存储器用于存储计算机程序,所述收发器用于收发消息,所述处理器用于读取所述计算机程序,执行如权利要求1~6任意一项所述的知识图谱的构建方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有指令,2CN115879550A权利要求书2/2页当所述指令在计算机上运行时,执行如权利要求1~6任意一项所述的知识图谱的构建方法。3CN115879550A说明书1/7页知识图谱的构建方法、装置及存储介质技术领域[0001]本发明属于知识图谱技术领域,具体涉及一种知识图谱的构建方法、装置及存储介质。背景技术[0002]知识图谱(KnowledgeGraph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。[0003]具体来说,知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合
查看更多
单篇购买
VIP会员(1亿+VIP文档免费下)

扫码即表示接受《下载须知》

知识图谱的构建方法、装置及存储介质

文档大小:486KB

限时特价:扫码查看

• 请登录后再进行扫码购买
• 使用微信/支付宝扫码注册及付费下载,详阅 用户协议 隐私政策
• 如已在其他页面进行付款,请刷新当前页面重试
• 付费购买成功后,此文档可永久免费下载
全场最划算
12个月
199.0
¥360.0
限时特惠
3个月
69.9
¥90.0
新人专享
1个月
19.9
¥30.0
24个月
398.0
¥720.0
6个月会员
139.9
¥180.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用