如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115879550A(43)申请公布日2023.03.31(21)申请号202211651787.9(22)申请日2022.12.21(71)申请人北京政务科技有限公司地址100000北京市北京经济技术开发区科谷一街10号院8号楼12层1201(北京自贸试验区高端产业片区亦庄组团)(72)发明人刘广睿(74)专利代理机构成都顶峰专利事务所(普通合伙)51224专利代理师曹源(51)Int.Cl.G06N5/025(2023.01)G06N5/022(2023.01)权利要求书2页说明书7页附图1页(54)发明名称知识图谱的构建方法、装置及存储介质(57)摘要本发明公开了一种知识图谱的构建方法、装置及存储介质,涉及知识图谱技术领域。该知识图谱的构建方法包括:从多元异构的数据源中抽取出多个三元组;对多个三元组中的属性和实体进行对齐处理,并将多个三元组中表征同一对象的实体所对应的属性进行聚合,得到处理后的多个三元组;基于处理后的多个三元组构建知识图谱。本发明公开的知识图谱的构建方法、装置及存储介质可避免出现由于同一对象的不同描述而导致所构建的知识图谱的可靠性降的问题,使得通过所构建的知识图谱进行查询时能够准确查找出相应的数据。CN115879550ACN115879550A权利要求书1/2页1.一种知识图谱的构建方法,其特征在于,所述方法包括:从多元异构的数据源中抽取出多个三元组;对所述多个三元组中的属性和实体进行对齐处理,并将所述多个三元组中表征同一对象的实体所对应的属性进行聚合,得到处理后的多个三元组;基于处理后的多个三元组构建知识图谱。2.根据权利要求1所述的知识图谱的构建方法,其特征在于,从多元异构的数据源中抽取出三元组,包括:通过爬虫从多元异构的数据源中抽取出半结构化数据;将所述半结构化数据转换为JSON数据;将所述JSON数据解析为结构化数据并存入关系表;将关系表中的数据映射为三元组。3.根据权利要求2所述的知识图谱的构建方法,其特征在于,将关系表中的数据映射为三元组,包括:根据知识图谱模式层的约束关系,通过D2RQ工具将关系表中的数据映射为三元组。4.根据权利要求1所述的知识图谱的构建方法,其特征在于,所述对所述多个三元组中的属性和实体进行对齐处理,包括:判断所述多个三元组中是否存在表征同一对象的属性,如果存在则将表征同一对象的属性对齐处理;判断所述多个三元组中是否存在表征同一对象的实体,如果存在则将表征同一对象的实体对齐处理。5.根据权利要求1所述的知识图谱的构建方法,其特征在于,所述方法还包括:通过图数据库存储所述知识图谱。6.根据权利要求5所述的知识图谱的构建方法,其特征在于,所述图数据库为Neo4j数据库。7.一种知识图谱的构建装置,其特征在于,所述知识图谱的构建装置包括:抽取单元,用于从多元异构的数据源中抽取出多个三元组;处理单元,用于对所述多个三元组中的属性和实体进行对齐处理,并将所述多个三元组中表征同一对象的实体所对应的属性进行聚合,得到处理后的多个三元组;构建单元,用于基于处理后的多个三元组构建知识图谱。8.根据权利要求7所述的知识图谱的构建装置,其特征在于,处理单元在用于从多元异构的数据源中抽取出三元组时,具体用于:通过爬虫从多元异构的数据源中抽取出半结构化数据;将所述半结构化数据转换为JSON数据;将所述JSON数据解析为结构化数据并存入关系表;将关系表中的数据映射为三元组。9.一种知识图谱的构建装置,其特征在于,包括依次通信相连的存储器、处理器和收发器,其中,所述存储器用于存储计算机程序,所述收发器用于收发消息,所述处理器用于读取所述计算机程序,执行如权利要求1~6任意一项所述的知识图谱的构建方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有指令,2CN115879550A权利要求书2/2页当所述指令在计算机上运行时,执行如权利要求1~6任意一项所述的知识图谱的构建方法。3CN115879550A说明书1/7页知识图谱的构建方法、装置及存储介质技术领域[0001]本发明属于知识图谱技术领域,具体涉及一种知识图谱的构建方法、装置及存储介质。背景技术[0002]知识图谱(KnowledgeGraph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。[0003]具体来说,知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合
夏萍****文章
实名认证
内容提供者
最近下载