您所在位置: 网站首页 / 一种信息搜索方法、装置及设备.pdf / 文档详情
一种信息搜索方法、装置及设备.pdf 立即下载
2023-07-24
约1.2万字
约13页
0
486KB
举报 版权申诉
预览加载中,请您耐心等待几秒...

一种信息搜索方法、装置及设备.pdf

202111241094.pdf

预览

免费试读已结束,剩余 8 页请下载文档后查看

10 金币

下载文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113918684A(43)申请公布日2022.01.11(21)申请号202111241094.8(22)申请日2021.10.25(71)申请人咪咕文化科技有限公司地址100032北京市西城区德胜门外大街11号5幢400室(德胜园区)申请人中国移动通信集团有限公司(72)发明人孙玲李琳(74)专利代理机构北京市浩天知识产权代理事务所(普通合伙)11276代理人梁倩(51)Int.Cl.G06F16/33(2019.01)G06F16/335(2019.01)G06F16/383(2019.01)权利要求书2页说明书8页附图2页(54)发明名称一种信息搜索方法、装置及设备(57)摘要本发明公开了一种信息搜索方法、装置及设备,该方法包括:获取用于搜索文档的目标关键词;将所述目标关键词包含的关键字输入布隆过滤器,以从文档集合中,筛选与所述关键字的布隆索引相对应的第一文档集合;基于所述目标关键词,对所述第一文档集合进行搜索,以得到包含所述目标关键词的第二文档集合。通过上述方式,本发明的方案可以有效提升搜索速度,缩短搜索时长。CN113918684ACN113918684A权利要求书1/2页1.一种信息搜索方法,其特征在于,所述方法包括:获取用于搜索文档的目标关键词;将所述目标关键词包含的关键字输入布隆过滤器,以从文档集合中,筛选与所述关键字的布隆索引相对应的第一文档集合;基于所述目标关键词,对所述第一文档集合进行搜索,以得到包含所述目标关键词的第二文档集合。2.根据权利要求1所述的信息搜索方法,其特征在于,所述布隆过滤器,通过以下过程优化得到:获取历史搜索关键词;从所述历史搜索关键词中,确定存在相关性的关键字;根据所述关键字,优化布隆过滤器,以得到优化后的布隆过滤器。3.根据权利要求2所述的信息搜索方法,其特征在于,从所述历史搜索关键词中,确定存在相关性的关键字,包括:根据不同关键字同时出现在同一历史搜索关键词中的次数与预设阈值,从所述历史搜索关键词中,确定存在相关性的关键字。4.根据权利要求2所述的信息搜索方法,其特征在于,根据所述关键字,优化布隆过滤器,以得到优化后的布隆过滤器,包括:对存在相关性的关键字形成的关键字相关性列表进行遍历,若遍历的当前关键字的相关关键字不在记录字典中,在所述记录字典中增加记录,所述记录包括当前关键字以及该当前关键字在布隆索引中的位置;若遍历的当前关键字的相关关键字在记录字典中,确定当前关键字在所述关键字相关性列表中的位置;根据所述当前关键字在所述关键字相关性列表中的位置,与所述记录字典中已有相关关键字的位置不重复,在所述记录字典中增加记录;若所述当前关键字在所述关键字相关性列表中的位置,与所述记录字典中已有相关关键字的位置重复,根据上次确定的所述当前关键字在所述关键字相关性列表中的位置进行计算,直到确定出的所述当前关键字在所述关键字相关性列表中的位置,与所述记录字典中已有相关关键字的位置不重复;根据所述关键字相关性列表中的所有关键字的位置,形成第一版本记录字典;遍历搜索文档中的当前字为所述关键字相关性列表中的字,依据所述记录字典表中的该当前字和布隆索引位置对应关系,标记该当前字的布隆索引;否则,直接对该当前字进行编码转换取余得到取余结果,根据该取余结果设置该当前字的布隆索引;根据所述搜索文档中的每个字的布隆索引,得到优化后的布隆过滤器。5.根据权利要求2所述的信息搜索方法,其特征在于,得到优化后的布隆过滤器后,还包括:获得新增加的搜索文档的关键字相关性列表;根据所述新增加的搜索文档的关键字相关性列表,对所述第一版本记录字典进行更新,得到更新后的第二版本记录字典;根据所述新增加的搜索文档以及所述更新后的第二记录字典,得到所述新增加的搜索2CN113918684A权利要求书2/2页文档的布隆索引;根据所述新增加的搜索文档的布隆索引对优化后的布隆过滤器进行更新,得到更新后的布隆过滤器。6.根据权利要求1所述的信息搜索方法,其特征在于,获取用于搜索文档的目标关键词,包括:获取用户输入的用于搜索文档的搜索关键词集合;对所述待搜索关键词集合进行过滤,得到目标关键词。7.根据权利要求6所述的信息搜索方法,其特征在于,将所述目标关键词包含的关键字输入布隆过滤器,以从文档集合中,筛选与所述关键字的布隆索引相对应的第一文档集合,包括:将所述目标关键词包含的关键字输入布隆过滤器,若所述目标关键词包含的关键字的布隆索引在所述布隆过滤器中的布隆索引中,则将所述目标关键词包含的关键字的布隆索引对应的文档形成的文档集合,作为所述第一文档集合。8.一种信息搜索装置,其特征在于,所述装置包括:获取模块,用于获取用于搜索文档的目标关键词;处理模块,用于将所
查看更多
单篇购买
VIP会员(1亿+VIP文档免费下)

扫码即表示接受《下载须知》

一种信息搜索方法、装置及设备

文档大小:486KB

限时特价:扫码查看

• 请登录后再进行扫码购买
• 使用微信/支付宝扫码注册及付费下载,详阅 用户协议 隐私政策
• 如已在其他页面进行付款,请刷新当前页面重试
• 付费购买成功后,此文档可永久免费下载
全场最划算
12个月
199.0
¥360.0
限时特惠
3个月
69.9
¥90.0
新人专享
1个月
19.9
¥30.0
24个月
398.0
¥720.0
6个月会员
139.9
¥180.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用