




如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN105868261A(43)申请公布日2016.08.17(21)申请号201511029314.5(22)申请日2015.12.31(71)申请人乐视网信息技术(北京)股份有限公司地址100081北京市海淀区学院南路68号19号楼六层6184号房间(72)发明人童忠斌(74)专利代理机构北京风雅颂专利代理有限公司11403代理人李阳于洁(51)Int.Cl.G06F17/30(2006.01)G06K9/62(2006.01)权利要求书5页说明书15页附图4页(54)发明名称一种关联信息的获取与排序方法和系统(57)摘要本发明公开了一种关联信息的获取与排序方法和系统,其中,该方法包括:获取用户输入的专题名称与专题属性;根据所述专题属性获取专题名称的相关信息,并获取与所述相关信息对应的内容;将与所述相关信息对应的内容按顺序呈现给用户;允许用户对与所述相关信息对应的内容进行下载与查看操作。本发明通过利用专题链接结构对根据用户输入的专题名称与专题属性选出初始的结果集进行拓展,并计算拓展结果集与用户输入的专题名称与专题属性的距离作为相关信息对应的内容的相关度,然后结合衡量专题链接质量的PageRank值,最终得到每个专题链接的相关度得分并根据该得分返回排序结果,提高了用户获取专题相关信息的效率与搜索体验。CN105868261ACN105868261A权利要求书1/5页1.一种关联信息的获取和排序方法,其特征在于,包括:获取用户输入的专题名称与专题属性;根据所述专题属性获取专题名称的相关信息,获取与所述相关信息对应的内容;将与所述相关信息对应的内容按顺序呈现给用户;允许用户对与所述相关信息对应的内容进行下载与查看操作。2.根据权利要求1所述的方法,其特征在于,根据所述专题属性获取专题名称的相关信息包括:沿着与专题属性关联的链接搜寻专题名称的初始相关信息,将所述专题名称的初始相关信息中以向量形式提取出至少一个所述初始相关信息对应的内容,并将所述初始相关信息对应的内容、所述专题的链接与搜寻时间以相关联的方式存储;计算每两个所述初始相关信息对应的内容之间基于密度的相似度,并根据所述初始相关信息对应的内容之间基于密度的相似度确定图形聚类的最佳类别数目;按照所述专题属性关联的链接重新访问更新过的专题并搜寻更新过的专题信息,并按照所述更新过的专题信息将所述初始相关信息对应的内容更新为所述新相关信息对应的内容,并将所述新相关信息对应的内容、所述专题的链接与更新时间以关联的方式存储。3.根据权利要求2所述的方法,其特征在于,计算每两个所述初始相关信息对应的内容之间基于密度的相似度包括:定义图形聚类方法的局部一致性与全局一致性;根据所述图形聚类方法的局部一致性与全局一致性,得到基于密度的线段长度距离表达式;根据所述基于密度的线段长度距离表达式,计算出两所述初始相关信息对应的内容之间基于密度的距离;根据所述两初始相关信息对应的内容之间基于密度的距离,获得所述两初始相关信息对应的内容之间基于密度的相似度。4.根据权利要求3所述的方法,其特征在于,根据所述初始相关信息对应的内容之间基于密度的相似度确定图形聚类的最佳类别数目包括:根据所述每两个初始相关信息对应的内容之间基于密度的相似度建立相似矩阵,其中,所述相似矩阵的行向量代表初始相关信息对应的内容、列向量代表初始相关信息对应的内容特征项的权值;计算所述相似矩阵中包括,所有初始相关信息对应的内容特征项权值的平均值、任一图形聚类内初始相关信息对应的内容特征项的平均值、所有初始相关信息对应的内容数据集的总体方差、任一图形聚类内数据集的方差、任一图形聚类间数据集的方差;根据所述任一图形聚类内数据集的方差与任一图形聚类间数据集的方差,用C-H指数定义方差比标准计算出所述图形聚类的最佳类别数目。5.根据权利要求2所述的方法,其特征在于,将与所述相关信息对应的内容按顺序呈现给用户包括:计算所述图形聚类的类中心向量与类均值,计算所述新相关信息对应的内容与现有所有图形聚类类别之间的连接度,并根据所述新相关信息对应的内容与现有所有图形聚类类别之间的连接度判断是否将所述新相关信息对应的内容加入根据图形聚类方法建立的已2CN105868261A权利要求书2/5页有类别中,并根据所述各图形聚类类别的类中心向量与类均值判断所述图形聚类是否需要与其他图形聚类进行合并;将所述用户输入的专题名称与专题属性合并为专题向量,计算所述专题向量与所述现有图形聚类类别之间的相关度,建立专题链接的初始结果集,并将所述初始结果集中每个所述相关信息对应的内容的相关度与PageRank值计算归一加权值,按照所述相关度与PageRank值的归一加权值的大小进行排序并呈献给使用者。6

是翠****ng
实名认证
内容提供者


最近下载
最新上传
浙江省宁波市2024-2025学年高三下学期4月高考模拟考试语文试题及参考答案.docx
汤成难《漂浮于万有引力中的房屋》阅读答案.docx
四川省达州市普通高中2025届第二次诊断性检测语文试卷及参考答案.docx
山西省吕梁市2025年高三下学期第二次模拟考试语文试题及参考答案.docx
山西省部分学校2024-2025学年高二下学期3月月考语文试题及参考答案.docx
山西省2025年届高考考前适应性测试(冲刺卷)语文试卷及参考答案.docx
全国各地市语文中考真题名著阅读分类汇编.docx
七年级历史下册易混易错84条.docx
湖北省2024-2025学年高一下学期4月期中联考语文试题及参考答案.docx
黑龙江省大庆市2025届高三第三次教学质量检测语文试卷及参考答案.docx