您所在位置: 网站首页 / 信息检索__第五章.ppt / 文档详情
信息检索__第五章.ppt 立即下载
2024-09-18
约2.9千字
约27页
0
965KB
举报 版权申诉
预览加载中,请您耐心等待几秒...

信息检索__第五章.ppt

信息检索__第五章.ppt

预览

免费试读已结束,剩余 22 页请下载文档后查看

12 金币

下载文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第5章计算机检索概述
●计算机信息检索的含义和类
型
●计算机信息检索的特点
●计算机信息检索策略
●提高计算机信息检索效率的方法
●计算机检索技术	5.1.1计算机信息检索的含义
		计算机信息检索指人们根据特定的信息需求,按照一定的方法,利用计算机从相关的信息检索系统中识别并获取所需的信息。计算机信息检索的过程包括信息存储过程和信息检索过程,其本质是信息用户的提问标识和信息集合数据库特征标识匹配的过程。第5章计算机检索概述	5.1.2计算机信息检索发展简史
		计算机信息检索的发展经历了四个阶段:	5.1.3计算机信息检索的分类
		计算机信息检索包括许多类型,依据不同的划分标准,可以分为不同的类型:
		1.根据所检索数据库的形式分		2.根据计算机检索服务方式分	5.1.4计算机信息检索的特点
		1.检索范围大。
		2.检索速度快。
		3.检索功能强,组配灵活。
		4.检索途径多。
		5.数据更新及时,时效性强。
	6.2.1检索策略的含义和作用
	所谓检索策略,即在分析检索课题内容实质基础上,选择检索系统、检索途径、确定检索词及其相互间的逻辑关系等的信息检索方案。信息检索策略的实质是对检索过程的科学规划。其中关键在于构造能够确切表达信息需求的检索式。	5.2.2检索表达式
		检索表达式是检索策略的具体体现,简称检索式。检索式一般由检索词和各种逻辑运算符组成,具体来说,它将检索词之间的逻辑关系、位置关系等用检索系统规定的各种算符连接起来,成为计算机可以识别和执行的命令形式。检索式构造的优劣关系到检索策略的成败。
		检索表达式主要有逻辑表达式、加权表达式和其他表达式。其中,最为常用的是逻辑表达式。		5.2.2.1逻辑表达式
		逻辑表达式是指利用布尔算符,对检索词的关系进行表达,又称布尔逻辑表达式。
		有逻辑与“AND”、逻辑或“OR”、逻辑非“NOT”。	5.2.2.2位置检索表达式
		位置检索表达式,也称邻近检索。通过位置算符来表示两个检索词(或短语)之间的距离和位置关系。不同的检索系统可能会采用不同的位置算符,目前应用广泛的主要是:		5.2.2.3截词检索表达式
	截词检索表达式指在检索式中用专门截词符号表示检索词的某一部分允许有一定的词汇变化。
		截词检索表达式在西方语言检索中应用比较广泛,在中文信息检索中也有一定的应用。
		不同检索系统采用的截词符不完全相同,一般常采用“?”、“*”等。		后截词,又称右截词、前方一致,允许检索词尾部有若干变化形式。例如,检索式comput?将检出包含computer、computing、computerized、computerization等词汇的结果。
		中间截词,允许检索词中间有若干变化形式,例如wom*n就可同时检索到含有woman和women的结果。
		前截词,又称左截词、后方一致,允许检索词的前端有若干变化形式,例如检索*physics就可检得包含physics、astrophysics、biophysics、chemophysics、geophysics等词的结果。		5.2.2.4限制检索表达式
		限制检索表达式指用限制符限定检索词出现范围的检索式。
		常用的字段限定代码有:标题(TI,Title)、作者(AU,Author)、主题词(SU,Subject)、年代(PY,PublicationYear)等。
		一些网络检索工具也允许用户采用限制检索表达式,可把检索范围限制在标题、统一资源定位地址(URL)或超链等部分。	5.2.3检索策略的构造步骤
		信息检索策略的构造步骤如图:	5.2.4检索策略的反馈与调节
		5.2.4.1影响查全率和查准率的主要因素
		1.主题分析是否准确、全面
		2.检索词选择是否准确
		3.检索词之间逻辑关系的配置是否合适		5.2.4.2提高查全率和查准率的方法
		1.提高查全率的方法		2.提高查准率的方法	5.3.1全文检索技术
		全文检索(FullTextRetrieval),就是以各类数据诸如文字、声音、图像等为主要处理对象,根据数据资料的内容,而不是外在特征来实现的信息检索技术。
		与其他检索技术相比,全文检索技术的新颖之处在于,它可以使用原文中任何一个有实际意义的词作为检索入口,而且得到的检索结果是源文献而不是信息线索。	5.3.2基于内容的多媒体检索技术
		基于内容的多媒体检索技术突破了传统的基于文本描述和检索的局限,直接对图像、视频、音频内容进行分析,利用媒体对象的语义、媒体的视觉和听觉特征来进行检索。也就是依据图像中的颜色、纹理、形状,视频中的镜头、场景、镜头的运动,声音中的音调、响度、音色等内容特征建立索引并进行检索。基于内容的检索还融合了模式识别、计算机视
查看更多
单篇购买
VIP会员(1亿+VIP文档免费下)

扫码即表示接受《下载须知》

信息检索__第五章

文档大小:965KB

限时特价:扫码查看

• 请登录后再进行扫码购买
• 使用微信/支付宝扫码注册及付费下载,详阅 用户协议 隐私政策
• 如已在其他页面进行付款,请刷新当前页面重试
• 付费购买成功后,此文档可永久免费下载
全场最划算
12个月
199.0
¥360.0
限时特惠
3个月
69.9
¥90.0
新人专享
1个月
19.9
¥30.0
24个月
398.0
¥720.0
6个月会员
139.9
¥180.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用