古籍文献数字化加工系统硬件解决方案.doc 立即下载
2025-02-19
约2.4千字
约5页
0
15KB
举报 版权申诉
预览加载中,请您耐心等待几秒...

古籍文献数字化加工系统硬件解决方案.doc

古籍文献数字化加工系统硬件解决方案.doc

预览

在线预览结束,喜欢就下载吧,查找使用更方便

10 金币

下载文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第页共NUMPAGES5页
古籍文献数字化加工系统硬件解决方案

摘要:古籍数字化与古籍整理、文献保护、文化传承紧密相关。文章从古籍数字化的概念与意义谈起,详细介绍了古籍数字化的加工流程,并从系统硬件配置入手,完整地设计并实现了一种通用古籍文献数字化系统的构建。
【关键词】:^p:古籍数字化;系统设计
1古籍文献数字化的概念与意义
古籍在各类文献中独具特色。以国家图书馆为例,其古籍文献资数量庞大,种类齐全,既包括甲骨、金石、简帛、舆图、善本等珍贵特藏,也包括图书、期刊、报纸、缩微文献等传统普通古籍文献类型。无论线装古籍,还是碑帖拓本、古地图,所有古籍文献资都蕴含着独特的文献价值、艺术价值,彰显着古老文明的魅力。据文化部统计,全国公共图书馆系统古籍2717.5万册件,其中善本229.5万册件[1]。如此丰富的古籍资,为古籍数字化建设提供了可供开采的丰富宝藏,成为数字图书馆资建设不可缺少的重要内容。
古籍数字化就是从利用和保护古籍的目的出发,采用计算机技术,将常见的语言文字或图形符号转化为能被计算机识别的数字符号,从而制成古籍文献书目数据库和古籍全文数据库,用以揭示古籍文献信息资的一项系统工作[2]。
古籍文献数字化可以降低原件丢失和损失的风险。古老的文献、照片都可以转换成数字化文献,避免读者直接使用原件,以减少或避免原件损失的机率,同时也可以扩大原始文献的利用范围。古籍文献数字化后,可以产生较原件可靠而功能性更强的数字资,这将有利于开展古籍文献研究,从而扩大研究范围。例如:对手稿字迹的鉴别,对图画、照片的放大浏览等等。古籍数字化是数字图书馆资建设的重要组成部分,数字图书馆推广工程将在全国范围内依托图书馆馆藏优势,建成内容丰富、类型多样的公共文化资库群。
2古籍文献数字化加工系统工作流程
古籍文献数字化加工系统的工作流程一般可大致分为六个部分:文献整理、图像扫描、图像处理与质检、文字识别与质检、数据标引与质检、数据整理。其中,“文字识别与质检”根据加工需求为可选流程。图1为古籍文献数字化加工系统工作流程,
各类古籍文献依据类型的差异在数字化细节上会有所不同。
根据古籍文献数字化加工系统工作流程图可以得出,完成古籍文献加工的单条流水线主要包含以下几个环节:
(1)文献整理:待加工的文献存放在专门的资料管理室,由相关人员统一上架登记,保护文献安全;需借出做加工和归还的文献需要登记入册,统计书目信息和文献数量;(2)图像扫描:按照加工要求对古籍文献进行扫描,对扫描图像进行命名、旋转等;(3)图像处理:应用专用图像整理工具,自动检查整理图像的DPI与图像模式,主要包括批量进行倾斜校对,调整倾斜度、统一画布尺寸、调整dpi、去除黑边等操作、纠正文件名命名、建立图像索引等,处理完成后导入数字化加工管理系统进行数据自动分发与流转,系统会在流水线上自动派发任务;(4)OCR识别:应用专业OCR识别软件依照文献数字化加工要求进行全文或特定的文字识别;(5)OCR数据质检:完成字体切分、校对,从而做到一字一框,精确对位,同时进行聚类校对,将一批次中所有同一个字的字形聚集到一起,选出与标准字库不一样的那一个进行标红,为下一步错字修改做准备;完成错字修改,操作员通过管理客户端可以实时读取到上一步的校对结果,并进行错误修改,修改完的字体会有高级人员校对;如遇操作员识别不了的字体,也可留给高级人员纠正。
(6)版式还原:包括原有版式编辑还原、____ML排版、PDF排版、调整字体、字号、字间距、标题格式等内容;(7)成品全检:根据文献数字化加工项目的特点,应用成品检查工具,对每批完成数据进行成品检查。对出错的部分,按照谁做谁修改的原则,由管理系统返回给操作员进行修改。
3古籍文献数字化加工系统设计
参照古籍文献数字化系统工作的一般流程,可以将加工系统设计为包含软硬件运行平台、数字化专用采集和输出设备、数字化加工管理软件等几大部分。整个古籍文献数字化加工系统硬件架构中将包含服务器、存储设备、加工工作站(终端PC机)、各类型扫描仪及网络集成等。
3.1古籍文献数字化加工系统拓扑结构图
3.2古籍文献数字化加工系统软件
古籍文献数字化加工系统软件可分为数字化加工管理系统软件和文献数字化生产系统软件两大部分。软件系统部署在服务器端和工位的PC机端。目前市面上成品数字化管理及生产系统软件很多也比较成熟,可以依据古籍文献数字化的具体要求直接采购使用。
3.3古籍文献数字化加工系统服务器设计
古籍文献数字化加工系统服务器可设计为数据库及管理服务器2台,互做双机热备,部署数据库、中间件、文献数字化生产系统和数字化加工管理系统。其中一台兼做数据封装服务器和数据自动处理服务器,另外一台兼做元数据控制服务器和FTP服务器。由于有频繁的数据处理,因此这2台服务器建议为大内存和
查看更多
单篇购买
VIP会员(1亿+VIP文档免费下)

扫码即表示接受《下载须知》

古籍文献数字化加工系统硬件解决方案

文档大小:15KB

限时特价:扫码查看

• 请登录后再进行扫码购买
• 使用微信/支付宝扫码注册及付费下载,详阅 用户协议 隐私政策
• 如已在其他页面进行付款,请刷新当前页面重试
• 付费购买成功后,此文档可永久免费下载
全场最划算
12个月
199.0
¥360.0
限时特惠
3个月
69.9
¥90.0
新人专享
1个月
19.9
¥30.0
24个月
398.0
¥720.0
6个月会员
139.9
¥180.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用