数字图书馆的建设发展原则
数字图书馆建设需要高昂的投资和海量的资源,故而针对数字图书馆的建设、实现、维护和发展,相关方都会有一些基本的考虑和遵循原则,这些原则不仅适用于将模拟对象转换为数字形式,也适用于数字图书馆,遵循这些原则,并吸取从之而来的实践经验,会使设计、建设和维护开发数字图书馆的工作受益。
数字图书馆发展原则
数字图书馆要适应和迎合变革。持续变化的技术环境,对于数字图书馆项目来说是一个挑战。纸质文档会被转换成数字格式,随着技术变革,当市场不再支持相应系统和格式时,该格式的数字化文档就会逐渐被废弃。如果在某特定程序中创建一个重要文档,那么为了访问附件则依赖这个特定程序,假设我们的目的是为后人保留重要信息,而未来技术的变革可能意味着普通用户无法访问这个文档。
互联网和Web使数字图书馆成为可能,数字图书馆设计者依赖现有的范例和工具,依然会导致不可预见的问题。比如用HTML创建Web站点便于访问数字图像和文档,但是也会因为HTML更改或被其他技术取代而过时。技术变革的速度超过管理者维护数字图书馆的能力,所以数字图书馆需要方法和计划以应对改变,保持对信息提供持久访问的能力。
发展数字图书馆要切实了解“内容”。对于用户来说,内容是数字图书馆中最值得关注的部分。创建者需要管理和决定数字图书馆的内容,包括选择要包含的对象,数字化模拟形式的项目,用标准语言(例如SGML)标记项目,并分配元数据,用以描述每个对象的内容和其他属性。
对于开发人员来说,在项目伊始确定元数据元素的性质和数量非常重要。一些元数据元素描述了项目的内容,包括标题、创建者、发布日期和讨论主题,其他元素可能被分配来管理集合,包括扫描状态、质量控制状态和内部注释,以及数字对象的技术方面,例如文件格式和大小。
决定系统将要包括的基本概念单元或对象同样重要,例如个人文档、照片、视频或实验记录,它将影响到元数据被分配的级别,以及如何组织、访问和归档这些资料。每个概念性对象分配它自己的唯一标识符,将其与元数据记录和集合中的其他对象连接起来。
数字图书馆建设团队,需要包容不同背景以及提供各种专业知识的成员。从多个领域获得构建系统的建议和帮助,才能建立更好的数字图书馆。
计算机科学和图书馆学是构建系统最直接的两个领域。计算机专家能够领会和鉴别技术可行性和局限性,关心数字图书馆元数据标准在庞大互联网信息空间中提供的语义互操作性;而图书馆员是信息资源的管理者,具有丰富的编目和索引经验,并认识到这些概念对于信息检索的重要性,而且他们了解用户的信息需求,以及保存材料以继续获取和使用的问题。此外,能够提供长期财政、材料和人力支持的组织和高层管理人员同样重要。
设计“易用的系统”。由于Web的巨大优点,多数数字图书馆是通过网络技术在互联网Web上提供的。成功的Web站点设计包括许多因素,包括计算机和浏览器之间的技术差异,访问速度和用户之间的差异,Web导航偏好等。浏览器在显示信息的方式上有所不同,即使它们使用相同的基本通信协议(如Http、Https)和标准标记语言(比如HTML或XML)。由于用户可能会更改默认设置,所以最好创建尽可能简单的接口,并避免服务器端对数据的精确显示进行控制。此外,开发面向数字图书馆的接口时,对于具有一定范围的物理缺陷的用户来说,可访问性也是一个问题。
确保开放存取的原则。确保开放存取与可用性问题密切相关,包括对数字图书馆内容以及对数字图书馆本身的访问。确保对内容开放存取的一种方法是避免使用专有的软硬件解决方案。许多用于创建数字图像的收费的软件,同时允许软件接口免费使用,数字图书馆开发人员可以清楚地知道需要哪些软件来查看这些图像,就可以访问这些内容。为了确保持续可访问性和使用,开放的非专有的系统是建设数字图书馆的首选。
数字版权意识。我国的版权法和著作权法保护数字知识产品,而开放获取信息的可能威胁知识产权。数字信息基础设施易于获得大量的信息,但是信息的不当复制和访问控制存在不确定途径的风险。创建数字图书馆应关注这个问题,并参与讨论相关的解决方案,尽可能的建立管理程序以保护馆藏。例如,在数字转换项目中应该得到实体版权所有者的许可。考虑个人隐私问题,当重要的私人全部文件被数字化的时候,要根据捐赠者标记出的敏感物品以及处置说明,仔细地跟踪权限和隐私信息,确保这些信息不存在法律风险。
系统尽可能自动化。建立数字图书馆需要系统创建者进行大量的脑力劳动,构建和使用自动化工具越多,就越能更好地利用宝贵的人力资源;这些工具使内容专家能够专注于知识任务(见图1),只需使用元数据输入系统向主数据库一次添加元数据,然后根据访问用户的需要从主数据库提取和组合这些信息,以生成HTML页面、搜索索引和报告。一次输入数据可以节省人力和时间,降低错误率,并允许最大的灵活性。几乎整个Web界面都是由数据库生成的,只要必要就允许更新,同时能遵循最新的Web标准。系统进行模块化设计,现有模块易于修改,易于为新功能添加新模块。
采用并遵循标准。在系统构建中使用标准使应用程序易于扩展、可互操作和可移植,这些特性对于数字图书馆的设计、实现和维护非常重要。使用标准对于需要大量工作的数字图书馆来说尤其重要,扫描、元数据输入和文档标记,集合中所有涉及到需要评估和处理的单个项目,都是资源任务密集型的工作,最好需要“一次性完成”。遵循标准将使今后可能的数据迁移更加容易。另外,使用标准文件格式保存的信息,比用专有格式编码的信息更容易访问。
对于开发人员来说,使用标准更易于实现互操作性。通过使用标准通用的数据标签和Web技术,发布数字图书馆的内容,增加了其他Web搜索引擎访问图书馆以及其中具体条目的机会。未来数字图书馆或许成为某个更宽泛的系统组成部分,那么开放的标准设计,将使未来的转换和重组将更加平顺。
保证质量的原则。质量度量可以应用于创建一个数字图书馆所涉及的所有过程和结果。它们与选择、元数据条目、图像捕获和系统的总体可用性有关。完整和正确的元数据会带来许多好处;不完全或不正确的元数据影响整个数字图书馆的质量。元数据在资源发现和集合管理方面都扮演着重要角色,如果主题代码被随意或不正确地应用,那么根据这些代码生成浏览层次结构的尝试可能会被阻止,访问可能会更加困难。
转换项目中扫描过程的指导方针,如果包括对被扫描图像的外观标准,包括方向,分辨率,色调,将会减少很多的潜在问题。一些质量控制指标可以自动化,有些则需要人工审查。数字图书馆项目应定义并坚持实施质量控制方法,确保质量评估成为构建和维护数字图书馆的重要组成部分。
内容持久性的原则。对于数字图书馆而言,首先,是数字对象的“迁移策略”,它要求将数据从一个文件格式转换为另一个文件格式,从一个软件环境转换为另一个软件环境,或者从一个物理介质转移到另一个物理介质。迁移意味着机构强大持久的承诺和支持,不断刷新其集合以跟上技术进步的步伐。
其次是数字对象的保存和持久性,保存是指对象的技术寿命和质量;持久性则是一个更广泛的概念,包含了保存,也包括这个对象将来是否还会以其他形式存在。数字信息的持久性意味着存储信息并保持其可访问。
结语
遵循以上这些原则,以及从这些原则演变而来的实践经验,使我们更有利地建设、维护和发展数字图书馆,保护高质量有价值的信息资源,为用户持续提供开放的访问服务而努力。
- 2025年中科院分区表已公布!Scientific Reports降至三区
- 官方认定!CSSCI南大核心首批191家“青年学者友好期刊名单”
- 2023JCR影响因子正式公布!
- 国内核心期刊分级情况概览及说明!本篇适用人群:需要发南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的学者
- 我用了一个很复杂的图,帮你们解释下“23版最新北大核心目录有效期问题”。
- 重磅!CSSCI来源期刊(2023-2024版)最新期刊目录看点分析!全网首发!
- CSSCI官方早就公布了最新南核目录,有心的人已经拿到并且投入使用!附南核目录新增期刊!
- 北大核心期刊目录换届,我们应该熟知的10个知识点。
- 注意,最新期刊论文格式标准已发布,论文写作规则发生重大变化!文字版GB/T 7713.2—2022 学术论文编写规则
- 盘点那些评职称超管用的资源,1,3和5已经“绝种”了