• 图纸下载
  • 专业文献
  • 行业资料
  • 教育专区
  • 应用文书
  • 生活休闲
  • 杂文文章
  • 范文大全
  • 作文大全
  • 达达文库
  • 文档下载
  • 音乐视听
  • 创业致富
  • 体裁范文
  • 当前位置: 达达文档网 > 图纸下载 > 正文

    国内科研机构和高校机构知识库建设现状调研与对比分析

    时间:2021-01-30 14:09:53 来源:达达文档网 本文已影响 达达文档网手机站

    张伶 祝忠明 寇蕾蕾 姚晓娜

    摘要:[目的/意义]在IR发展进入平稳期及向下一代IR转型的重要节点,梳理我国IR的建设历程、现状和面临的挑战,以达到推动我国IR加速和深入发展的目的。[方法/过程]首先采用网络调查法及电话、邮件调查法相结合的实证调研法,以国内高校和中国科学院、中国农业科学院等科研院所IR为调查对象,对全国IR发展现状进行调查梳理;其次对调研结果按照高校系统、科研系统和总体情况进行对比分析,总结IR发展成绩与问题。[结果/结论] IR建设取得了一定成就,在建及拟建IR数量不断增加,资源规模大幅增长。然而IR发展存在管理政策不完善、访问限制过多、知识产权不明确、开放性不足、自存储率低等问题。

    关键词:机构知识库    科研机构    高校    建设现状

    分类号:G250.7

    引用格式:张伶, 祝忠明, 寇蕾蕾, 等. 国内科研机构和高校机构知识库建设现状调研与对比分析[J/OL]. 知识管理论坛, 2020, 5(2):
    122-134[引用日期]. http://www.kmf.ac.cn/p/207/.

    1  引言

    自2002年《布达佩斯开放获取倡议》正式发布以来,开放获取已取得了可喜的成就。近一年来可以说是开放获取迅速发展的一段时期,随着欧洲开放获取“S计划”的推出,能否打破付费墙,实现即时开放获取已成为学术界普遍关注的焦点。而机構知识库(Institutional Repository,IR)作为开放获取实现的重要途径之一,在经过十多年的持续增长发展后,其数量和内容都已初具规模,在促进学术成果的开放获取中发挥了积极作用。但就科研人员和学术界对IR的认知、认可、支持和使用效果来看,IR仍未能充分融入科研学术过程和体系,特别是在开放获取实践的力度提速加强、深度和广度不断拓展提升并加速向开放科学迈进之际,IR面临新的挑战和机遇,处于向下一代IR转型的重要节点。

    发展IR一直以来是实现开放获取的重要形式之一,也是支持开放获取S计划落实的重要渠道和手段之一。跟欧美发达国家相比,我国开放获取运动发展滞后而缓慢。尽管我国在2018年12月举行的柏林开放获取会议上发布了立场声明,明确表示支持OA2020和开放获取“S计划”,但目前尚无具体的推进实施措施。在全球开放获取深入发展、开放科学蓬勃兴起的背景下,对我国IR发展现状进行全面调查,梳理我国IR的建设历程、现状和面临的挑战,既可以回首来路,认清不足,总结其发展成绩与问题,又可以总结经验,展望其未来发展趋势,以达到推动我国IR加速和深入发展的目的。

    2  数据来源、研究方法和研究过程

    2.1  数据来源

    为力求全面、系统、客观地展现我国IR建设发展的全貌,了解我国机构知识库整体建设现状,对中国大陆地区(因港澳台地区的特殊历史背景,其文化及学术环境与我国大陆地区有极大区别,以下文中涉及全国数据均指中国大陆地区,不含港澳台)高校系统及科研系统IR的发展现状进行调查梳理。笔者收集了来自中国科学院(以下简称“中科院”)、中国农业科学院(以下简称“农科院”)、CHAIR、ROAR、OPENDOAR以及高校的数据,汇总形成支持统计分析的数据基础。根据调查数据,从基本建设情况、政策制定情况和应用情况等方面,对我国IR的建设和发展进行了全方位多维度的梳理和分析。

    2.2  研究方法和研究过程

    首先采取网络调查法,采集各高校网站及已发表文献中提及到的IR信息,其次采用电话调研及邮件调研方式逐个核实该IR是否存在。对于互联网可访问的IR,其数据信息由网络实证调研及电话邮件调研相结合的方式获取。对于互联网不可访问,不对外提供服务的IR,采取问卷调查、文献检索、电话和邮件调研等多种方式进行IR关键数据信息调查、核实和完善。由于中国科学院及中国农业科学院的IR都在各自的IR联盟系统,同时IR联盟维护及时,数据清晰,因此科研机构IR数据较高校情况好统计分析。根据调查数据,从总体概况、建设服务状态、资源建设、构建平台功能与服务、开放程度、政策规范、联盟发展等方面,对我国IR的建设和发展进行了全方位多维度的梳理和分析。

    3  数据分析

    3.1  国内科研机构和高校机构知识库基本建设情况

    3.1.1  服务状态对比分析

    截至2019年11月,我国共有IR325个。其中,高校系统166个,科研院所152个,其他系统7个。从运行服务状态来看,正常运行服务的IR共有287个,有18个正在建设中,20个已处于服务中止状态。正常运行和服务访问的IR中,高校系统131个,科研系统149个,其他系统7个。而真正支持互联网公开访问的IR有209个,其中,高校系统92个,科研系统110个,其他系统7个。具体服务状态如图1所示:

    高校系统IR服务状态存在这样几种情况:①图书馆网站显示有IR的多家院校,其链接无法访问,且通过电话、邮件的方式均联系不到,因此此类机构并未算入IR总数。②此次调研发现部分IR转入内部访问甚至停止服务的现象。例如,电子科技大学、同济大学现在变为内部访问;华东师范大学、宁夏大学、石河子大学、浙江大学等的IR经笔者电话调查确认已经中止服务。③有一批特殊类型的IR,即运营商自己做了一批IR给机构试用,机构实际并没有做,未得到机构的承认。例如,维普曾做过一批类似的IR,如湖南师范大学IR、华南师范大学IR等。本次调研结果,对这类IR做了排除。④部分IR长期未更新,如湖南大学IR、北京建筑大学IR2019年以来无数据更新,有些IR访问量及数据量都很少。⑤不支持全文公开访问和下载,是高校IR建设的普遍现象。⑥支持公开访问的IR,有不少存在平台不稳定、不能正常打开的情况。

    科研系统及其他系统IR的运行服务情况相对明了,全部159个科研院所IR中,中国农业科学院系统和其他系统的所有IR均正常运营且可公开访问;中国科学院114个IR中,目前正常运营且可公开访问的有72个,内部访问的有39个,中止服务的有3个。

    3.1.2  上线时间对比分析

    我国IR的建设起步总体比国外较晚,高校系统和科研系统的发展也有较大差异。2006年厦门大学建成我国第一个IR,其后几年时间,高校IR的建设进展相对缓慢。2013-2018年是高校IR較快发展的时期,有80个IR完成建设和上线。与高校系统不同,科研系统IR的建设呈现鲜明的批量建设方式和特征。中国科学院是国内科研系统最早启动建设IR的机构,从2007年开始以中国科学院力学所IR和中国科学院国家科学图书馆IR(现中国科学院文献情报中心IR)示范建设为起步,2009年开始规模化推广建设,2013年基本完成所属大部分研究所IR平台的建设上线。中国农业科学院系统的IR发展较晚,但建设上线速度很快,从2017年开始建设,2018年即完成了全部农科院系统IR的批量建设和上线。依据调研的IR建设时间数据,我国IR建设发展的时间历程如图2所示:

    3.1.3  地区分布对比分析

    所有IR的地区分布统计结果如图3所示。从中可以看出,中国大陆地区各省市自治区都建设有IR,但发展分布很不均衡。

    北京、上海和江苏是IR数量排行最靠前的3个省份,三地IR之和占到我国IR总数的三分之一强。经济发展水平高的东部地区和两湖地区,高校和科研机构数量也多于其他地区,有220个IR,占全国IR总量的67.7%。相应地,中西部地区高校和科研机构数量相对较少,经济发展水平相对落后,IR数量也较少,共有105个,只占全国IR总量的32.3%。高校系统和科研系统IR的地区分布状况与总体的区域分布状况基本相同,区域发展和分布的不均衡一样存在。

    3.1.4  资源建设类型对比分析

    我国IR资源收录内容丰富,收录了多种类型的数据资源,但主要以公开发表的文献为主,灰色文献及非文献资源占比较少。中国科学院机构知识库网格和农业机构知识库联盟统计有资源类型分布,且94%的科研院所IR都包含在这两个联盟,因此联盟的情况可以代表科研院所的情况;“双一流”高校的情况代表了我国高校的较高水平,因此高校的情况以可访问的“双一流”高校为样本,统计出各类型资源类型占比,如图4所示:

    由图4可知,IR收录资源比例最大的是期刊论文、学位论文和会议论文,这3种类型的资源占比达到了92%。非文本的资源、多媒体资源收录较少,比如录音材料、视频资料和工具软件等较少看到,非正式成果的保存现状堪忧,IR尚未发挥应有作用。科研院所IR对比高校IR情况可以看出,科研院所IR收录的资源数量较高校少,但类型更多样化,有一些平时不太常见的资源类型,比如考察资料、传媒扫描、大科学装置等。从资源覆盖的学科或主题范围看,高校IR的学科和主题范围基本与所属高校的学科和研究范围重合,大多属于多学科范畴。中国科学院的IR收录的资源与所属研究所相关,多属于学科IR范畴,理科比文科数据量更丰富,开放度也更高一点。

    3.1.5  构建平台及提供服务对比情况

    (1)平台软件类型。国内IR软件平台建设多选择自主开发或第三方软件平台。在可公开访问的IR中,以中国科学院和中国农科院为代表的科研系统IR全部采用了自主开发的软件平台;高校IR中,只有北京大学1家采用自主开发的模式,其余89家选择了第三方软件平台。第三方软件平台可提供成熟的功能套件,并提供一定的定制开发和数据服务,极大降低了IR建设的技术门槛,是越来越多机构建设IR软件平台的主要选择。只有厦门大学IR和广西民族大学IR在采用DSpace开源软件。国内目前主要的IR第三方软件平台有CSpace、超星、维普、同舟云、西安知先、湖南维度等,其分布如图5所示:

    (2)平台软件功能服务。尽管国内各IR采用的软件平台有差异,但各平台提供的核心功能基本一致,主要包括知识成果的存缴及管理、知识成果的发现利用服务、科研成果数据与相关科研实体数据汇集与开放互操作服务、个人学术主页、统计分析及图谱化揭示等方面。对各IR网站逐个调研,并基于软件类型进行归纳概括,每种软件类型IR的基本服务功能和扩展服务功能如表2所示。

    各软件平台均提供最基本的知识成果存缴管理和知识资源发现利用服务,提供多种知识成果的组织及浏览方式。各软件平台提供的IR成果基础发现功能大同小异,体现为分类导航、一站式检索等基础功能,引用、推荐、收藏、评注、导出、分析等支持用户利用的服务功能。部分IR支持通过与学校相关科研信息系统进行数据共享、交换与关联集成,实现学校科研成果数据与相关科研信息的关联利用和服务。

    为吸引研究人员参与,CSpace、超星、维普、西安知先等平台开发个人学术主页,提供包括个人简介、科研成果、成果统计、关联作者、研究热点、可视化分析等服务。同时,CSpace、维普支持导出学者分析报告,同舟云支持通过微信二维码查看学者报告且支持查看RDA关联数据格式。为获得领导部门支持,IR增设学科分析功能,致力于为我国高校学科评估、学科能力建设提供支持建设, CSpace、维普、超星、同舟云等IR建设平台功能体系中均有统计分析及图谱化功能,支持多场景组合条件下的数据分析及支持导出多种格式的报表。

    不同IR平台提供不同类型的个性化、细粒度的增值服务和扩展功能,CSpace扩展功能包括移动设备的兼容适应、新闻公告、学术讨论厅,偏向于用户体验、知识分享及交流服务;西安知先则包括学术期刊推荐、个人科研助理、团队科研协同等服务,偏重于科研管理服务。总体而言,目前我国大部分IR服务功能从最初的信息搜集、存储和展示,逐渐转向对服务教学、科研管理和学科建设提供支持,将IR转变为进行教学和科研活动的日常场所。

    3.2  机构知识库政策制定情况

    综合性的政策框架对IR的持续建设和运行服务至关重要。国际通行的做法是,在IR平台公开发布IR政策,供相关各方参考使用。对公开访问的IR的调研结果显示,有32家机构在平台发布了政策,其中高校30家,科研及其他系统2家。需要说明的是,IR平台发布的政策存在模板套用和政策内容完全一致的现象,某种程度上是因为IR平台本身提供一种通用政策框架,这些政策是否得到机构本身的认可和成为正式的政策,本次调查中笔者未对这种现象进行进一步核实。总体上,我国制定和公开发布IR政策的机构数量不多,管理运行工作有待进一步规范。

    3.2.1  高校IR政策制定情况

    在90家正常运营且可公开访问的高校IR中,有30家在平台(约33%)提供了政策信息,由于部分高校IR使用了相同的政策模板,政策內容完全一致,因此将其归为一类。对这些政策内容进行归纳分析后,发现共有9类包含实质性内容的政策,主要涉及内容政策、提交政策、保存政策、全文及元数据使用政策、撤回政策、隐私政策等方面(见表3)。

    目前高校IR政策有几个方面的问题:
      ①无院校级政策,政策多为图书馆部门或IR出台的管理措施,导致其政策实施力度不够;②数据政策不详不尽,多数内容政策都笼统地指出允许用户以个人学习、研究等非盈利目的,对存储在IR中的作品全文进行免费获取和使用,严禁机器恶意批量下载全文,使用过程注明引用信息,任何形式或媒介的全文商业销售必须得到版权所有人的正式许可等;③目前,高校制定激励人员存缴的政策的不多,未发现强制性举措;如何激励学者将学术成果存缴到IR中并及时开放共享,是个严峻的挑战;④版权政策不明晰,大部分高校IR提交者限定为在校人员,成果可以由作者本人或作者授权的委托代理人在任何时间进行提交,作品版权由原作者或第三方持有,任何版权的侵犯由作者全权负责。

    3.2.2  科研院所IR政策制定情况

    相比高校相对缺乏明确公开的开放获取政策声明,中国科学院和中国农业科学院都制定了院级的开放获取政策,为IR的内容建设提供了有利的制度保障。2014年5月,中国科学院发布了《中国科学院关于公共资助科研项目发表的论文实行开放获取的政策申明》[1],要求中科院系统的研究人员及研究生在学术期刊上所发表的研究论文,作者应在发表后12个月内开放获取。中国农业科学院于2019年7月也发布了《中国农业科学院关于公共资助科研项目发表的论文实行开放获取政策(草案)》,并做出了类似的声明。中国科学院和中国农业科学院也都依据国家《科学数据管理办法》分别出台了各自支持科学数据开放共享的实施办法[2-3],为IR下一步介入和参与科学数据的开放共享提供政策参考依据。

    在具体的IR实施政策方面,中国科学院IR在建设过程中出台了一系列支持研究所IR建设应用的政策体系:推出系列IR建设制度政策规范参考指南,《IR建设管理办法》《公共教育科研单位IR内容存缴与传播的权益管理政策指南》等。除院级IR政策之外,科研院所IR提供有详实的人员激励政策,如中科院IR的建设情况纳入全院年度科研信息化评估指标,部分研究所将其作为年度科研成果统计奖励基础和依据,研究所机构网站人才队伍栏目依托IR个人学术主页功能建设,利用IR知识资产统计服务来支持有关科研成果的统计分析和辅助支持有关评估应用工作;中国农业科学院的IR也借助各院所科研处,将科研管理、项目申报、成果评价一体化,将IR发展与科研绩效评价挂钩。这些激励政策在一定程度上促进了IR的发展和研究人员积极性。

    3.3  国内科研机构和高校机构知识库应用现状

    3.3.1  数据规模

    由于IR内部访问和资源统计信息不公开现象比较普遍,调查反馈的数据存在模糊性表述的情况也比较多,结合各公开访问IR的数据,粗略统计,我国IR收集各类科研成果信息的总量在1400万条,主要为公开发表论文,具体统计结果如表4所示:

    3.3.2  全文收录情况

    可统计的全文科研成果200多万件,占到总资源量的14.4%,可开放获取全文科研成果近30万件,仅占总资源量的2%多一点。因部分IR全文量统计获取问题,实际全文科研成果和开放获取全文成果预计会略高于目前的统计结果。根据IR全文资源量的规模,开放访问且可获取全文量的IR可以归为如下5个级别,具体分布结果统计如表6所示:

    可以看出高校系统IR在资源总量上占优势,但在资源的开放获取服务方面不如科研院所。高校IR的全文收录率较低,大部分不到50%,且相当一部分高校IR仅提供论文成果的原文链接,甚至有些连全文链接也没有。直接提供全文下载的高校IR仅有厦门大学、重庆大学、广西民族大学等少数几家。两大IR建设体量较大的科研系统中,农业IR联盟的所有IR目前未收集全文,中国科学院系统的IR在全文收录和开放获取服务方面进展较好,部分研究所的全文收录率和全文开放率可达100%,大部分研究所的全文收录率都可达50%以上。

    3.3.3  开放程度

    IR的开放性和国际化程度对于IR促进机构成果的开放获取和开放传播极为重要,主要从IR收录全文的开放度、元数据开放收割性、国际化登记和收录性、跨语言界面和环境等方面对我国IR的开放性和国际化程度进行分析。

    (1)互联网可访问性。除去已经中止服务和在建的IR,剩余的全部287个正常运行和服务的IR中,支持互联网公开访问的IR共有209个,占72.8%;不支持互联网公开访问即仅支持机构内部访问的IR共有78个,占27.2%。在131个正常运行和服务的高校IR中,支持互联网公开访问的有92个,仅支持校内访问的有39个。在156个正常运行和服务的科研系统IR中,支持互联网公开访问的有117个,仅支持内部访问的有39个。

    要利用资源和平台优势将IR打造成学科服务平台,为用户提供个性化、专业化的知识服务。可从以下两个方面入手:①顺应科研数据管理的需求,支持科学数据管理的政策与流程嵌入、组织模式以及与文献的关联服务,实现IR与重大科学装置的成果关联,服务装置、文献、数据、人员、项目等科研实体信息的关联共享与组织服务。②将可管理科研知识对象、内容类型扩展,增加对科学数据、图形图像、音视频、三维对象等非文本科研内容管理,支持数据与相关实体的关联,研究成果的跟踪采集与更新服务,项目产出成果关联报告服务,支持科学数据及相关知识的语义整合管理。目前已有IR融入科研管理全过程的实践,将IR嵌入学科服务,为研究人员提供更加精准化的知识服务。

    4.4  取消不必要的访问限制,加大开放获取实施力度

    我国高校IR大多提供有限制条件的访问,多数只对校内IP范围内的用户提供全文下载权限,更注重实现学校知识资产集中管理与保存的功能,不注重知识的扩散与共享。我国IR提供多种访问级别:①可对外提供无限制的全文下载,如大部分中科院IR;②可提供部分资源的无限制全文下载,如山东大学IR和中科院部分研究所;③可直接浏览其资源,但不提供下载服务;④仅提供资源全文链接,不提供全文浏览和下载;⑤完全不对外提供服务。不必要的访问限制在促进机构学术成果的可见性和影响力提升方面难以发挥应有作用,对融入国际化发展和应用不够重视,降低了IR的可用性及全球影响力,大部分IR系统成为实实在在的本地应用。

    应取消不必要的访问限制,对不同类型的资源根据其资源属性及作者需求提供相应的开放措施,如期刊论文、会议论文、学术专著及章节等公开或半公开发表的学术成果,可参考著作权法或通过取得作者授权等方式合理地放开全文限制访问;而学位论文、培训课件及内部资料等灰色文献,很多内容属于暂时不公开发表的成果,可以采用元数据公开、全文限制获取方式使用。

    5  结语

    本文对我国大陆地区科研机构和高校IR的总体情况进行了调研,分析了我国IR的基本建设情况、政策制定情况和IR应用情况,分析当前IR发展可改进的方面,并提出相应地解决方案,以期为IR发展提供参考。总体来说,我国IR的建设取得了一定成就,2019年我国IR整体规模持续增长,在建及拟建IR数量不断增加,中国IR的总量已位列世界前10,资源规模大幅增长,服务效果和效应逐步提升。然而,我国IR发展还有很大潜力,绝大部分高校还没有建设IR,42所“双一流”高校中只有17所建设了IR,从整体上来说,现有IR的资源建设水平和服务功能都有待完善。IR发展存在管理政策不完善、访问限制过多、知识产权不明确、开放性不足、自存储率低等一直未能有效解决的老问题;也涉及在国际知识库发展至新阶段之后面临的新挑战和新问题,如多元复杂开放科学内容的采集管理、主动融入与动态互操作、机器智能内容服务等。

    IR发展到现阶段,其所承载的职能已不再仅是管理和传播该机构的数字资源,更应具有更深层的作用,是促进知识成果开放共享、争夺学术交流话语权、提供技术及科研支撑的重要组成部分。IR在发展过程中,需要借鉴供给侧思维来调整功能和服务建设的目标,提升有效知识、服务供给的能力和水平,成为有用的资源系统和技术平台,淘汰“落后产能”,废止无效应用、服务供给,创造新供给,引领新需求,提供新服务。应建立完善的管理与服务体系,加强内容资源建设,以科研人员需求为核心及出发点。进一步借鉴企业数据中台的理念,使IR成为机构的学术数据中台,将IR建设融入科研人员科研过程,成为以科研人员为核心的科研信息、知识集成管理中心和科研人员日常工作流的一部分。展望未来,IR需借力开放获取运动和开放科学加速发展的东风,从面向机构智能开放知识基础设施、支持数字学术的开放获取平台环境、融入和支持开放科学过程等多方面提升应用服务价值及用户体验,在促进与支持数字学术和开放科学发展中发挥不可替代的作用。

    参考文献:

    [1] 中国科学院.中国科学院关于公共资助科研项目发表的论文实行开放获取的政策申明[EB/OL].[2019-12-23].http://www.cas.cn/xw/yxdt/201405/P020140516559414259606.pdf.

    [2] 中国农业科学院.中国农业科学院开放获取与科学数据管理办法印发 [EB/OL].[2019-12-23].http://aii.caas.cn/bsdt/zhdt/216208.htm.

    [3] 中国科学院.中国科学院科学数据管理与开放共享办法(试行)[EB/OL].[2019-12-23].http://www.cas.cn/tz/201902/P020190220358041915907.pdf.

    [4] 中国科学院.中国科学院机构知识库网格.[EB/OL].[2019-12-23]. http://www.irgrid.ac.cn/report?type=summary.

    [5] 中国高校机构知识库联盟[EB/OL].[2019-12-23].http://chair.calis.edu.cn/.

    作者贡献说明:

    张  伶:负责论文的数据获取、提纲与撰写;

    祝忠明:负责论文的修訂;

    寇蕾蕾:负责文字修订;

    姚晓娜:负责数据调研。

    Investigation and Comparative Analysis of Institutional Repository in Chinese Scientific Research Institutions and Universities

    Zhang Ling1,2,3  Zhu Zhongming1  Kou leilei1,2  Yao Xiaona1

    1. Northwest Institute of Eco-Environment and Resources,Chinese Academy of Sciences, Lanzhou 730000

    2. Department of Library Intelligence and Archives Management, School of Economics and Management, University of Chinese Academy of Sciences, Beijing 100049

    3. Xinxiang Medical University Library, Xinxiang 453000

    Abstract:
    [Purpose/significance] At the important node of IR development entering a stable period and in the transition to the next generation of IR, this paper reviews the construction process, status quo and challenges of institutional repository in China, so as to achieve the purpose of accelerating and deepening the development of IR in China. [Method/process] First, it adopts the empirical research method combining the network survey method and telephone and email survey methods, and takes domestic universities, Chinese Academy of Sciences, Chinese Academy of Agricultural Sciences and other scientific research institutes as the survey object to investigate the development status of the national IR; second, the survey results  According to the comparative analysis of the university system, scientific research system and the overall situation, summarize the IR development achievements and problems. [Result/conclusion] Some achievements have been made in IR construction. The number of IR under construction and to be built is increasing, and the resource scale is increasing greatly. However, there are some problems in the development of IR, such as imperfect management policies, excessive access restrictions, unclear intellectual property rights, insufficient openness and low self storage rate.

    Keywords:
    Institutional Repository    scientific research institutions    universities    construction status

    相关热词搜索: 科研机构 知识库 调研

    • 生活居家
    • 情感人生
    • 社会财经
    • 文化
    • 职场
    • 教育
    • 电脑上网