• 休闲生活
  • 教育教学
  • 经济贸易
  • 政法军事
  • 人文社科
  • 农林牧渔
  • 信息科技
  • 建筑房产
  • 环境安全
  • 当前位置: 达达文档网 > 达达文库 > 环境安全 > 正文

    大数据背景下的中文阅读

    时间:2021-04-09 07:56:20 来源:达达文档网 本文已影响 达达文档网手机站

    摘 要:本文以大数据为背景对中文数据库的阅读展开分析,并梳理了大数据、数据库的基本内涵,以及中文数据库的发展状况,主要以郑州大学河南文献数据为例,从其特色内容、检索途径、检索方法、功能作用等方面简要分析了中文数据库的阅读与使用。

    关键词:大数据;数据库;中文阅读

    作者简介:林冉(1992-),女,汉族,福建福州人,郑州大学文学院中国古典文献学硕士研究生二年级在读,研究方向:先秦两汉文学文献,发表论文2篇。

    [中图分类号]:G250.74 [文献标识码]:A

    [文章编号]:1002-2139(2016)-12--03

    郑州大学河南文献数据库是大数据时代的产物,该数据库中保存着河南省珍贵的历史文化资料,介绍其使用的方法有利于进一步推广该数据库,同时对致力于研究河南省的读者也具有一定的意义。

    一、大数据时代数据库建设

    (一)大数据的定义及特点

    随着电子信息技术的发展与普及,我们正生活在一个信息爆炸的大数据时代,充斥着形形色色、令人眼花缭乱的信息资讯。大数据并非产品也不是技术,只是数字化时代的一种现象[1]。关于大数据的定义,学术界尚未得出一个统一的结论。如基维百科将大数据定义为规模巨大到无法用目前的软件工具处理的巨型资料量,在相应时间内完成撷取、管理、处理后利于企业完成经营目标的资讯;再如研究机构将大数据定义为必须用新型的处理模式才能更好地洞察、决策并优化流程的巨量、多样化且高速增长的信息资产;而麦肯锡的定义则为大数据是一种数据集合,且在一定时间内无法利用传统的数据软件对其进行数据采集、存数、管理及分析[2]。由此我们可以看出,大数据的特点即数量大、种类多、运行速度快。

    (二)数据库的建设及作用

    计算机的发明与普及,使数据量不断增长,大数据背景下产生了数据管理技术,数据管理技术的发展经历了以下四个阶段:人工管理阶段、文件系统阶段、数据库阶段和高级数据库技术阶段。而数据库的历史可以追溯到五十年前,当时人们利用穿孔片及磁带进行数据储存。随着人们对于数据共享的要求越来越高,传统的文件系统早已不足以满足人们的需求,因而统一管理和共享数据的数据库管理系统(DBMS)应运而生。根据数据模型的特点,数据库系统被分成网状数据库、层次数据库和关系数据库三类。本文所研究的数据库指的是在大数据时代,储存着大量信息的大型信息数据库。本文认为,数据库广泛应用于社会的各行各业,按照数据库的使用的领域,又可以将其分为金融数据库、医学数据库、政府数据库、商业数据库等。

    大数据时代,信息冗杂,若不加以分类,信息查找者便难以在大数据的世界中搜索到目标信息数据。数据库的发明与应用有效地解决了这一问题,数据库拥有分门别类处理信息数据的功能,它使纷繁复杂的数据条理化、门类化,并提供了便捷的检索途径,使信息查找者通过关键词的检索迅速匹配到他们所需的信息,极大程度上节约了人力与物力,帮助人们便捷高效地从海量信息中挖掘出有价值的信息。

    二、中文数据库发展及阅读

    信息资源的开发与利用是衡量国家综合国力的标志之一,而中文数据库建设是我国信息资源建设的主要组成部分,中文数据库的阅读对于提升我国软实力具有重要的意义。

    从国际数据库的发展来看,美国是数据库和联机检索服务的最大提供者,也是最大的市场。其数据库开发和联机检索服务一直是其信息服务业的主体,增长率最高[3]。日本、英国、德国等发达国家也同样对数据库建设投入了大量资金,企图扩大市场份额。20世纪80年代中后期,我国利用国外数据库技术开始开发国产中文数据库。1979年,我国开始引进美国国会馆MARC磁带,数据库在我国逐步推广应用,到了上世纪90年代,我国出现了全文数据库的供应商[4]。

    中文数据库建设相比较于发达国家而言,起步比较晚,数据库技术也主要是引进国外的技术。近几年来,我国更加重视中文数据库的建设,进一步加大了投入,如CNKI系列数据库、万方数据库、维普中文科技期刊数据库、中宏数据库等为代表的中文数据库的数量逐渐增多,其占中文话语市场的份额也在不断扩大,中文数据库得到了长足的发展。

    中文数据库数量的增加、涉及领域的扩大为国内用户在大数据背景下浏览各类信息提供了便捷的渠道。中文数据库的阅读改变了传统纸质期刊阅读的方式,将阅读进一步推向了数字化。一些中文数据库中收录了我国经典古籍及优秀的文化作品,中文数据库的阅读拓宽了中华灿烂文明传播的广度,使经典的传承与发扬更加便捷。在纷繁复杂的大数据时代,中文数据库的建立与发展对于国家软实力的提高具有重要意义。

    三、以郑州大学河南文献数据库为例简析中文数据库的阅读与使用

    (一)数据库简介

    郑州大学河南文献数据库是郑州大学图书馆于2004年研制开发的CALIS(中国高等教育文献保障系统)专题特色数据库项目之一,属于典型的中文数据库,其中收录了河南省诸多珍贵文献资料,共有81109条记录。该数据库收录的数据资料内容丰富、形式多样,不仅收录大量河南文献、报刊、学位论文的相关介绍,而且还收录了具有地方特色的名人介绍、名人手稿、名胜古迹图片等,涉及了方志、年鉴、文学、党史、文化艺术、社会生活、政治、军事、工运、妇女、文物考古、教育、卫生、统计资料、水利、黄河文史资料、财政金融工商税务、工业、农业等领域,对于这些珍贵资料的购买与获得均提供了联系方式。河南文献数据库的网址访问路径位于郑州大学图书馆网址首页数据资料栏目的自建数据库内,建库至今数据库总访问量已经达到541600人次。数据库以系统齐全的地方文献收藏和多角度深层次的研究,为致力于研究河南的学者提供了检索河南文献的途径与导向。

    (二)特色内容分析

    郑州大学河南文献数据库最突出的特点是收录了大量与河南相关的珍贵的文字、图片资料,拥有其他数据库所不具备的资源优势,凸显了鲜明的河南特色。数据库的特色内容包括7个板块——河南文献、旧志提要、珍稀报刊、历代名人、名胜古迹、名人手稿、特色学位论文,为有兴趣研究河南的读者提供了了解河南的良好向导。

    河南文献板块中收录了与河南省相关的各个方面的文献资料,涉及了政治、经济、文化、地理等领域。数据库虽仅是为研究者提供检索的向导,未将文献全文收录其中,但提供了文献创建者、编辑者、出版者、出版时间、ISBN号、开本、地域、页码、复本、购买方式等信息,为研究者检索提供了极大的便利。

    旧志提要中涵盖了河南省各县市的地方旧志,并对版本、卷册、地区以及购买联系方式等基本信息做了简要介绍。该数据库中保存的地方旧志版本均属于明清及民国的刊本、刻本、稿本以及铅印本。旧志内容包含了河南省古代名物典章、地方性的人、事、物,为研究该市、县的学者提供了宝贵的资料。

    珍稀报刊共保存了40201份史料,该数据库介绍了作者、来源刊名、来源卷、出版地、页码、关键字、学科分类号、联系方式等基本信息。这些珍贵资料记录了不同时期在河南省发生的重大事件,内容丰富全面,若不是专门收集保存,目前在市面均很难找到,因此该数据库对于了解与研究河南省的历史具有重要的意义。

    历代名人,数据库共列举了从古至今17887位河南省名人,如著名的政治名人范蠡、李斯、岳飞等,文化名人杜甫、李商隐、干宝等,以及其他时代的名人。数据库注明了名人所属的地域、生年卒年、朝代、著作、民族等信息,数据库还专门提供了名人传记全文下载。

    名胜古迹板块共有3134处名胜古迹,按照名人故居、陵墓、古遗址、古城址、寺庙、古塔、风景区等类别进行分类,标注了创建者、所属地区、年代、来源,并对其做简要的介绍,数据库还提供图片下载,图文并茂地展示河南省人文与地理景观,有利于检索者更加直观地感受其魅力。

    名人手稿与特色学位论文。名人手稿共4092篇,收录了来自文学艺术、政治经济、宗教、传媒、农业、计算机计算、少林武术等领域的文章,这些文章均出自河南籍各界名人学者之手,为研究河南名人及河南文化思想的读者提供了宝贵资料。数据库中收录了7754篇特色学位论文,所有的特色学位论文都是以河南省作为研究对象的,涉及了众多学科专业,具有很强的学术性与实践性,对于全面地了解河南省具有一定的作用。

    (三)检索方法分析

    数据库首页设置了快速检索与高级检索两大检索方法。有利于读者快速锁定目标文献,基本上均能满足读者的检索需求。

    快速检索属于初步基本检索,通过题名、作者、关键词途径即可进行检索,一般情况下快速检索所得到的文献数量较多,难以一步到位精确到检索者所需要的目标信息。此外,该数据库的快捷检索不支持同时输入两个以上关键词进行检索,即读者通过题名、作者、关键词三个途径进行检索时只能输入一个词,系统才能进行正常检索,否则系统将显示无纪录。因此,检索者在此数据库中进行快速检索后还需进一步筛选信息。

    高级检索相比较于快速检索而言更加智能,搜索得到的文献更加精准、范围也更小。在高级检索界面,可同时在题名、作者、关键词(主题)、地域选择框中输入信息,系统将围绕着这四项信息进行匹配。此外在高级检索中还能选择检索来源,检索者可根据自己的需求选择以整个数据库为范围,或在数据库下设的7个板块中任选其一作为检索范围。快捷检索与高级检索各有千秋,快捷检索适合于模糊查找,而高级检索则更精准地匹配到目标文献,读者可根据自己的阅读需求进行选择。

    (四)检索途径分析

    郑州大学河南文献数据库设置了多种检索途径,基本满足读者从全部、题名、作者、关键词等常用途径的检索外,还结合数据库各个板块的特色设置了其他检索途径。在河南文献板块与珍稀报刊板块中增加了出版地与学科分类号两种途径;名胜古迹检索途径增加了所属地与古迹分类;名人手稿的检索途径增加了出版社与文摘类型;旧志提要的检索途径则为题名、年代、地区;历代名人的检索途径为全部、作者、籍贯、职务、地域、关键词;特色学位论文的检索途径为题名、作者、关键词。数据库根据不同的资料类型提供个性化的检索途径,方便读者的查找与阅读使用。

    (五)作用意义分析

    郑州大学河南文献数据库作为郑州大学自建特色数据库,为广大感兴趣于研究河南的读者提供了了解河南省的重要窗口,正如郑州大学河南文献数据库网站介绍所说,它是“探索河南奥秘的文献中心,开启中原文化的一把钥匙。”中原文化悠久而灿烂,是中华文明的重要组成部分。河南文献数据库收录了大量珍贵的河南文献资料为河南文化的传承做出了贡献,为致力于研究以及有兴趣了解河南的广大社会人士提供了良好的向导,通过这个向导,读者不仅可以感受到中原文化与历史的厚重感,而且还能领略到名胜古迹的独特魅力。此外,数据库的开发与使用有利于河南省文化产业的发展,有利于各界人士增进对河南的了解及共同开发河南省丰富的文化资源,进而促进河南省文化与经济的进一步发展。

    四、结语

    随着电子信息技术的发展,当今世界已经进入了一个大数据时代,面对纷繁复杂的大数据,数据库技术的产生无疑促进了大数据的条理化与门类化,提高了阅读效率。中文数据库伴随着中文信息的快速增长,其数目不断增多,信息更加全面,市场的份额也不断扩大,为读者提供了诸多便利。河南文献数据库作为一个典型的中文数据库,反映了大数据时代中文数据库收录内容丰富、检索途径多样、检索方式灵活、检索效率高、具有鲜明中国特色等特点。同时,在大数据背景下,其为河南省灿烂文化的传播做出了一定贡献,利用好这个特色数据库进行阅读与查找河南文献对于了解与研究河南都具有重要意义。

    参考文献:

    [1]程陈.大数据挖掘分析[J].软件.2014,35(4):130-131.

    [2]葛春燕.数据挖掘技术在保险公司客户评估中的应用研究[J].软件,2013,34(1):116-118.

    [3]李莉莉.关于信息资源开发与数据库建设的思考[J].情报杂志,1998,17(5):29-30.

    [4]钟文一.我国国产全文数据库的检索阅读平台研究[J].情报杂志,2003,10(6):89-92.

    相关热词搜索: 中文 数据 背景下 阅读

    • 生活居家
    • 情感人生
    • 社会财经
    • 文化
    • 职场
    • 教育
    • 电脑上网