• 休闲生活
  • 教育教学
  • 经济贸易
  • 政法军事
  • 人文社科
  • 农林牧渔
  • 信息科技
  • 建筑房产
  • 环境安全
  • 当前位置: 达达文档网 > 达达文库 > 环境安全 > 正文

    大数据时代本科数据库课程体系改革设想

    时间:2021-04-09 07:51:48 来源:达达文档网 本文已影响 达达文档网手机站

    文章编号:1672-5913(2015)11-0104-04

    中图分类号:G642

    摘要:从大数据时代的新应用出发,从数据库的基本理念、支撑技术和实践平台3方面分析大数据时代本科数据库课程教学和人才培养的需求,提出以数据库系统概论、海量数据分析和数据库系统实践为主线,以前沿讲座为补充的教学体系设想,说明实施这一设想所需的保障措施。

    关键词:大数据时代;本科数据库课程;教学体系改革;教学内容;实践教学

    1 大数据时代本科数据库教学的需求

    随着数据采集、应用模式和Web2.0技术的迅速发展,以Web搜索、电子商务、个性化信息服务、社交网络等为典型代表的以数据为中心的新型应用蓬勃发展。随着大数据时代的到来,互联网服务转变为以数据处理为中心的服务,企业关注的重点转向数据的搜集、整理和应用,计算机行业从追求计算速度转变为要求数据处理能力,应用软件也转变为以数据为中心,业务就是数据本身,大数据已经成为学界和业界关注的焦点。数据社会化的趋势和日益显著的移动互联网特征,使得面向大数据的数据库基本理念、方法与技术自然地成为了计算机专业课程教学中必不可少的内容。

    传统的数据库课程体系以关系数据库理论、设计和操作为主线,尤其是西部地区的地方院校,数据库课程的教学内容仍是20世纪80年代以前数据库学科的技术。有些院校虽然对课程体系和教学内容进行了基于Web应用的“插件式”调整,但是仍不能适应大数据时代数据管理与分析的需求。大数据时代,数据管理与分析技术呈现出空前的重要性,这对数据库课程的教学提出新的挑战。传统的数据库课程教学体系已经不能适应实际应用对数据库专业人才的要求。

    (1)从数据库的基本理念看,传统的数据库课程教学以严格的结构化数据(即能够按照关系模型组织起来的数据)为对象,基于关系数据模型的理论和概念,讲授数据管理的方法和技术。按照所谓的80-20规则,世界上20%的结构化数据主要是事务数据,产生80%的价值;80%的数据为非结构化数据,包括新型应用中的用户生成数据,它们无法存储到关系数据库中。随着数据采集、存储技术和云计算的迅速发展,大量非结构化数据的存储和处理已成为可能。非结构化数据具有长尾现象,80%的非结构化数据产生的20%价值越来越受到关注。为了适应这种变化,数据库课程体系中应该增加对海量非结构化数据的管理与分析技术。

    (2)从数据库的支撑技术看,传统的数据库课程教学针对数据库设计这一核心内容,主要讲授基于ER模型的工程化方法、基于数据依赖和规范化的理论方法以及查询处理与优化、事务机制。然而,以数据为中心的应用已经发生了实质性的变化,从数据查询到Web搜索、电子商务及个性化推荐等,传统的事务处理机制已经不能适应互联网应用的新需求,针对异构海量数据、支持分析处理的分布式数据处理技术越来越受到关注。应运而生的NoSQL,泛指一切与传统关系数据库或关系一对象数据库不同的技术,包括非关系数据模型、非ACID事务模型、分析型和搜索型应用、大规模集群上的DBMS等概念。随着应用的发展,关系型数据库系统不适用的环境越来越多,NoSQL成为有益的补充。因此,数据库课程体系中除了具有经典的SQL数据管理技术外,还应增加NoSQL数据管理技术。

    (3)从数据库的实践平台看,传统的数据库课程教学主要使用SQL Server、DB2或Oracle这类商用关系型DBMS,以及相应的非结构化数据操作和应用。然而,当前结构化与非结构化数据同等重要地位以及SQL与NoSQL共存的客观现状,使传统的DBMS作为数据库课程实践平台显现出明显的不足。此外,由于集中式部署很难适应互联网大规模应用对扩展性的要求,源自阿里巴巴的“去IOE”运动(弃用IBM的小型机、Oracle数据库及EMC存储),也作为目前保证国家金融和财政等领域安全及反垄断的一场技术革命。虽然仍有争议存在,但是代表着大数据时代的分布式架构和开源系统替代集中式架构和商用系统是必然的趋势。因此,数据库课程体系中的实践平台除了经典的关系型DBMS,还应增加开源系统及相应的开发平台。

    综上所述,大数据时代的到来使得数据库技术在学界和业界的各个层面有了空前的迅速发展,令数据库的理念、技术和平台随着应用的变化而有了新的内涵;对数据库课程的教学体系进行改革,势在必行。作为高校数据库系列课程最具基础性、重要性且受益范围最广的本科数据库课程体系改革,就凸显出必要性与迫切性。笔者以云南大学计算机科学与技术专业本科数据库课程为例,针对上述数据库理念、技术和平台在大数据时代的新变化和数据库专业人才培养的新需求,借鉴国内一些高校所开设的大数据和云计算相关课程的思路,结合多年开设数据库课程和从事学术研究的经验,给出大数据时代本科数据库课程改革的设想,提供一些可供参考的思路和范例。

    2 课程设置与教学内容

    改革后,本科数据库课程体系以数据库系统概论、海量数据分析和数据库系统实践3门课程为主线,以前沿讲座为补充,以程序设计、数据结构、操作系统、软件工程、算法设计与分析等课程为先修课程,强调动机和思路的讲授,开展双语教学。课程体系针对大数据时代数据库学科的特点和课程教学需求,将关系数据管理技术与非关系数据管理技术相结合,将经典传统技术与新兴技术相结合,将理论与实践相结合。课程体系既包括数据处理,又包括数据分析;既为经典的关系型数据库应用提供支撑技术,又为新型的非关系型数据库应用提供借鉴;既满足“理论与分析”的研究型人才培养需求,又满足“综合与开发”的应用型人才培养需求。

    1)数据库系统概论讲授经典的关系数据模型和相应的数据管理技术,必修,每周3学时。

    经典的数据库技术包括数据库学科重要和通用的基础理念和思路。例如,数据的结构化通过数据建模进行语义抽象,从而达到模式和实例分离的目的,包含数据结构(二维表)、操作(关系代数)和完整性约束(实体完整性、参照完整性和自定义完整性约束)的关系数据模型。事务管理模型和事务管理关键技术的突破使得支持大量并发访问用户成为现实,并有效地支持了数据库恢复和保护机制的实现,把数据库系统打造成了一种全面可实用的系统。事务处理是数据库管理系统的重要标志,也是互联网时代数据管理的重要特征和挑战。数据库系统概论是大数据时代数据库技术的“基础篇”。

    课程重点讲授关系数据模型、ER模型和数据库逻辑设计、查询优化和数据库物理设计以及事务管理;介绍关系代数、函数依赖和规范化的基本思想和理念;简单介绍SQL、视图、快照、存储过程和触发器的基本思想;期末采用闭卷考试方式进行考核。

    2)海量数据分析讲授NoSQL数据管理技术、系统和编程模型,选修,每周3学时。

    NoSQL数据管理技术是关系型数据管理技术的有益补充,包括针对异构海量数据的存储、查询和分析技术,是以Web搜索、电子商务、个性化信息服务、社交网络等为典型代表的新型应用的支撑技术,也是大数据时代数据分析的主要支撑技术,是目前信息检索、数据挖掘、机器学习等领域的重要关键技术。该课程是大数据时代数据库技术的“提高篇/新技术篇”。

    课程主要讲授大数据概念的含义、大数据时代数据管理的新挑战、Google大数据管理技术(包括Google文件系统、MapReduce编程模型、BigTable数据管理工具、Hadoop)、以HBase和Hive为代表的海量数据管理平台、面向OLTP提供NoSQL扩展性的NewSQL代表技术C-Store关系数据库系统、针对经典数据挖掘算法的海量数据挖掘与分析算法。课程结合实验,采用实习项目及报告方式进行考核。

    3)数据库系统实践(一)是数据库系统概论对应的实验课程,必修,每周2学时;数据库系统实践(二)是海量数据分析对应的实验课程,选修,每周3学时。

    数据库是计算机科学领域中理论与应用结合最紧密的学科,是近年来发展最快的学科之一。该学科一直有明确的工程背景和应用驱动的特点。无论是传统的关系型数据管理技术,还是新兴的NoSQL数据管理技术,实践环节都必不可少。只有理论与实践相结合,才能使学生真正理解技术的内涵和理念,针对实际中的特定问题具备设计与实现的能力。该课程是大数据时代数据库技术的“实践篇”。

    数据库系统实践(一)以关系型DBMS为实验平台,在实验室PC机上完成,实验内容包括数据库设计、查询处理、优化、性能测试、事务管理、视图、存储过程、触发器等。数据库系统实践(二)以分组形式完成实验,实验内容包括分布式集群搭建、Hadoop系统配置、HBase和Hive系统配置和数据管理、MapReduce编程模型应用、海量数据存储与查询、海量数据分析算法的实现与性能测试。

    4)前沿讲座是课程教学的有益补充,一学期3-4次。

    大数据时代催生了一系列新应用,如Web搜索、电子商务、个性化信息服务、社交媒体分析等。这些新应用的实现需要理论、架构、方法、平台等多层面、全方位的新技术,为学界与业界所共同关注。学界和业界的研发工作日益渗透交叉,技术创新在大数据时代迅速发展。在课程体系中穿插对特定领域或问题的研究综述和前沿技术报告,使学生能在学校了解学科发展的新动向和新趋势,有助于他们更好地理解课程知识和在实际应用中所扮演的角色,把握数据库学科的最新发展,为自己职业生涯的规划提供一定的启发。

    讲座内容涉及大数据时代数据管理与分析的专题和前沿技术,如大数据环境下的数据管理与知识发现、面向位置服务的数据管理与分析、面向计算广告的海量数据管理等。

    3 实施与保障

    改革后的课程体系与传统的数据库课程体系相比,一方面是根据大数据时代数据库学科的特点进行了调整,例如,不仅强调函数依赖和规范化的基本思想与理念,而且强调数据库的事务管理机制;另一方面是根据大数据时代以数据为中心的新型应用及数据管理的新需求,增加了非结构化数据、NoSQL、开源数据库系统平台、前沿讲座等内容。这一课程体系改革的设想,对计算机科学与技术专业本科生在数据库学科方面应掌握的知识进行了系统的规划,并以此框架为基础,随着数据库学科的不断发展增量式地完善教学体系,不断适应数据库专业人才培养的新需求,建设本科数据库课程群和教学团队。同时,教学体系改革的实施也对师资及设备条件的改善提出了更高的要求。

    (1)师资队伍是实施数据库课程改革的前提。目前,数据库课程的任课教师擅长传统的关系型数据管理技术(即数据库系统概论和数据库系统实践(一)中的内容),缺乏胜任海量数据分析和数据库系统实践(二)课程教学的能力。师资队伍成为实施改革的主要瓶颈,新的课程体系对任课教师的水平和能力提出了更高的要求。针对海量数据分析和数据库系统实践(二)的教学内容和要求,学校应进一步充实专业师资队伍,可从IT企业聘请讲师,或者通过培训与自主学习相结合的方式提高现有师资的业务素质,达到补充骨干教师的目的,提高本科数据库课程教学团队的水平。

    (2)实践平台是实施数据库课程改革的基础。目前,西部院校的计算机专业实验室缺乏可供部署海量数据管理平台的分布式集群以及相应的软件配置;应从实验课程的角度,借鉴“去IOE”的思路,配备能满足学生人数、实验项目和运行相应软件系统的硬件平台(由个人电脑或服务器构成)。数据库系统实践(二)课程教学中使用开源软件,也要通过上述的硬件设施为实验课程的顺利开展提供平台基础;不断完善实验教学,最终建成数据库系统实验室。

    (3)对计算机科学与技术专业课程教学计划的系统性调整,是实施数据库课程改革的政策性保证。教师要站在全局的高度,对本专业的专业课程进行全面考虑,对数据库课程群给予充分的重视,根据课程需要优化专业课程和先修课程设置、教学时数和实践环节安排等。

    4

    结语

    笔者提出的本科数据库课程体系改革的设想,旨在为大数据时代本科数据库课程体系改革提供一些参考和一种可增量式更新的教学体系范例。这些设想要在师资队伍、实验平台以及系统性的教学计划支撑下,才能有条不紊地实施。需要各相关专业对教师、经费、平台、时间安排等方面进行系统性的综合考虑和落实。在课程体系改革框架下,经过一段时间的实施完善,教师还可以进一步将一些专业认证融人课程教学中,这也是我们正在进行的探索与尝试。

    相关热词搜索: 设想 课程体系 本科 改革 数据库

    • 生活居家
    • 情感人生
    • 社会财经
    • 文化
    • 职场
    • 教育
    • 电脑上网