区域化基础教育数据库系统建设探究
摘要:文章探究了区域化基础教育数据库在教育和管理信息化融合和创新中的重要地位,分析了基础库系统的建设内容和目标,同时,指出基础库系统的技术实现方式。
关键词:教育信息化;数据库;信息资源
中图分类号:G434;TP311.52 文献标识码:A 文章编号:1673-1131(2015)10-0122-02.
1 研究背景
近年来,随着计算机技术及互联网的迅猛发展,将信息技术应用于教育领域已成为世界各国教育变革的一种趋势。我国从 20 世纪 90 年代开始,逐步将信息技术应用于教育领域,经历了启蒙阶段、基础设施建设阶段、应用建设阶段[1]。当前正处在融合创新阶段。《教育信息化十年发展规划 2011-2020年》特别提出,力争到 2020 年实现全面融合和部分创新的阶段性发展目标。
通过梳理不难发现在应用建设阶段教育系统建设了大量教学和管理相关的应用,数字化校园普遍建设,数字化教学蓬勃发展。随着教育信息化应用不断建设和使用,将会积累大量的数据。这些数据如果管理融合不到位也会形成诸多信息孤岛,同时,如果对其进行有效管理和融合,将在未来个性化学习,学生综合素质评价等方面产生非常重要的价值。因此,数据收集、数据处理、数据管理和数据共享已经成为了当前教育融合创新的重要探索方向[2]。
在过去的 10 年中,学校大多作为应用建设的主体,但随着全面融合的需求越来越强烈,以一个学校的力量显然是难以完成的。因此,在教育部教育信息化推进办公室发布的《教育管理信息化建设与应用指南》其中明确指出需要建设地市区县教育基础库。同时,在一些信息化发达地区,如苏州工业园区、昆山,已经尝试建设区域化基础教育数据库系统,提升信息化教学和管理成效。
2 区域化基础教育数据库建设内容和目标
在教育部教育信息化推进办公室发布的《教育管理信息化建设与应用指南》中对地市区县教育基础库的定义是:“依托省级教育数据中心,建立统一集中的本级基础数据库,支撑统一的电子办公、业务管理、数据交换、业务监管等功能,满足本级教育管理与服务的需求。为用户提供集成的管理信息服务,实现对上与省级系统、对下与所辖教育行政部门和教育机构(学校)信息系统的贯通和数据共享。”
在具体实践中,可以将基础库建设目标分解为以下几部分:
(1)建立教育数据资源体系。梳理分析区域教育数据资源,针对各类数据来源,建立清洗比对规则,形成区域教育数据资源目录。
(2)建立教育数据库。建设教育数据管理平台,进行教育数据资源采集加工,完成教师、学生、教育机构基础数据库及主题数据库建设,同时完成数据入库工作。
(3)构建教育数据分析模型。在基础数据库的基础上构建数据分析模型,提供信息检索服务,并充分利用数据挖掘等手段,为学校领导和有关部门信息利用、政策评估和决策咨询提供参考。
(4)实现教育数据资源共享。建立教育数据资源共享机制, 进行教育基础库与教育系统内外部系统互联互通,实现教育数据资源区域共享融通。
(5)制定信息标准,整合业务数据。结合教育部门相关标准规范,按照区域教育实际情况,统一信息编码规范,制定信息编码集,形成区域教育信息数据规范[3]。
3 区域化基础教育数据库建设技术实现
基础教育数据库系统可分为 5 大部分,分别是数据交换、数据处理、基础库、主题库和集成共享。
3.1 数据交换
该部分负责基础库系统与外部数据交换,常见的数据交换方式有 DBLink、WebService、WebAPI 等多交换接口协议的对接,实现多来源数据抽取。
DBLink 是一种最常见的数据交换方式,对于早期建设的应用系统往往没有提供对外接口,只能通过数据库对接的方式实现数据采集。首先,在信息采集服务器上部署 JOB A,采集应用系统中的增量数据。首先根据每张表的字段“新增日期”
和字段“修改日期”得到增量数据,然后将这部分数据插入到信息采集服务器缓冲库中的各数据补录信息表中,JOB A触发是采用轮循的方式,轮循的频率是可以配置的。然后,在教育基础库服务器上部署JOB B,取信息采集服务器缓冲库上补录信息表中增量数据与教育基础库服务器基础库中的对应字段数据按照数据采集入库规则进行比对,比对结束入教育基础库;JOB B 触发是采用轮循的方式,轮循的频率是可以配置的。
WebAPI 是一种通过 API(应用程序编程接口)访问当今的 web 应用平台中广泛功能的方式。在教育信息采集服务器上部署 Windows服务A,采集web 应用平台中的增量数据,首先根据每个接口的字段“新增日期”和字段“修改日期”得到增量数据,然后将这部分数据插入到教育信息采集服务器缓冲库中的信息表中,Windows 服务 A 触发是采用轮循的方式,轮循的频率是可以配置的。然后,在教育基础库服务器上部署Windows服务B,取教育信息采集服务器缓冲库上信息表中增量数据与教育基础库服务器基础库中的对应字段数据按照数据采集入库规则进行比对,比对结束入教育基础库;Windows服务 B 触发是采用轮循的方式,轮循的频率是可以配置的。
3.2 数据处理
该部分按照数据资源体系标准对数据进行处理,可以实现数据清洗、比对和转码等功能,保证进入基础库中的数据是符合区域数据标准要求的。数据处理是将多个数据源的数据按照一定的逻辑规则进行抽取、转换和并装载到目标数据集。
完整的数据处理过程包含三个阶段:
(1)设计阶段——分析源和目标数据集的数据结构,定义合理的数据转换逻辑; (2)实施阶段——按照设计阶段制定的逻辑规则进行编码,实现数据的 E(Extract)、T(Transform)、L(Loading)过程;(3)维护阶段——对于非一次性数据整合项目(如很多数据仓库项目中的数据整合过程),ETL 过程需要重复执行,同时也需要不间断的维护和完善。
3.3 基础库
该部分分为学生基础库、教师基础库和教学机构基础库三大部分。按照数据标准规范存储最为核心的数据。
学生基础库主要包括学生基本信息、学籍异动信息、学生入学注册信息、学生简历信息、学生毕业结业信息、学生家庭成员信息、学生任职情况、学生奖励信息、学生处分信息、学生奖学金信息、学生考评信息、学生困难补助信息、学生技术等级证书信息等数据模型。
教师基础库主要包括教师基本信息、家庭成员信息、学习简历信息、工作职务简历信息、专业技术职务信息、语言能力信息、岗位证书信息、社会兼职信息、学术团体兼职信息、开课记录信息、公开课记录信息、论文著作信息等数据模型。
教学机构基础库主要包括基础信息、学校辅助信息、学校校区信息、学校班级信息、校内机构信息、教学专业信息(职业学校)、教学课程信息、教学教材信息、教育经费收入情况信息、教育经费支出情况信息、学校房产用地信息、学校房产建筑物信息、学校房产设施信息、社会办学机构基本信息、社会办学 机构变更信息、社会办学机构年审信息等数据模型[4]。
3.4 主题库
主题数据库是针对特定的业务提炼的主题数据,例如主题库建设主要包括学生考试成绩、病情监测情况、教师培训统计、学生入学分析、学生学籍信息、E卡通信息等主题数据库的建模,数据初始化采集及数据来源、数据处理规则。
3.5 集成共享
该部分提供基础库数据查询统计等服务接口;所有服务接口进行统一身份认证、授权等功能集成,实现教育数据库管理平台与其他应用系统的共享融通。
共享接口从基础库和主题库获取老师、学生等最新基础数据为 OA、门户等外部系统提供 WEBAPI 接口。接口统一采用 WebApi 方式,返回 JSON 格式数据。WebApi 更有利于web、移动客户端、桌面端等各终端之间的网络交互,有效利用http 的 get、post、put、del 方式进行请求访问,Json 数据格式较xml 更简洁,且被各终端更高效地进行解析。
参考文献:
[1] 祝智庭.中国教育信息化十年[J].中国电化教育,2011.
[2] 朱凌云,余胜泉.教育资源库建设的观念与方法[J].教育技术通讯,2001(10).
[3] 马亮. 教育基础信息数据库与应用支撑服务平台介绍[J]中国教育信息化,2013(12).