数据服务电子科技大学:一体化大数据提供师生精准画像近年来,有部分国内高校开始了数据挖掘的探索。比如,浙江大学通过对资产的归纳、整理,最终形成权威、全面的资产数据,并提供数据查询和分析服务。这些数据分析的结果能够提高教室、实验室等资源的利用率。复旦大学对特定群体的学生进行数据分析,发现了来自不同区域、不同背景学生成绩的显著差异性。清华大学开展了对优秀学生成长追踪,观察成长路径的研究。以上可以看出,虽然这些高校已经开始通过简单统计和相关分析进行数据挖掘,但是这些数据没有完全打通并协同分析,而且分析缺乏深度性和广度性。针对这些智慧校园建设的不足,电子科技大学利用大数据技术,研究设计了统一的校园大数据分析决策平台,并首次提出教育大数据一体化平台的概念。该平台不仅可以自动化地接入来自于校内的业务系统数据、资源使用数据、网络日志数据,而且能够接入来自于校外的互联网数据。在数据治理和隐私保护之后,进行数据的标准化,存放在数据中心,同时通过应用程序接口的方式,进行数据认证式的共享,成功地解决了全校各个管理服务系统分割独立,数据共享困难的问题。更突出的是一体化平台中的计算中心周期性地调用数据接口,进行包括挂科预警、贫困生挖掘等的大数据分析与预测,将分析与预测的结果提供给最上层的各类应用服务。电子科技大学运用教育大数据一体化平台提升高校管理服务水平和质量,既是一个集成不同部门、层次信息数据的系统性工程,又是一个面向世界一流大学创新管理服务体系。教育大数据一体化平台体系架构教育大数据一体化平台是数据整合、清洗与分析挖掘的开放平台。教育大数据一体化平台的架构如图1所示,它由三大中心组成,分别为数据中心、应用中心和运维中心。数据中心旨在打破数据孤岛,以80%的通用性对接现有的校园业务系统,整合教务处、学生处、图书馆等部门的业务数据,同时对整合后的数据进行清洗、管理与隐私保护,形成标准化的校园数据。应用中心不仅提供隐私化的数据认证接口与大数据算法服务,而且整合如学生画像、教师画像等多样化的校园管理应用,并不断横向扩展,形成“一平台、多应用”的服务体系。运维中心采集系统应用日志以及机器数据并为其建立索引,构建强有力的搜索、分析和可视化能力,以提供日常运维支持。通过三大中心的协同工作,一体化平台打破了学校各职能部门的数据孤岛,不仅可以为校园师生提供便捷、高效、精准的个性化引导和服务,而且能为学校开展精准化、智能化师生服务提供总体解决方案。基于该平台,电子科技大学已开发了多项成熟的应用服务,如学生画像、精准资助、失联告警、教师画像、科研探索、财务评估等系统。本文将以“学生画像”系统和“教师画像”系统为例介绍教育大数据一体化平台的应用创新。学生画像:让学生得到精准的帮助学生画像利用数据中心提供的标准化行为与内容数据,包括课程成绩、图书馆借阅、一卡通消费等,运用大数据分析手段,量化学生在规律性、努力程度、学习技能、经济状况、社交关系等多维度的特性,揭示学生成长轨迹,基于预测模型对学生的学业成绩、就业倾向、心理状况等进行预测,从而可以为学校对学生进行个性化与精准化的教育管理与引导提供重要依据。下面针对以下几个方面进行进一步阐述。1学业成绩预测成绩特别好、特别差和成绩突变的学生是教育者最关心的人群。直观地说,学生成绩和他们的基础知识掌握情况有密切关系。特别地,基础知识的掌握好坏可以影响到学生在相关课程中的成绩。为此,借助以往课程成绩信息,基于矩阵分解的降维技术,分析学生对具体基础知识的掌握程度,并获得每门课程所含有的知识体系。基于这些信息,该系统不仅可以预测出每个学生在其他课程的得分,也可以预测出这个学生在其他课程的挂科可能性。这个算法背后的思想是通过分析课程之间在知识体系上的相关性来进行成绩预测或者挂科预测。比如某学生在以往课程中曾修过微积分Ⅰ但成绩不好而且挂科了,那么当他在修读微积分Ⅱ的时候,预警系统就会预警该学生的挂科可能性比较大,提示教育者及早发现问题并进行干预,尽可能避免挂科问题。因而,挂科预警实现了从后置性应急管理转变为前置性预警引导。...