高校普遍存在的数据问题
由于早期数字化校园建设背景的限制,各大高校在数据层面均处于较为薄弱的阶段,主要存在以下难题。
1.数据不可知
传统的数据平台仅含部分人财物等结果型主数据,并不包含过程数据,无法得知真实的数据资产情况;
2.数据不可管
缺少对于多源异构数据的可视化处理平台,对厂商的依赖程度较大,难以拥有自主权;
3.数据不可控
数据开放程度不足,同时缺乏数据全脉络的监管,不能规范数据的全生命周期流程;
4.数据不可信
信息标准不一致、数据不完整、数据错误等问题造成数据不可信,导致分析结果的偏差,影响数据的共享交换;
5.数据不可用
缺少对于业务场景的研究,很难产生实际价值。
当前,智慧校园建设对于底层数据的需求更为急迫,因为没有准确全面的数据,智慧校园就无法达到预期的高度。
因此,南京理工大学启动了数据治理体系建设,以数据的“采、管、用”为目标,以全量数据中心建设和数据中台服务为依托,旨在提升智慧校园数据服务能力,为学校提供全面、高效、精准的数据支撑。
数据治理体系建设实践
1.构建校级的数据管理组织架构
数据治理需要率先建立管理的组织架构,明确决策流程、权责关系、配合方式。学校建立起重大决策和协调推进、技术开发支持、承担配合的数据治理体系,保障了数据治理工程的快速推进。
2.制定学校数据标准规范
数据标准规范是智慧校园顶层设计,能够保障数据的一致性,破除数据难以打通、利用等弊端。
通过部门调研、比对迭代,形成权威信息标准。基于统一的编码规则,为数据的全面打通和业务系统实时同步更新数据标准奠定了基础。
3.数据资产摸底与识别
学校提出并实践了“先集中、后治理”的数据治理方式,即建设近源数据层,将数据的原始形态充分进行暴露和识别,从而实现数据资产的盘点,形成对于数据资产管理的统一视图。
4.构建全量数据平台
智慧校园建设需要更多高价值数据源,例如记录行为的日志数据、线下表格数据、外部互联网数据,以及视频监控和人脸识别等非结构化数据。此类数据的体量、结构、处理方式与业务数据完全不同,存在很大的使用难度。
为实现低门槛的利用,学校设计了全量数据平台架构(如图1所示),能够支持多维数据源,实现高校全量数据的“实时可采集、全面可管控、处处可复用”,真正实现“数入一库,数出一库”。
图1 全量数据平台架构
(1)业务数据
新建的业务系统不再单独构建数据库,原有业务系统按11备库到全量数据中心。
实现了招投标系统、智慧团建、第二成绩单等12个新建系统数据集中存放;实现了对人事、学工、教务、科研、资产、研究生、一卡通等25个核心系统数据的全量采集和治理,生成了学校概况、学生管理、教学管理、教职工管理等13个数据仓库子集,共计沉淀5亿多条结构化数据。
(2)日志数据
基于hadoop和spark大数据框架,实现了对上网url、防火墙、无线wi-fi、waf等7大类核心日志数据的分布式采集、解析、存储工作,月体量近tb级。
针对此类高校普遍未有效利用的行为数据构建了成熟的处理方案,为大数据应用提供了多维度数据源。
(3)线下数据
设计并落地了对学工处、人事处、教务处、国资处等10个部门线下表格数据的一站式采集治理方案,在兼顾部门人员维护数据习惯的基础上,实现线下数据源的补充。
该方案为高校审计数据上报工作提供了便利,为各大高校业务系统未建或使用效果不好,又需要将线下数据进行整合和共享的需求提供参考。
5.推动数据质量回溯,堵疏并用
对于数据质量这类老大难问题要综合评估其影响程度、改进难易度,制定了以下解决办法。
(1)明确数据源头部门,提供可视化数据质量报告
对于影响范围较大的主数据,采用可视化数据质量报告推送的方式,让源头部门明确数据质量问题,并对原始问题记录进行重点标注,推动其核对和改善。
(2)推行数据与人见面
遵循“个人对数据负责”的原则,建立师生个人数据中心,提供纠错补录功能。通过集中式的个人数据查阅和核对,保障个人数据更新的及时性,为各类业务申报提供可信数据源,避免重复填报。
(3)推动业务系统整改
业务系统设计的不完备性是数据质量问题的根源,学校制定了数据治理提升措施,实现从源头解决数据质量问题。
6.打造数据中台,以开放促应用
为构建更为开放的数据服务生态,学校设计了集 “发布、申请、管控、监测”为一体的数据中台(如图2所示)。
图2 数据中台
统一发布中心:面向各平台和系统提供统一的数据出口方式,可快速实现数据共享接口的发布,降低数据共享门槛;
统一申请中心:继承数据治理的成果,开放校内数据资源目录,目前已有近20类、400 种数据资源上线使用;
统一管控中心:可视化处理数据申请,从而保障学校对于数据的自主可控;
统一监测中心:对于数据运行情况实现全链路监测,改变以往数据交换的“黑盒状态”。
7.面向业务场景落地大数据分析应用
大数据分析的建设不能闭门造车,要深入了解各部门、各群体的真实需求,以精准的大数据分析结果全面辅助领导决策、校务管理及流程优化,推动学校的长远发展。
目前,已为人事处、学工处、校友会、后勤服务中心、校园管理与保卫处、发展规划处等部门提供大数据分析服务,以下是部分亮点应用。
(1)暖心饭卡
通过分析食堂消费数据实现精准扶贫,将善款直接打入进餐低于平均水平的学生饭卡内。在保护学生尊严的前提下,保证困难学生能够吃饱饭。
(2)智慧网络
基于产生的海量历史数据和实时数据,实现it资源运行分析、异常检测、智能预测等功能(如图3所示),解决高校it架构复杂、运维困难的问题,提升学校基础it运维能力。
图3 智慧网络
近年来,如何在破解高校数据顽疾的基础上,充分挖掘和发挥大数据的价值,是高校信息化领域面临的新课题。
南京理工大学通过数据治理体系的规划和实践,打造了以全量数据中心和数据中台服务为核心的智慧校园数据支撑体系,为当前和未来信息化建设提质增效夯实了数据基础。
本文以此为例简要分析了高校数据层面普遍存在的问题,提出了对应的解决办法,在高校业务特性的基础上,提出一个可借鉴的高校数据治理路线,为各高校的数据治理建设提供参考。
(作者:南京理工大学信息化建设与管理处 涂庆华 崔聪 束乾倩)
进入专题>>
① 凡本站注明“稿件来源:中国教育在线”的所有文字、图片和音视频稿件,kok登录的版权均属本网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本站协议授权的媒体、网站,在下载使用时必须注明“稿件来源:中国教育在线”,违者本站将依法追究责任。
② 本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及kok登录的版权等问题,请作者在两周内速来电或来函联系。