教育中大数据分析目的包括改善学生成绩,服务教务设计,优化学生服务。而学生成绩中有一系列重要的信息往往被我们常规研究所忽视。通过大数据分析和可视化展示,挖掘重要信息,改善学生服务,对于教学改进意义重大。美国教育部门构建“学习分析系统”,旨在向教育工作者提供了解学生到底是在“怎样”学习的更多、更好、更精确信息。利用大数据的学习分析能够向教育工作者提供有用的信息,从而帮助其回答这些不太好回答的现实问题。未来学生的学习行为画像、考试分数、发展潜力方向等所有重要的信息等数据价值将会持续被显现出来,大数据将掀起新的教育革命,比如革新学生的学习、教师的教学、教育政策制定的方式与方法。为了更好的优化教学大数据应用场景,比赛通过学校教育数据分析和可视化工作,探索面向学生、校园的数据分析体系,募集优秀数据分析及可视化方案,设计并形成数据分析门户,从而更好服务精细化教学管理工作。
在这一背景下,我们觉得主办方是想我让我们最终做出的作品不单单是对数据进行展示,而是对这些数据进行处理并整合,从而得出目前教育中需要的数据。在这一前提下,我们明确了我们的作品主要是对数据进行处理,我们选择了用Quick BI工具进行可视化展示。
<STYLE>
p.msonormal {mso-style-name: 正文;mso-style-parent: ;margin: 0.0pt;margin-bottom: 1.0E-4pt;mso-pagination: none;text-align: justify;text-justify: inter-ideograph;font-family: calibri;mso-fareast-font-family: 宋体;mso-bidi-font-family: times new roman;font-size: 10.5pt;mso-font-kerning: 1.0pt;}
span.msoins {mso-style-type: export-only;mso-style-name: ;text-decoration: underline;text-underline: single;color: blue;}
span.msodel {mso-style-type: export-only;mso-style-name: ;text-decoration: line-through;color: red;}
div.section0 {page: section0;}
</style>
实现方案
<STYLE>
p.msonormal {mso-style-name: 正文;mso-style-parent: ;margin: 0.0pt;margin-bottom: 1.0E-4pt;mso-pagination: none;text-align: justify;text-justify: inter-ideograph;font-family: calibri;mso-fareast-font-family: 宋体;mso-bidi-font-family: times new roman;font-size: 10.5pt;mso-font-kerning: 1.0pt;}
span.msoins {mso-style-type: export-only;mso-style-name: ;text-decoration: underline;text-underline: single;color: blue;}
span.msodel {mso-style-type: export-only;mso-style-name: ;text-decoration: line-through;color: red;}
div.section0 {page: section0;}
</style>
首先得到源数据后对源数据进行清洗:通过填写缺失的值、识别或删除离群点并解决不一致性来使数据达到要求。包括格式标准化,异常数据清除,错误纠正,重复数据的清除等等。
数据集成将多个数据源中的数据结合起来并统一存储,建立数据仓库。然后进行需求分析、逻辑整理最后生成可视化的Quick BI门户。
<STYLE>
p.msonormal {mso-style-name: 正文;mso-style-parent: ;margin: 0.0pt;margin-bottom: 1.0E-4pt;mso-pagination: none;text-align: justify;text-justify: inter-ideograph;font-family: calibri;mso-fareast-font-family: 宋体;mso-bidi-font-family: times new roman;font-size: 10.5pt;mso-font-kerning: 1.0pt;}
span.msoins {mso-style-type: export-only;mso-style-name: ;text-decoration: underline;text-underline: single;color: blue;}
span.msodel {mso-style-type: export-only;mso-style-name: ;text-decoration: line-through;color: red;}
div.section0 {page: section0;}
</style>
页面逻辑设计
<STYLE>
p.msonormal {mso-style-name: 正文;mso-style-parent: ;margin: 0.0pt;margin-bottom: 1.0E-4pt;mso-pagination: none;text-align: justify;text-justify: inter-ideograph;font-family: calibri;mso-fareast-font-family: 宋体;mso-bidi-font-family: times new roman;font-size: 10.5pt;mso-font-kerning: 1.0pt;}
span.msoins {mso-style-type: export-only;mso-style-name: ;text-decoration: underline;text-underline: single;color: blue;}
span.msodel {mso-style-type: export-only;mso-style-name: ;text-decoration: line-through;color: red;}
div.section0 {page: section0;}
</style>
<STYLE>
p.msonormal {mso-style-name: 正文;mso-style-parent: ;margin: 0.0pt;margin-bottom: 1.0E-4pt;mso-pagination: none;text-align: justify;text-justify: inter-ideograph;font-family: calibri;mso-fareast-font-family: 宋体;mso-bidi-font-family: times new roman;font-size: 10.5pt;mso-font-kerning: 1.0pt;}
span.msoins {mso-style-type: export-only;mso-style-name: ;text-decoration: underline;text-underline: single;color: blue;}
span.msodel {mso-style-type: export-only;mso-style-name: ;text-decoration: line-through;color: red;}
div.section0 {page: section0;}
</style>
我们根据针对的群体不同,将可视化内容分成以下四个模块。
学生画像针对的是学生个人、家长以及老师。让学生个人对自己的基本情况有一个整体的认识,也有助于老师、家长更有针对性的帮助、管理学生。
班级画像针对的是班主任以及年级主任,以班级为单位展示各种数据,可以让班主任对整个班级的各项整体情况更为了解,从而更好的班级进步。
教师分析针对的是教师以及校领导,可以让用户直观地看到各个教师的教学质量以及教学压力,有助于教师对自己的情况有所了解,且帮助校领导更好的调配师资,提高学校教学水平。
群体分析针对的是校领导,以整个校园的角度出发查看各种数据,帮助校领导对整个学校有更直观的认识并做出更好的决策解决学校的日常问题。角度出发查看各种数据,帮助校领导对整个学校有更直观的认识并做出更好的决策解决学校的日常问题。
项目亮点
对于数据预处理,首先从源数据的完整性和准确性两个方面进行数据审核,缺失值、噪声数据和不一致数据的数据等进行数据清洗,使可视化内容更为准确。
其中对于地理信息的处理,我们使用了Python调用全国地图API进行户籍的数据分析,精确到省市区。
我们进行了数据集合建立数据仓库,再加上QBI内置告诉查询引擎,可视化查询无需等待。
基于Quick BI 丰富的组件,实现了丰富的可视化效果。
通过给定数据进行分析,形成学生、教师的画像及标签并可视化为词云图,后面的演示可以更直观的看到。
<STYLE>
p.msonormal {mso-style-name: 正文;mso-style-parent: ;margin: 0.0pt;margin-bottom: 1.0E-4pt;mso-pagination: none;text-align: justify;text-justify: inter-ideograph;font-family: calibri;mso-fareast-font-family: 宋体;mso-bidi-font-family: times new roman;font-size: 10.5pt;mso-font-kerning: 1.0pt;}
span.msoins {mso-style-type: export-only;mso-style-name: ;text-decoration: underline;text-underline: single;color: blue;}
span.msodel {mso-style-type: export-only;mso-style-name: ;text-decoration: line-through;color: red;}
div.section0 {page: section0;}
</style>
比赛总结
通过我们团队对作品的一次次改进,以及在决赛时向其他团队的交流与学习中,我们对这个比赛有了更全面的认识。
1.可视化大赛中所用的图表展示组件要比较贴合的展示数据,而不是一味的选择复杂的组件。
2.数据可视化中前期的数据处理非常重要,包括对于数据的理解、分析、清洗等。
3.在项目设计初期就需要明确作品的使用者是谁,使用者需要用这个项目干什么等一系列问题,从而使项目逻辑设计更合理。
4.我们团队非常庆幸从一开始就决定用 Quick BI,这个工具帮助我们节省了很多时间。
后期改进
我们的作品仍有很多不足,决赛时评委老师们也提出了一些建议,我们后期会继续完善我们的项目,具体要改进的如下。
1.在成绩模块中,我们对数据理解有偏差,只使用了分数为依据对学生成绩进行分析,后期需要加入等第、Zscore、Tscore作为依据。
2.成绩模块中,后期需要利用算法对成绩稳定的直观判断、并加上成绩预测的功能。
3.群体分析模块中,后期需要加上对比功能,支持学生对比图、班级对比图、教师对比图。
作品展示请看附件,欢迎大家一起交流。
在此,再次感谢这次大赛给我们学习的机会,感谢Quick BI~