教育数字化转型实践|智能技术支持的增值评价模式及典型实践
增值评价的核心旨趣是通过教育活动前后学生所获得的成长进步来衡量学校教育和教师工作的成效与价值,有利于打破“以成绩定标签”的传统结果评价造成的分层固化,带来了评价标准分级分类的可能性,一定程度上有利于教育公平与质量的发展。然而,在增值评价的实践中,客观存在一些问题与挑战,一定程度上阻碍了增值评价的落地与发展。因此,在推进教育评价的实践中,利用人工智能、大数据等技术优势来解决增值评价中的难题,促进增值评价落地和推广应用,对于深化我国教育评价改革具有重要的现实意义。
增值评价的基本内涵与特征
(一)增值评价的内涵和实践发展
综合国内外研究来看,增值评价是一种关注学生的学习起点和过程,通过采集学生在一段时间之前和之后的知识、能力和素养方面的表现数据,并对这些数据进行纵向比较,从而测量出此段时间内学生的成长程度,并以此为基础来评定学校、教师等教育主体的绩效,获得学生“净增值”的评价方法。我国关于增值评价的实践探索虽然起步较晚,但目前相关政策和教育一线均已经有了一些积极的探索。
(二)增值评价的基本特征
- 成长性;
- 阶段性;
- 激励性。
智能技术赋能增值评价的必要性和实施策略
(一)增值评价面临的现实问题与挑战
增值评价近年来在教育领域得到非常广泛的关注,并引发了不同视角的研究与探索,但也不可避免地存在一些矛盾和问题。比如在增值评价追踪数据的可靠与稳定存储、增值评价模型的构建、增值评价结果的呈现与理解等方面,均存在一些现实困难,使得增值评价的落地与推广面临挑战。
(二)智能技术赋能增值评价的基本策略
- 建立与维护追踪数据库
- 通过在系统架构、硬件选择上的特殊设计和智能化的管理与维护,追踪数据库可以有效地提高追踪数据存储的稳定性与可靠性,从而为增值评价提供更好的支撑,使增值评价结果 更加客观科学。
- 选择与应用增值评价模型
- 通过自适应推荐技术和智能模型处理算法,增值评价模型可以根据用户的实际情况进行相应的调整与运算,提高增值评价的科学性和效率。
- 进行发展水平的可视化呈现与交互
- 通过计算机图形学、计算机动画、图像处理技术等可视化技术以及可视化交互系统进行发展水平的可视化呈现与交互,可以形象、直观的方式向各种类型和层次的用户展示增值评价分析数据,使用户更加方便、有效地理解增值评价的结果。
智能技术支持的增值评价关键环节
(一)追踪数据库的建立与维护
通过建立追踪数据库,可以实现大规模追踪数据的可靠、稳定存储,实现追踪数据间的链接与整合,并能在日常维护中处理缺失值和保护数据隐私安全。
(二)增值评价模型的选择与应用
构建和运用适当的增值评价模型,能够对追踪数据进行科学、有效的分析,具体作用主要体现在界定“增值”的内涵以及计算“增值”的结果。
(三)发展水平可视化呈现与交互
发展水平可视化是对增值评价结果的直观表现,能够支撑各类用户群体对增值评价结果的需求,其在增值评价中的主要作用有准确直观地展示发展水平和满足各类用户对发展水平信息的个性化需求两方面。
智能技术支持的增值评价典型实践
(一)大型追踪数据库的建设与维护
美国田纳西州增值评价系统(TVAAS)是当今世界最成熟和完整的增值评价系统之一。系统建立了包括学生个体信息、教师信息和学生标准化测验成绩的一个庞大的纵向合并的追踪数据库,该数据库为田纳西州开展全州范围的增值评价提供了坚实的数据基础。
- 将学生、教师和学校的数据进行链接
- 该追踪数据库储备了全州学生每年新的测验成绩和之前几年的测验成绩,以及学生档案、教师档案、学校花名册等相关数据。可以通过学生的学号和地区、学校的编号等,将学生的学习成果与他们注册的学校以及给他们分配的教师对应起来,实现信息的相互链接,从而既可以评估教师、学校和学区对学生学业发展的影响,也可以为每个学生提供自身学业发展轨迹。
- 联合第三方专业公司提供数据处理服务
- 因为增值评价本身统计模型的复杂性以及随着追踪数据库年限的日益增长,数据的收集、处理与分析工作愈发困难,所以田纳西州教育部在推动增值评价过程中一直与美国赛仕软件(SAS)保持密切的合作关系。
- 通过加权等方式减少缺失数据的影响
- 对于因为种种原因(如学生留级、跳级、转学等)导致的不完整学生数据,每年数据分析师们都会在数据匹配的基础上编辑新数据,并通过加权来减少缺失数据的影响。不完整的学生数据加权因素取决于已经提供的可获取的信息量,完整的学生记录所占的权重远高于不完整的学生记录。
(二)百分等级模型的构建与应用
苏州教育质量监测中心在每年面向全市初中开展的义务教育学业质量监测(简称“苏州监测”) 实践中,将增值评价与学业质量监测有机结合,已经形成了较为成熟的实践经验和相关机制。苏州监测选择 “百分等级模型”作为增值评价模型,通过学校每年百分等级的变化来描绘学校的发展水平。
- 将学生、教师和学校的数据进行链接
- 苏州监测根据学生考试情况估计出学生能力分数,并将其转化为均分500、标准差为100的量尺分数,并基于量尺分数来计算学生个人的百分等级。百分等级指出了个体在常模群体中的相对位置,其“增值”描述的是个体在常模群体中位置的变化。基于量尺分数计算的百分等级,能够规避因试卷难易程度和作答不同类型试卷(A、B 卷)造成的不公平,更加精确地反映各学校各学科学业质量的发展水平。
- 选用“理想模型”界定增值
- 相对于科学准确但更为复杂的将当年学校实际百分等级与拟合模型得到的预期百分等级进行比较的“经验模型”,苏州监测选择了简单地将学校当年百分等级和上一年对比的“理想模型”来界定“增值”。其原理浅显而直白,且与过去传统教学中学校用进步分数、排名等来计算学生进步情况的原理一致,对于已经习惯了传统教学的一线师和家长来说,接受起来较为容易。同时,该模型操作流程相对简短,省去了复杂的计算与拟合过程,降低了一线操作人员的工作难度。
(三)教育质量监测报告的生成与运用
苏州监测将监测数据和分析结果以监测报告的形式进行呈现,为区域和学校的教育现状提供全面的透视。其在发展水平可视化方面进行了一些先进的探索,并取得了良好的成效。
- 选用适切的可视化图表刻画发展水平
- 报告中大量采用圆点图、柱形图、折线图等可视化图表来刻画区域或学校各项数据在连续几年间的发展情况以及在全市所处的层次,更加清晰、直观。
- 采用多种标注方式增强可理解性
- 报告中采用9种不同程度颜色来表示一所学校在全市所有学校中的排名,直观地展示学校各项发展水平增值在全市的表现,便于管理人员准确理解和把握学校现状。同时,报告中将结论、建议等信息以文字说明的形式呈现在可视化图表旁,便于用户将文字与图表进行相互印证,快速获取关键信息。
本研究针对增值评价实践中的现实问题,围绕增值评价实践中的三个核心场景,探讨了智能技术支持下增值评价的实现方式,但在具体推进过程中仍然存在一些困难和挑战,需要结合我国教育信息化进入2.0阶段和各区域、学校的实际情况,积极试验和转化,创新探索本土化、专业化的新型增值评价模式,助推智能时代教育评价改革走向深入。
参考文献
[1]刘邦奇,朱广袤,张金霞.智能技术支持的增值评价模式及典型实践[J].中国远程教育,2022,No.575(12):49-57.