课件(优质课)获奖
您的位置:首页 > 课件(优质课)获奖
摘要:我国教育领域的发展与改革正面临前所未有的挑战,大数据与教育的结合成为时代发展的必然要求。教育大数据是指整个教育活动过程中所产生的以及根据教育需要采集到的,一切用于教育发展并可创造巨大潜在价值的数据集合。在当前国际形势下,教育大数据从战略高度应定位为推动教育变革的新型战略资产、推进教育领域综合改革的科学力量以及发展智慧教育的基石。教育大数据的最终价值应体现在与教育主流业务的深度融合以及持续推动教育系统的智慧化变革上,具体表现在驱动教育管理科学化、驱动教学模式改革、驱动个性化学习真正实现、驱动教育评价体系重构、驱动科学研究范式转型、驱动教育服务更具人性化。然而由于教育系统自身更强的独特性和复杂性,我国教育大数据的发展也面临应用落地、数据安全、数据治理与运营等诸多挑战。只有正视并深入研究这些问题,才能推动我国教育大数据持续健康发展。
关键词:教育大数据;教育改革;教育信息化;内涵界定;战略定位;价值潜能;现实挑战
2012年,联合国在发布的《大数据促发展:挑战与机遇》自皮书中指出:“大数据时代已经到来,大数据的出现将会对社会各个领域产生深刻影响。”大数据正在实现人类工作、生活与思维的大变革,其“威力”也强烈地冲击着整个教育系统,正在成为推动教育系统创新与变革的颠覆性力量。教育领域已有学者探讨了大数据时代背景下教育模式的转变、教育变革的趋势与转向、教育研究的新范式、学习方式的变革等,还有学者探讨了教育领域具有广泛应用价值的大数据技术,比如学习分析、教育数据挖掘等,也有学者探讨了大数据技术在教育中的应用模式与实践案例。
毫无疑问,大数据理念正在逐步深人人心,大数据技术正在快速融人各行各业,行业大数据呈现出不同的特征、不同的数据采集方式、不同的发展趋势以及应用模式。我国教育领域的发展与改革正面临前所未有的挑战,大数据与教育的结合已是时代发展的必然要求。然而,目前教育界对教育大数据还没有形成清晰的认识,有一些关键问题。需澄清,比如教育大数据究竟是什么,有何独特性?需要采集哪些教育数据?如何进行教育大数据的战略定位?教育大数据的价值如何体现?我国的教育大数据发展面临哪些现实挑战?基于此,本文将着重对我国教育大数据发展面临的几个关键且基础性问题进行探讨,期望能促使同行研究者形成共识,更好地应用大数据深化我国教育领域的综合改革。
1、教育大数据的内涵界定
1.1教育大数据的概念
大数据是一个新生事物,目前尚处在逐渐被认识、被应用的初始阶段,还未形成公认的定义。其产生之初是一个IT行业的技术术语,被定义为所涉及的数据量规模巨大到无法通过人工在合理时间内达到截取、管理、处理并整理成为人类所能解读的信息。大数据的核心特征常被概括为“4V",即数据量大,一般认为在T级或P级以上、输人和处理速度快、数据多样和精确性。大数据技术几乎在所有领域都拥有非常广阔的应用前景,通过对海量数据进行模型构建,有利于挖掘事物的变化规律,准确预测事物发展趋势,并进行及时有效地干预。
随着大数据理念的传播及其应用的逐步深人,大数据的内涵也在不断变化和拓展。大数据不仅仅是一种技术,还是一种能力,即从海量复杂的数据中寻找有意义关联、挖掘事物变化规律、准确预测事物发展趋势的能力。大数据更是一种思维方式,即让数据开口说话,让数据成为人类思考问题、做出行为决策的基本出发点。
教育大数据是大数据的一个子集,特指教育领域的大数据。文献调研发现,目前还未有学者对教育大数据进行明确的概念界定。所谓教育大数据,是指整个教育活动过程中所产生的以及根据教育需要采集到的,一切用于教育发展并可创造巨大潜在价值的数据集合。
首先,这里的教育是“大教育”的概念,具有全员(从全日制学生到全民,面向所有人)、全程(从学前教育到终身教育,服务各个教育阶段)、全方位(家庭、学校、社会“三位一体”教育,无处不在的教育,虚实融合的教育)的特点。
其次,教育大数据有四大来源:一是在教学活动过程中直接产生的数据,比如课堂教学、考试测评、网络互动等;二是在教育管理活动中采集到的数据,比如学生的家庭信息、学生的健康体检信息、教职工基础信息、学校基本信息、财物信息、设备资产信息等;三是在科学研究活动中采集到的数据,比如论文发表、科研设备运行、科研材料采购与消耗等记录信息;四是在校园生活中产生的数据,比如餐饮消费、上机上网、复印资料、健身洗浴等记录信息。
再次,教育大数据要能服务教育发展,具有教育目的性,而非盲目地囊括一切数据。教育活动过程中也会产生大量无意义的噪声数据(NoisyData ),因此需要根据教育应用目的进行数据过滤与整理,为后期深度挖掘与分析做好准备。
最后,教育大数据之“大”并非指数量之大,而是强调“价值”之大,即能从繁杂的教育数据中发现相关关系、诊断现存问题、预测发展趋势,发挥教育大数据在提升教育质量、促进教育公平、实现个性化学习、优化教育资源配置、辅助教育科学决策等方面的重要作用。
1.2教育大数据的独特性
与传统教育数据相比,教育大数据的采集具有更强的实时性、连贯性、全面性和自然性,分析处理更加复杂多样,应用更加多元深人。
传统教育数据的采集往往是阶段性的,多在用户知情的情况下(非自然状态)进行,分析的手段多采用简单的汇总统计和比较分析,关注的重点是受教育者的群体特征以及国家、区域、学校不同层面教育发展的整体状况。在大数据时代,移动通信、云计算、传感器、普适计算等新技术将逐步融人教育的全过程,可以在不影响师生教学活动的情况下实时、持续地采集更多微观的教与学的过程性数据,比如学生的学习轨迹、在每道作业题上逗留的时间、教师课堂提问与微笑的次数等。教育大数据的数据结构更加混杂,常规的结构化数据(如成绩、学籍、就业率、出勤记录等)依旧重要,但非结构化数据(如图片、视频、教案、教学软件、学习游戏等)将越来越占据主导地位。
与电子商务、交通、医疗、金融保险等领域的大数据相比,教育大数据的独特性表现为三个方面:
第一,教育大数据的采集呈现高度的复杂性。教育活动是人类社会中一种特殊的实践活动,主客体关系复杂、不稳定,教育过程呈现复合结构(教的活动与学的活动并存)。教育业务复杂,无标准化的操作流程和模式,创新人才的培养又需要更多元化、创新性的教学模式与方法。由于缺少商业领域标准化的业务流程以及学习方式的多样性和学习地点的不确定性,导致教育大数据的采集将变得异常复杂。
第二,教育大数据的应用需要高度的创造性。大数据在重塑教育方面具有无限的潜能,而潜能的发挥需要打破数据分析与应用的常规思维,发挥更多的创造性。当前我国教育发展面临公平、质量、减负、择校等一系列重大现实难题,直接影响人民群众对教育的满意度。教育关乎国计民生,而教育问题又异常复杂,需要一大批教育大数据研究者与实践者,充分发挥其创造性,将数据挖掘、学习分析、人工智能、可视化等先进技术与教育现实问题相结合,方可破解当前教育发展之难题。
第三,不仅注重相关关系,更要强调因果关系。国际大数据专家维克托·迈尔·舍恩伯格博士认为,大数据时代的一个最重要转变便是从因果关系转向相关关系,不再需要从事实中寻求原因,而要从看似无关的数据中发现某种相关关系。对于商业领域而言,注重相关关系的挖掘或许可以更迅速、更直接地达成预期目标。然而,教育以培养人为根本目的,不仅要“知其然”,更要“知其所以然”。唯有洞察到教育问题产生的本质原因,才可能从根本上寻求解决之道。
2、教育大数据的分类与结构
随着“三通两平台”建设、教学点数字教育资源全覆盖、中小学教师信息技术应用能力提升、精品开放课程建设等一系列国家信息化工程的大力度开展,以及全国各地数字校园、区域教育云的建设与完善,为教育数据的采集提供了便利条件。此外,国内在线教育市场规模不断壮大,传统教育培训企业和互联网企业纷纷瞄准在线教育,推出多样化的在线教育产品和服务,为学校外非正规教育数据的采集提供了基础。教育数据每时每刻都在产生,然而教育领域究竟包含哪些数据?如何采集?不同的数据又指向何种教育应用?这些问题的解决是教育大数据建设与应用的关键。
2.1教育大数据的分类
教育数据有多种分类方式。从数据产生的业务来源来看,有教学类数据、管理类数据、科研类数据以及服务类数据。从数据结构化的程度来看,包括结构化数据、半结构化数据和非结构化数据。结构化数据适合用二维表存储,图片、视频、文档等非结构数据则不适合用二维表存储。从数据产生的环节来看,还可以分为过程性数据和结果性数据。过程性数据是活动过程中采集到的、难以直接量化的数据(如课堂互动、在线作业、网络搜索等),结果性数据则常表现为某种可量化的结果(如成绩、等级、数量等)。
多年来,国家采集的教育数据主要以管理类、结构化、结果性的数据为主,重点关注宏观层面教育发展整体状况,在一定历史时期对我国制定教育政策、推动教育发展起到了积极的作用。然而,随着大数据时代到来,国际社会对教育大数据作为战略资产的地位越来越认可和重视,教育数据的全面化采集与深度挖掘分析就变得越来越重要。教育数据采集的重心将向非结构化、过程性的数据转变,这些数据无论从数量和增长速度上,还是潜在的价值上,都将远远超越传统的教育数据。
2.2教育大数据的结构模型
为了更清晰地认识教育大数据的概貌,笔者构建了如下图所示的教育大数据结构模型。整体来说,教育数据可以分为四层,由内到外分别是基础层、状态层、资源层和行为层。其中,基础层存储国家教育基础性数据,包括教育部2012年发布的7个教育管理信息系列标准中提到的所有数据,比如学校管理信息、行政管理信息、教育统计信息等;状态层存储各种教育装备、教育环境以及教育业务的运行状态信息,比如设备的能耗、故障、运行时间、校园空气质量、教室光照、教学进程等;资源层存储教育过程建设或生成的各种形态的教学资源,比如PPT课件、微课、教学视频、图片、游戏、教学软件、帖子、问题、试题试卷等;行为层存储广大教育相关用户(教师、学生、教研员、教育管理者等)的行为数据,比如学生的学习行为数据、教师的教学行为数据、教研员的教学指导行为数据、管理员的系统维护行为数据等。
不同层教育数据的主要采集与生成方式、应用场景也有所不同(见下表)。数据采集的难度从内向外逐步增加,尤其是行为层数据的采集最为复杂多变,对于传统的面授教学或者不使用技术工具的学习行为,很多数据仍无法采集。
基拙层数据:一方面通过定期地人工采集实现国家规定的教育基础数据的逐级上报,如每年的招生、教师招聘等新产生的教育数据;另一方面通过系统之间的数据交换实现教育基础数据采集与更新,比如学籍系统、人事系统、资产系统等定期进行自下而上的系统数据更新。基础层数据属于高度结构化的教育数据,主要用于宏观掌控教育发展现状、科学制定教育政策、合理配置教育资源、持续完善教育体系等。其中,有些基础数据(如学籍、人事、资产等)具有高度的隐私性和保密性,属于国家重点保护的教育数据。
状态层数据:采集方式有人工记录和传感器感知,当前主要以人工记录为主,随着传感技术的普及应用,未来的教育装备、教育环境以及教育业务的运行状态将实现全天候、全自动化的记录监控。状态层数据可用于高效管理与维护教育装备,打造更具人性化的教育环境,全面掌控各项教育业务运行状况等。
资源层数据:总量巨大,形态多样,大都属于非结构化数据。资源的产生主要有两种途径:一是专门建设,包括国家组织的精品开放课程资源、企业自主开发的各种学习培训资源与工具、个体自发建设的教学课件等;二是动态生成,在教学过程中产生的各种生成性资源(如讨论、试题、笔记等)。海量优质的资源是实现教学模式创新和教学方法变革的基础,比如当前基于微课的翻转课堂、基于MOOC的开放创新教学、基于电子书的移动学习等。随着移动与开放教育浪潮的兴起,微课、电子书、APP应用、慕课等将成为未来重要的学习资源。
行为层数据。教育行为有很多种,比如收发公文、录人成绩、设备报修、财务报销、教师备课、学生写作业等。其中,教学行为数据(包括教师的教和学生的学)在所有行为层数据中占据主导地位。大数据时代可以采集更多、更细微的教学行为数据,比如学生在何时何地应用何种终端浏览了哪些视频课件、观看了多长时间、先后浏览顺序、是否跳跃观看等细颗粒度的行为都将以日志记录的形式被保存下来。GPS定位、情境感知、移动通信等技术使得各种教与学行为的日志信息更加丰富,不仅仅可以记录什么人在什么时间什么地点做了什么,还可以采集到行为发生时周边的环境信息、个人体征信息、情绪状态等。这些看似无用的数据都将成为后期数据挖掘与学习行为分析的宝贵数据源,为个性化学习、发展性评价、学习路径推送、教学行为预测等提供数据支持。