大数据时代教育的可能转向——江淮论坛
作者:喻长志来源:原创日期:2013-08-10人气:939
美国继1993年宣布“信息高速公路”计划后,2012年3月22日再次部署重大科技发展,即耗资2亿美元启动“大数据研究和发展计划”。不仅美国把大数据研究上升为国家意志,事实上作为“未来的新石油”的大数据已经或即将在各个领域产生巨大影响。从教育的角度来看,教育管理、思维方式、学习行为、教学评估等,无不受到大数据的影响。也许,在我们还津津乐道什么是大数据时,它对教育的影响就已超过了我们的想象。
一、大数据时代正在来临
人、机、物三元世界的高度融合引发了数据规模的爆炸式增长和数据模式的高度复杂化,世界因此进入了网络化的大数据(Big Data)时代。[1]麦肯锡全球研究所报告《大数据:创新、竞争和生产力的下一个前沿》对“大数据”的含义进行了界定:大数据是指大小超出了传统数据库软件工具的抓取、存储、管理和分析能力的数据群。[2]“大数据”首先是指信息或数据量的巨大。数据的单位,已经从G和T发展到P、E、Z、Y等为计量单位,每个单位之间的运算关系是乘以1024。据著名咨询公司IDC统计,2011年全球被创建和复制的数据总量为1.8ZB,远远超过人类有史以来所有印刷材料的数据总量(200PB)。[1]
大数据时代的来临除了政府机构、社会组织、媒体等公布更多的信息,主要和个人对各种网络终端等的使用有关。从中国当前的实际来看,社会生活网络化已逐渐成为常态。中国网民数量从1997年的62万增长至2012年底的5.64亿,网络普及率达到42.1%,手机网民4.20亿,微博个人用户3.09亿。麦肯锡发布的报告则显示,中国60个大中城市的居民,70%的业余时间在上网,小型城镇居民的这一比例为50%。[3]网民数量的增加与各种终端设备的使用,都会留下“痕迹”,从而产生数据。大数据的产生为预测、处理人类行为、心理提供了重要依据。比如美国的有些警察部门,开始使用计算机化的人像绘图,通过分析发工资日、体育赛事、降雨、节日等变量预测可能发生犯罪的“热点地区”,从而可以提前部署警力;研究人员也发现,在某一地区医院的急症室流感病人增加的约前两周,谷歌搜索里对“流感症状”、“流感治疗”等关键词的搜索出现小高峰[2];通过学生停留在在线学习上的时间和点击率,知道哪些内容是学生喜欢的等。
大数据有四个方面的特点,也即大量化(Volume)、多样化(Variety)、快速化(Velocity)和大价值(Value)。首先,数据规模不断变大。网络等每时每刻都在产生信息,数据不断积累。2012年迅雷下载的文件大小总量达到了56亿G,可装满560万个容量为1000G的硬盘,这只是无数数据中的九牛一毛。全球企业2010年在硬盘上存储了超过7EB的新数据,消费者在PC机和笔记本电脑等设备上存储了超过6EB的新数据,而1EB数据就相当于美国国会图书馆中存储数据的4000多倍。[1]其次,大数据类型多样。传统的数据多是常用的如EXCEL等软件处理的结构化数据,而随着互联网等新媒体的发展,包括图片、声音、视频等非结构化数据呈现井喷之态。特别是随着社交媒体和智能终端的发展,每个公众都成了传播主体,生产的非结构化数据将占四分之三以上。再次,数据生产的速度快。网络诞生之前,资料的生产与传播有较长的周期,即使到了大众传播时代,报纸、期刊也都有固定的传播周期。网络诞生后,资料的生产与传播几乎与事件同步,信息传播的环节大为减少。最后,数据的价值巨大。网络等生产的数据虽然会产生数据存储和处理的危机,产生大量冗余信息,但是通过精准的分析,大数据将产生巨大作用。
一、大数据时代正在来临
人、机、物三元世界的高度融合引发了数据规模的爆炸式增长和数据模式的高度复杂化,世界因此进入了网络化的大数据(Big Data)时代。[1]麦肯锡全球研究所报告《大数据:创新、竞争和生产力的下一个前沿》对“大数据”的含义进行了界定:大数据是指大小超出了传统数据库软件工具的抓取、存储、管理和分析能力的数据群。[2]“大数据”首先是指信息或数据量的巨大。数据的单位,已经从G和T发展到P、E、Z、Y等为计量单位,每个单位之间的运算关系是乘以1024。据著名咨询公司IDC统计,2011年全球被创建和复制的数据总量为1.8ZB,远远超过人类有史以来所有印刷材料的数据总量(200PB)。[1]
大数据时代的来临除了政府机构、社会组织、媒体等公布更多的信息,主要和个人对各种网络终端等的使用有关。从中国当前的实际来看,社会生活网络化已逐渐成为常态。中国网民数量从1997年的62万增长至2012年底的5.64亿,网络普及率达到42.1%,手机网民4.20亿,微博个人用户3.09亿。麦肯锡发布的报告则显示,中国60个大中城市的居民,70%的业余时间在上网,小型城镇居民的这一比例为50%。[3]网民数量的增加与各种终端设备的使用,都会留下“痕迹”,从而产生数据。大数据的产生为预测、处理人类行为、心理提供了重要依据。比如美国的有些警察部门,开始使用计算机化的人像绘图,通过分析发工资日、体育赛事、降雨、节日等变量预测可能发生犯罪的“热点地区”,从而可以提前部署警力;研究人员也发现,在某一地区医院的急症室流感病人增加的约前两周,谷歌搜索里对“流感症状”、“流感治疗”等关键词的搜索出现小高峰[2];通过学生停留在在线学习上的时间和点击率,知道哪些内容是学生喜欢的等。
大数据有四个方面的特点,也即大量化(Volume)、多样化(Variety)、快速化(Velocity)和大价值(Value)。首先,数据规模不断变大。网络等每时每刻都在产生信息,数据不断积累。2012年迅雷下载的文件大小总量达到了56亿G,可装满560万个容量为1000G的硬盘,这只是无数数据中的九牛一毛。全球企业2010年在硬盘上存储了超过7EB的新数据,消费者在PC机和笔记本电脑等设备上存储了超过6EB的新数据,而1EB数据就相当于美国国会图书馆中存储数据的4000多倍。[1]其次,大数据类型多样。传统的数据多是常用的如EXCEL等软件处理的结构化数据,而随着互联网等新媒体的发展,包括图片、声音、视频等非结构化数据呈现井喷之态。特别是随着社交媒体和智能终端的发展,每个公众都成了传播主体,生产的非结构化数据将占四分之三以上。再次,数据生产的速度快。网络诞生之前,资料的生产与传播有较长的周期,即使到了大众传播时代,报纸、期刊也都有固定的传播周期。网络诞生后,资料的生产与传播几乎与事件同步,信息传播的环节大为减少。最后,数据的价值巨大。网络等生产的数据虽然会产生数据存储和处理的危机,产生大量冗余信息,但是通过精准的分析,大数据将产生巨大作用。
热门排行
推荐信息
期刊知识
- 2025年中科院分区表已公布!Scientific Reports降至三区
- 官方认定!CSSCI南大核心首批191家“青年学者友好期刊名单”
- 2023JCR影响因子正式公布!
- 国内核心期刊分级情况概览及说明!本篇适用人群:需要发南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的学者
- 我用了一个很复杂的图,帮你们解释下“23版最新北大核心目录有效期问题”。
- 重磅!CSSCI来源期刊(2023-2024版)最新期刊目录看点分析!全网首发!
- CSSCI官方早就公布了最新南核目录,有心的人已经拿到并且投入使用!附南核目录新增期刊!
- 北大核心期刊目录换届,我们应该熟知的10个知识点。
- 注意,最新期刊论文格式标准已发布,论文写作规则发生重大变化!文字版GB/T 7713.2—2022 学术论文编写规则
- 盘点那些评职称超管用的资源,1,3和5已经“绝种”了