第五章数据处理和可视化表达 教学设计 2023—2024学年高中信息技术粤教版2019 必修1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章数据处理和可视化表达
课题数据处理和可视化表达课时4课时
教材分析
本章是必修一第五章的内容,随着移动互联网和物联网的飞速发展,人类社会产生的数据以惊人的速度增长,海量的数据几乎包含了一切形式的数据。
本章要让同学认识到大数据及其特征,认识大数据对人们日常生活的影响,了解数据采集、分析和可视化表达的基本方法;学会选用恰当的软件工具或平台处理数据,分析报告;学会利用python 的扩展库来解决会考题,理解对数据保护的意义。
学情分析
在第五章当中学生已经对python语言已经有了基本的了解,在本章的学习党中除了了解大数据还要学习python的扩展库。
在本章节的学习当中要注重培养学生学习的主动性,培养学生自主学习的意识。
让学生学会选择恰当的学习工具进行学习,建构知识,培养技能,发展思维。
促进信息技术学科核心素养达成,完成项目学习目标。
教学目标1.能够理解大数据的4V特征并能举出例子。
2.了解数据采集,分析和可视化表达的基本方法。
3.了解python的第三方库的基础知识,学会利用第三方库来做题。
4.促进信息技术学科核心素养达成,完成学习目标。
重点与难点
重点:大数据的4V特征,可视化表达的基本方法,python的扩展库。
难点:python的扩展库。
教学方
法
讲授法、任务驱动法、小组合作法、自主探究法课前准
备
多媒体课件、教学视频,随堂练习
教学设计
导入
让学生进行思考你在网站购物时是否出现过类似的事情:当你在搜索一件物品的时候,购物网站就会给你进行类似商品的推荐和广告的投放。
从此例子来引入本章内容的学习。
授新课
任务一:认识大数据的概念和特征
1.让同学自行阅读课本P101-P102来了解大数据的概念和特征,阅读完成之后学生进行总结,教师加以补充,在上新课之前所举的购物网站的例子就是应用的大数据。
2.让学生4人为小组讨论一下在日常生活中还有哪些应用了大数据?例如移动支付、网约车、高德地图等。
任务二:观看视频总结大数据对日常生活的影响
让学生们观看视频《大数据时代,我们无处可逃》然后以小组为单位讨论一下大数据时代对日常生活的影响。
(一)正面影响
1.方便支付
2.方便出行
3.方便购物和产品推荐
4.方便看病和诊病
(二)负面影响
1.个人信息泄露
2.信息伤害与诈骗
任务三:阅读课本了解数据采集的方法和工具
让学生自行阅读课本P104-P109了解数据采集的方法和工具
以及数据的存储和保护,阅读完成之后学生进行总结。
任务四:学习python网络采集程序使用的扩展库
(一)导入模块的方法
1.import 模块名 as 别名
例如:import numpy as np
2.from 模块名 import 功能名 as 别名
例如:from matplotlib import pyplot as plt
(三)扩展库
1.NumPy:是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。
2.SciPy:是一个算法库和工具包
3.Matplotlib:是一个2D绘图库,可以生成绘图、直方图、条形图、散点图。
4.NumPy常与SciPy和Matplotlib一起使用
知识点:
函数描述
Plt.title()设置图像的标题
plt.xlable()设置x轴的名称
Plt.ylable()设置y轴的名称
plt.show()显示图像
Plt.plot(x,y)绘制线性图
Plt.scatter(x,y)绘制散点图
Plt.pie(x,y)绘制饼图
Plt.bar(x,y)绘制柱形图
5.pandas库:Pandas库主要用于快速简单的数据操作,聚合和可视化呈现。
库中有两个主要的数据结构,一维数组(Series)和二维数组(DataFrame)结构。
(1)Series:一维数组
(2)DataFrame:二维的表格型数据结构
series求和sum(),求平均值mean() DataFrame的行列求和,求平均值
知识点:
Pandas.DataFrame.sum()返回所有列的和Pandas.DataFrame.sum(axis=1)返回所有行的和扩展:
Random生成随机数的函数库
知识点:random.random()返回随机生成的一个实数
Random.randint(a,b)生成一个[a,b]之间的整数
Random.Shuffle()打乱排序
任务五:观看视频了解数据的分析
数据的分析一般包括特征探索,关联分析,聚类分类,建立模型和模型评价。
1、数据的特征探索:对数据进行预处理,发现和处理缺失值、异常数据、绘制直方图、求最大值、最小值、极差
2、关联分析:发现大量数据集中的关联性或相关性,从而描述了一个事物中某些属性同时出现的规律和模式。
3、聚类分析:依据研究对象(样品或指标)的特征,对其进行分类的方法,减少研究对象的数目。
任务六:阅读课本了解数据的可视化表达的方式,观看视频了解什么是词云图
词云图是目前常用的关键词可视化数据的表达方式,词云图通常使用文字的大小和颜色来表示关键词出现的频次。
用python编程进行词云图的制作的顺序为:导入文本,分词,特征提取,数据分析,保存词云图
总结由学生进行总结,教师进行补充
课堂练习1.手机导航应用能够实时推荐最快路线,主要体现了大数据的()
特征
A 数据体量巨大
B 数据类型多
C 数据变化速度快 D价值密度低
2.2020年11月1日,正式开始第七次全国人口普查,普查信息除了普查员登记获取之外,还可以通过小程序自主填报。
后者的数据采集方式是()
A 实验数据采集
B 传感器采集
C 网络爬虫
D 系统录入
3.我们在用python进行数据分析的时候,经常会用到pandas库中的DataFrame,这是类似于()的数据结构。
A 一维表格
B 二维表格
C 三维表格
D 四维表格
4.在用python编程对数据进行分析的时候,代码
pandas.DataFrame.sum()执行的操作是()
A 返回所有列的和
B 返回所有行的和
C 返回所有数据中的最大值
D 返回所有数中最小值
5.利用python程序绘制y=2的x次方(y=2^x)函数图像,则下列程序第五行应该填写的代码是()
1 Import matplotlib.pyplot as plt
2 Import numpy as np
3 x=np.linspace(0,10,50)
4 Y=2**x
5
6 Plt.show()
A plt.plot(x,y)
B plt.plot(y,x)
C plt.bar(x,y)
D plt.boxplot(x,y)
6.吴老师利用python编写一个程序画出一个一元一次方程的函数图,程序如下所示:
1 import numpy as np
2 from matplotlib import pyplot as plt
3 x=np.arange(1,10)
4 y=2*x*x+6*x-12
5 plt.title(“y=2*x*x+6*x-12”)
6 plt.xlable(“x”)
7 plt.ylable(“y”)
8 plt,plot(x,y)
9 plt.show( )
请问程序第5行语句的作用是:()
请问程序第8行语句的作用是:()
如果将第8行plt.plot(x,y)语句改为plt.bar(x,y),则程序执行结果变为绘制()图。
7.利用python编程处理数据的时候,常常会用到pandas库,其中一维数据结构是series
1 import random
2 s=pandas.Series([4,6,7])
3 print(s.sum())
此程序运行的结果是()
板书设计
数据处理和可视化表达5.1认识大数据
4V特征:大量,多样,价值密度低,高速
5.2数据的采集
数据采集的方法和工具:系统日志采集法、网络数据采集法,其他数据
采集法,python的扩展库
5.3数据的分析:特征探索、关联分析、聚类与分类、建立模型和模型
评价
5.4数据可视化表达方式
教学反
思。