第四章数据处理与应用课件浙教版高中信息技术必修

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

▪SUM( ) ▪ AVERAGE( )
▪ MIN( ) ▪MAX( )
求和 求平均值 求最小值 求最大值
▪COUNTIFห้องสมุดไป่ตู้ ) 指定区域中符合条件的单元格计数
▪SUMIF( )
指定范围中符合条件的值求和
▪AVERAGEIF( )
指定条件求平均值函数
▪Rank( )
大小排序
例:=sum(A2:A16)
数据缺失
逻辑错误
数据异常
数据重复
格式不一
1、字母代表列、数字代表 行
2、单元格书写方式:列在 前,行在后。例如:A25 3、单元格区域书写方式。 A2:A11,A2:E5
数据计算——公式
公式的格式: = 表达式
其中表达式有运算符号,常量,单元格地址,
=A2+B2
函数以及括号组成。
例如:
=B4+100 =(A1+B1)/2 =B4*A4
If函数
格式:=if(条件判断,“结果为真的返回值”,“结果 为假的返回值”) Eg:=if(成绩>90,“优秀”, “合格”)
课堂练习
94
课堂练习
(1)通过观察上表,获得一等奖的判断条件是:_成__绩__>__=_90分 (2)物理老师通过电子表格软件的“IF函数”快速得到了学生的 等级,那么“赵杰” 同学所获得“等级”单元格的函数编辑栏 内的函数应该=I是F(:C_8_>__=_9_0_,_“一等奖” ,“二等奖”) (3)物理老师想把表中数据复制到新建数据表中进行编辑,但不 想连同D列中的函数粘贴到新表,比较恰当的方式是: ________ (A.在B新表中手动输入;B、选择性粘贴为数值C、选择性粘贴为图 片)
列填充(竖向填充):锁定行
A
1
操作题
2
50
3
50
4
48.3
5
48.1
6
47
7
46.5
8
46.5
B 总分 50
50
48.3 48.1 47 46.5 46.5
C 排名
课堂练习-非选择题
课堂练习
请(1)回该答数以据下表问是题按:照_数__学_____科目进行降___序_____排列。 (2)该数据表中第二位同学没有总分,如果要用公式计算此同学 的总分,公式为=D_4_+_E__4_+_F_ 4+G4 (3)已知该校高一年级共有 200 名学生都参加了考试,要对全年 级学生按照总分进行排名(相同分数名次需相同) ,可用到Rank 函数,则在H3单元格中应该输入的Rank函数参数=R为a_n_k__(C__3_,_C$3:C$202)
2、中文分词分为: ① 基于词典(对比) ② 基于统计(频率) ③ 基于规则(计算机模拟人的理解)
3、文本数据分析与应用 (1)标签云(大小和颜色表示关键词出现频次)
数据可视化 P133
1.可视化的基本方法 (1)有关时间趋势的可视化:可以采用柱形图、折线图等。 (2)有关比例的可视化:可以采用饼图、环形图(也称面包圈图)等。 (3)有关关系的可视化:可以使用散点图、气泡图等。 (4)有关差异的可视化:可以采用雷达图。 (5)有关空间关系的可视化:运用不同颜色或图表直接在地图上进行展
高中信息技术必 修一第四单元
大数据具有数据量大、数据来源与类型多样、处理速度快等特点,简单 的表格处理软件已经无法满足大数据的处理需求,同时,大数据技术、理论 和处理方法也在不断发展,为大数据的处理提供了越来越有力的支持。
静态数据:在处理时已收集完成、在计算时不会发生改变的 数据
流数据:不间断地、持续地达到的实时数据,随着时间的流 逝,流数据的价值也随着降低。
示。
课堂练习
横向对比分析法:是指对同类的两个或两个以上的事物进行的比较(同一学 期,小王和小明俩人的成绩比较)
纵向对比分析法: 比较同一事物在不同时期的形态,是指对一个事物的历史、现 状,乃至未来进行的比较。(不同学期,小明的单科成绩的比较)
平均分析法:指应用平均数对经济税源、税收现象进行比较分析的统计分 析方法
P110 Excel表格
图表呈现
图表是用视觉形式向人们展示数据的一种方法。常见的图表类型 有柱形图、折线图、饼图、雷达图、散点图、气泡图等。
注意:数值——柱形图;趋势——折线图;比例——饼图 项目较多——雷达图
4
4
3
系列
1
2
2
系列
1
2
0
0
0
1
2
3
4
0
1
2
3
python模块的小名儿
import 还有更多详细的用法,主要有以下两种:导入整个模块时,也可以为模块指定别 名。
import 模块名1 [as 别名1]…
例如:import pandas as pd pd.series( )
from 模块名 import 函数名1 [as 别名1],…
例如:from pandas import DataFrame as df df ( )
pandas处理数据
数据处理可以使用现成的软件或平台,也可以通过编写程序实现。 Python语言丰富的标准模块和扩展库提供了许多高效灵活的函数,可以帮 助我们较好地进行数据整理。
P110 函数语法
课堂练习
5.某慈善总会接收抗击新型冠状病毒感染肺炎的捐赠物资,使用电子 表格软件进行数据处理,若要统计“分类捐助总量”的数据,统计 “N95口罩”的总量可修改F4单元格中的公式,并对G4:H4进行自动填 充,统计出“84消毒液”和“医用防护服的总量,则F4单元格中的公 式应修改为( A ) [提示:SUMIF函数用于对区域中满足条件的单元格求和。例 如:=SUMIF(B3: B3126,F3,C3:C3126)表示求 B3:B3126 区域中所有 “N95 口罩”的总量] A.=SUMIF(B3:$B3126,F3,$C3:$C3126) B. =SUMIF(B$3:B$3126,F3,C$3:C$3126) P110 函数语法 C. =SUMIF($B3:$B3126,F3,C$3:C$3126) D. =SUMIF(B$3:B$3126,F3,$C3:$C3126)
pandas数据结构
1. Series(序列)
index:表示索引
Series类似于一维数组,由一个数组的数据和一个与数据关联的索引
(index),索引值默认是从0起递增的整数。
import pandas as pd
pandas数据结构
2. DataFrame(数据值,行标签,列标签)
DataFrame是一种类似于关系表的表格型数据结构, DataFrame对象是一个二维表格,由1个索引列(index)和若干个数 据列组成。其中,每列中的元素类型必须一致,而不同的列可以拥有 不同的元素类型。
P134 可视化的基 本方法
课堂练习
3. IF函数是电子表格软件中用来做条件判断的函数,单元格A2的值是 90,如果在 A3 输入“=IF (A2 >=90,“合格”,“不合格”)”,确定 后得到的结果是( )A。 A.合格 B.不合格 C.90 D. NULL
P110 函数语法
课堂练习
4.在用电子表格软件处理某地部分市场菜篮子价格数据,如图所示。计算 表中“平均值”列数据:选择单元格输入函数 (公式),然后用自动填充功能 完成其他单元格平均值的计算。则I3 单元格中可使用的函数(公式)为( D ) A.=SUM(C3,H3)/6 B. = (3.5+3+3+3+3+3)/6 C.=C3+D3+E3+F3+G3+H3/6 D.=AVERAGE(C3:H3)
结构分析法:是指对经济系统中各组成部分及其对比关系变动规律的分析
课堂练习
1.学习小组在调查同学的爱好情况,通过问卷收集了一些数据,小明 负责去除数据中的重复部分,小明所做的工作是数据处理的哪一步 ( B)
A.数据收集 B.数据整理 C.数据分析 D.数据呈现
P108 数据处理
课堂练习
1.学习小组在调查同学的爱好情况,通过问卷收集了一些数据,小明 负责去除数据中的重复部分,小明所做的工作是数据处理的哪一步 ( B)
plot(x,y)
bar(x,y)
barh(x,y)
scatter(x,y)
turtle——绘图
Import turtle as mypen For x in range(3):
mypen.forward(50) mypen.left(60) Mypen.done( )
Import turtle as mypen For x in range(4):
pandas数据结构
Matplotlib——绘图
常用绘图函数
plot( )绘制线形图。 bar( )绘制垂直柱形图。 barh( )绘制水平柱形图。 scatter( )绘制散点图。 title( ) 设置图表的标题。 show( )显示创建的所有绘图对象。
牢记下列 Python 的四个绘图函数
A.数据收集 B.数据整理 C.数据分析 D.数据呈现
P108 数据处理
课堂练习
2.如图所示,某景区 2020 年某一周的人园游客数量图表,根据图表分析,下列结
论错误的是( B )。
A.该图表是折线图
B
B.该图表是雷达图
C.周六的人园游客数量最多
D.为了分散一周游客人园数量,可以在周三举行门票打折活动
例题:某班级约定,每周进行操行评定,分为4个项目,回答问题、作业提交,迟 到和早退。回答问题正确加2分,作业提交获得优加2分,迟到一次扣3分,早退一 次扣5分。下表部分同学的操行评定情况。使用公式在F2单元格中,计算出操行总 分
函数定义
函数其实是一些预定义的公式,它们使用称为参数的特定数值按特定的顺序进行计算。 格式: 函数名(参数1,参数2……)
mypen.forward(50) mypen.left(90) Mypen.done( )
Import turtle as mypen For x in range(40,0,-10):
mypen.circle(x) Mypen.done( )
文本数据处理
1、典型的文本处理过程主要包括 文本数据源→分词→特征提取→数据分析→结果呈现等。
sumif函数:按条件求和
“注意:区域要锁定”
格式:=SUMIF(计算区域,判断条件,求和区域)
课堂练习
高二年级的10位同学参加数学竞赛,成绩如下: 73
课堂练习
(1)在上表的G7单元格中,通过函数求出10 位同学的平均分是, 则应在该单元格输入的函数是__=_A__V_E__RAGE(C3:C12) (2) AVERAGEIF 是指定条件求平均值函数,上表所示的G3单元 格就是通过 AVERAGEIF 函数求出指导教师是“王老师”的所有 学生的平均成绩。如果用该函数求出 “刘老师”指导学生的平 均分,则函数第二个参数应该填F_4_______ (3)如果要通过自动填充的方式得到G4和G5 单元格的值,则G3 单元格的函数式子应该改为=:A_V_E__R_A__G_EIF(D$3:D$12,F3, C$3:C$12)
例:=rank(A2 , A$2:A$16)
数据的计算——函数 使用函数计算高一一班的总分,和400米的最高分
RANK 函数:用来排名排序的函数
Number(数值):给谁排序就填谁
行填充(横向填充):锁定列
Ref(引用):参与排序的所有范围(一定要锁定!) 排位方式:0或忽略为降序,非零值为升序
序号
姓名
性别
语文
数学
英语
总分
日期
1
小唐

98
120
125
343
2023-2-17
2
李好
5002354
78
112
125
315
2023-2-17
3
王小牛

100
98
2023-2-17
4
张三

170
100
200
470
2.17
5
麻花

96
52
68
216
2023-2-17
6
小唐

98
120
125
343
2023-2-17
Countif函数:指定区域中符合条件的单元格计数
格式:=countif(数据区域,条件) “注意:区域要锁定”
课堂练习
在2017年,在建设高等院校“211工程”和“985工程”的基础 上,国家推进“双一流”大学的建设,如图所示是西南三省211 大学名单:
课堂练习
(1) 在电子表格软件中,我们一般通过 COUNTIF 函数计算区域 中满足给定条件的单元格的个数。在上表的单元格F3 中,通过 “COUNTIF(C3:C9,E3)”函数得到云南省的211 大学数量是1, COUNTIF函数中统计“云南省”211大学个数的数据区域是 __C_3__:C__9_ (2)得到云南省的 211 大学数量后,张华通过自动填充的方式, 得到四川省的211大学个数为4,结果与实际不符,应该将单元 格F3的函数修改=C为O__U_N__T_I_F_(C$3:C$9,E3) (3)如果要直观地表示各个省份 211 大学数量,可以应用哪种图 表方式柱___形__图___
相关文档
最新文档