Excel数据分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 创建数据透视图
2、点击插入 3、插入数据透视图
4、选择插入的透视图 1、选中数据透视表
• 数据透视图
数据透视表
数据透视图
5.1 描述统计
• 描述统计是基础分析工具之一,用于生成对输入区域 中数据的统计分析报表,提供有关数据趋中性和易变 性的信息,而这些信息是进一步分析数据的起点,可 以指示哪一种检验适合进一步的探讨。 • 描述统计的统计函数一般包括:MAX、MIN、AVERAGE、 MEDIAN、GEOMEAN、HARMEAN、AVEDEV、STDEV、VAR、 KURT和SKEW函数等,他们分别用于计算最大值、最小 值、平均值、中位数、几何平均数、调和平均数,以 及变异统计的平均差、标准差、方差峰度和偏度。
• 折线图:显示在相等时间间隔下数据的变化趋势 • 饼图:显示一个数据系列的中各项大小与各项总和的比例 • 条形图:显示各项之间的比较情况(适于分类轴标签很长的情况) • 面积图:强调数量随时间变化的程度/引起对总之趋势 的注意 • XY散点图:显示若干数据系列中两个变量之间的关系
• Excel 中常见图表
2.1 Excel函数介绍
• 函数定义
函数就是预定义的公式。它使用一些参数进行运算并产生返回结果。 • Excel中有350多个内置函数,分数学与三角函数、财务函数、统计 函数、工程函数等11大类,用户还可以使用VBA自定义函数。 • 函数可以分为有参数函数和无参数函数 • 函数可以嵌套调用 例: =IF(AVERAGE(A2:A5)>50,SUM(B2:B5),0)
1.2 Excel数据处理
• 排序(数据有序化)
• 普通排序(内置序列) | 自定义排序(自定义序列) • 单列/行排序 | 多列/行排序
• 数据筛选
仅显示满足条件的数据,隐藏不满足条件的数据
• 自动筛选
• 自定义筛选 • 高级筛选 筛选不重复记录 删除重复项
• 分类汇总
对数据按类别进行汇总统计分析
=IF(A2=10,”科技处”,IF(A2=20,”财务处”,“人事处”))
公式与函数区别?
• 公式和函数使Excel实现数据计算的重要工具
• 公式:是对数据执行计算和操作的等式 • 函数:是预先定义的计算公式,可实现复杂的计算和操作
公式:=(A1+A2+A3+…+A100)/100 函数:= AVERAGE(A1:A100)
使用交互图表分析数据
…………
数据的抽样分析
课程内容
1. Excel应用基础 2. Excel函数应用
2.1 Excel函数介绍 2.2 常用函数介绍
1.1 Excel数据录入 1.2 Excel 数据处理 1.3 Excel 安全设置
3. Excel图表应用
3.1 图表基础 3.2 常用图表
4. 数据透视表与数据透视图
• 对工作簿保护
需要对整个工作簿进行安全设置 • 打开 审阅-保护工作簿 • 输入保护密码
补充:工作簿和工作表区别?
• 工作簿是处理和存储数据的文件。由于每个工作簿可 以包含多张工作表,因此可在一个文件中管理多种类 型的相关信息。 • 工作表可以显示和分析数据。用户能够同时在多张工 作表上输入并编辑数据,并且可以对不同工作表的数 据进行汇总计算。在创建图表之后,既可以将其置于 源数据所在的工作表上,也可以放置在单独的图表工 作表上。
• 中文汉字、字母 • 数字和文本或符号的组成
• 逻辑值——TRUE、FALSE【默认居中对齐】 • 日期———默认使用 / 或 – 隔开
• 1900-1-1
• 时间———默认使用 : 隔开,24小时制
• 23:59:59
• 日期时间—日期时间默认用空格隔开
• 1900-1-1 23:59:59
设置单元格格式
Excel教程
数据统计和处理分析
学习要求
• 熟悉Excel使用界面和基本操作
• 了解Excel的常用统计函数
• 掌握使用Excel透视表和透视图进行数据分析和分类
汇总
• 学会使用Excel进行数据高级分析
Excel背景介绍
Excel是微软公司office系列办公软件的组件之一,它 是一个功能强大的电子表格程序,具有强大的数据处理 和数据分析能力,是个人及办公事务中进行表格处理和 数据分析的理想工具之一。 Excel不仅可以将整齐而美观的表格呈现给用户,还可 以用来进行数据的分析和预测,完成许多复杂的数据运 算,帮助使用者做出更加有根据的决策。同时它还可以 将表格中的数据通过各种各样的图形、图表的形式表现 出来,增强表格的表达力和感染力。
FREQUENCY 计算区间里所含数值的个数 制作频度的函数 通过数值推测数据集的标准偏差 计算标准偏差的函数 STDEV 计算各种总计值 计算各种总计值的函数 SUBTOTAL
在单元格中插入函数
• 找到公式选项
• 选择插入函数 • 根据函数类别找到插入函数 • 选择处理的数据区域
应用举例一
• 某班级的成绩表,如下图所示,其中有两个学生的 该门课程缺考,需要分别用到AVERAGE和AVERAGEA 函数来计算两个不同的平均值。
4.1 数据透视表
• 数据透视表是一种对大量数据快速汇总和建立交 叉列表的交互式表格。 • 它不仅可以转换行和列以查看源数据的不同汇总 结果,显示不同页面以筛选数据,还可以根据需 要显示区域中的明细数据,这对分析、组织复杂 数据是非常方便有用的。 • 数据透视表最大的特点就是它的交互性。创建一 个数据透视表以后,可以任意重新排列数据信息, 并且还可以根据习惯将数据分组。
• 分类汇总之前一定要先进行排序
• 各列须有列标题(字段名)
• 分类汇总类型
• 单字段分类汇总 • 多字段分类汇总 • 嵌套分类汇总
1.3 Excel安全设置
• 对工作表保护
只希望对工作簿中的某一两个工作表设定只读或隐藏状态 • 打开 审阅-保护工作表 • 选择允许用户进行的操作 • 输入保护密码
CORREL函数
• 功能:计算单元格区域中的两个数列之间的相关 系数。 • 语法形式: CORREL(arrnyl,arrny2)
• arrnyl和arrny2表示的都是两个数据列 • CORREL函数可以用来分辨两种属性之间的关系。
应用举例三
• 某医生为了探讨缺碘地区母婴TSH水平关系,应用免 疫放射分析测定了160名孕妇(孕周15~17w)及分 娩时脐带血TSH水平(mU/L),现随机抽取10对数据 如图所示,试求脐带血TSH水平对母血TSH水平的相 关系数。
• 数据透视表的优势
• 大量数据的速度汇总 • 多维度的数据分析 • 通过筛选对重点关注内容的专题分析 • 生成动态报表,保持与数据源同步更新 • 值显示方式,可以一步搞定百分比(同比、环比、占比….) • 一张数据透视表仅靠鼠标移动字段位置,可变换出各种类型的报表
• 创建数据透视表
选择数据源
制作数据透视表 所需要的数据
【操作步骤】
①选中结果输出单元格B14;
②在公式栏输入“=CORREL(C3:C12,B3:B12)”,点击
公式栏
按钮;
③在单元格A14输入“相关系数”即可。
链接:相关系数
• 相关系数是研究变量之间线性相关程度的量,一般 用字母 r 表示。
Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差
4.1 数据透视表
5.1 描述统计 5.4 回归分析
4.2 数据透视图
5.2 检验分析 5.3 方差分析
5. Excel统计分析功能
1.1 Excel数据录入
• 数据类型
• 数字———可进行数学计算【默认右对齐】
• 数值(整数、小数、分数) • 日期、时间
• 文本———用于说明数据的含义,不进行数学计算【默认左对齐】
• 函数组成
参数—用括号()括起
• 参数类型: 无参数型——括号必须保留 有参数型——1个/固定数量/不确定数量 必要参数 可选参数 • 参数形式:引用、表达式、函数、常量 函数名称(参数1,参数2,[参数3],….) SUM(A1,C3:C6,E5/3,SUM(F1:F9),325)
2.2 常见函数介绍
【操作步骤】
• ①在单元格D3中输入公式“=AVERAGE(B2:B9)”, 可以计算参加考试学生的平均成绩,函数 AVERAGE在计算时对缺考的两个学生的成绩自动 认为是0。 • ②在单元格D6中输入公式“=AVERAGEA(B2:B9)”, 可以计算全体学生的平均成绩,对缺考的学生成 绩,AVERAGE函数将自动忽略。
【操作步骤】
• ①在E4~E7单元格输入进行频率计算的分段点 {59,69,79,89}; • ②选中F4~F8单元格,作为输出统计结果的单元格; • ③在公式栏输入“=FREQUENCY(B2:B11,E4:E8)”, 然后按下“Ctrl+Shift+Enter” 组合键锁定数组公 式即可。
输入数组公式首先必须选择用来存放结果的单元格区域(可以是一个 单元格),在编辑栏输入公式,然后按Ctrl+Shift+Enter组合键锁定 数组公式,Excel将在公式两边自动加上花括号“{ }”。
r(X,Y)是表示变量X与Y之间紧密程度的量
• 相关系数定量地刻画了 X 和 Y的相关程度,即 |ρxy|越大,相关程度越大;|ρxy|=0越大,相关程 度越大;
3.1 图表基础
• 图表介绍
• 图表:是数据的图形化表示,是动态的——随对应数据的变 化而自动更新。 • 将数据用图来描述:
• 抽象、枯燥的数据形象直观、易于理解 • 清晰的表现出数据的差异、变化趋势和数据间的关系 • 采用不同的图表类型,可以发现数据不同方面的特点规律
• 图表放置位置
• 与数据位于相同工作表中——嵌入式图表 • 单独占据一个新工作表——图表工作表
• 图表组成
Biblioteka Baidu
①图表区 ②绘图区 ③数据系列(某一行/列) ④横坐标(分类轴) ⑤纵坐标(数值轴) ⑥网格线 ⑦图例 ⑧标题(图表标题、横纵坐标标题) ⑨数据标签
3.2 常用图表
• 柱形图:显示一段时间内数据变化/各项之间的比较情况
• data_array为一数组或对一组数值的引用,用来计算频 率。如果 data_array 中不包含任何数值,函数 FREQUENCY 返回零数组。 • bins_array为一数组或对数组区域的引用,设定对 data_array 进行频率计算的分段点。如果 bins_array 中不包含任何数值,函数 FREQUENCY 返回 data_array 元素的数目。
Excel工作界面
标题栏(工作簿名称) 快速访问工具栏 菜单栏 功能区 编辑栏 全选 列标题 行标题 活动单元格
状态栏
Excel功能
使用统计函数统计数据
使用图表统计数据
按分类汇总统计数据
数据的假设检验分析
数据的描述统计分析
使用排序和筛选分析数据 数据的透视分析
规划求解与最优化方案选择
数据的预测分析 问卷调查分析
计算倍数和众数 MODE 的函数
MAX
计算数值的最大值 计算所有数据的最大值 计算数值的最小值 计算所有数据的最小值 计算数据群的中位数 计算数据群的众数 通过数值计算方差 通过所有数据计算方差
计算最大值和最小值的 MAXA MIN 函数
MINA VAR VARA VARP VARPA
计算方差的函数
创建图表过程
• ①确保数据适合图表
• ②选择包含数据的区域 • ③插入图表选择图表类型 生成基本图表 • ④“图表工具”关联菜单 更改外观/布局、图表数据、图表元素修饰/修改图表
应用举例四
为了反映医院管理的质量,某市抽样调查了几所 医院的6 项指标(指标值越大表示质量越高), 其中三所医院的调查结果如图2-65所示,请绘制 雷达图反映三所医院的管理质量。
应用举例二
• 某班级的成绩表,如下图所示。需要用到FREQUENCY 函数来来统计各个分数段的分布学生人数。
FREQUENCY函数
• 功能:统计指定单元格区域中数据的频率分布。 由于函数 FREQUENCY 返回一个数组,必须以数组 公式的形式输入。 • 语法形式: FREQUENCY(data_array,bins_array)
COUNT 计算日期和数值的个数 计算数据的个数 计算空白单元格的个数
求满足条件的单元格个数
统计数据的个数 COUNTBLANK 的函数
COUNTIF
COUNTA
求平均值的函数
AVERAGE AVERAGEA MEDIAN
计算数值数据的平均值 计算所有数据的平均值 计算数据群的中位数
计算数据群的众数
选择透视表位置
• 数据透视表设置和显示
数据透视表 设置区域
数据透视表
4.2 数据透视图
数据透视图可以看作是数据透视表和图表的结合,它以图形 的形式表示数据透视表中的数据。正像在数据透视表里那样, 用户可以更改数据透视图报表的布局和显示的数据。数据透视 图具有Excel 图表显示数据的所有能力,而且同时又具有数据 透视表的方便和灵活等特性。