3-统计图形基本绘图
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
同时构造多个图形
layout
• mtcars • attach(mtcars) • layout(matrix(c(1,2),2,1,byrow=TRUE)) • hist(wt) • hist(disp) • layout(matrix(c(1,1,2,3),2,2,byrow=TRUE)) • hist(wt) • hist(mpg) • hist(disp)
统计图形
base 包
plot参数
标题
• • •
可以使用函数title,格式为: title(main = " ", sub = " ", xlab = " ", ylab = " ") 也可以直接把title里面的参数直接放在plot() 里面
• plot参数 • axes=FALSE 将禁用全部坐标轴,框架和刻度全部
168 158 154 158 154 169 158 158 158 159 167 170 153 160 160 159 159 160 149 163 163 162 172 161 153 156 162 162 163 157 162 162 161 157 157 164
165 156 165 166 156 154 166 164 165 156 157 153 165 159 157 155 164 156
QQ图
• 在统计学中,QQ图(Q代表分位数
茎叶图简介
•
探究:某篮球运动员在某赛季各场比赛的得分情况如下:
12,15,24,25,31,31,36,36,37,39,44,49,50 如何分析该运动员的整体水平及发挥稳定程度?
• 通过绘制茎叶图可以解决上述问题。
• 从这个图可以直观的看出:该运动员中位数、众数都在20和40之间,且呈"
单峰"状且分布较对称,集中程度高,说明其发挥比较稳定. “叶”部分;同一数据出现几次,就要在图中体现几次.
利 用 R 语 言 绘 制 茎 叶 图
• x1=c(8,13,14,16,23,26,28,33,38,
39,51); x2= c(12,15,24,25,31,31,36,36,37, 39,44,49,100,120)
• X=data.frame(c(x1,x2),c(rep("a1",length(x1)),rep("a2",length(x2)))) • X1=c(x1,x2) • X2=c(rep("a1",length(x1)),rep("a2",length(x2)))
绘 图 练 习, 散 点 图
• set.seed(200) • x=rnorm(100,1); • plot(x,col="cornflowerblue") • plot(x,col="cornflowerblue",col.axis="blue") • plot(x,col="cornflowerblue",col.axis="blue",fg="red")
plot参数
col用于指Fra Baidu bibliotek颜色的参数
• • • • • •
绘图练习,散点图
• attach(swim) • as.factor(sex) • plot(swim,col=sex) • title(main = " A", sub = "B ", xlab = "X",ylab="Y",cex.sub=2 ) • plot(time,col=sex, pch=5, font.axis=1)
• lwd是以默认值的相对大小来表示的
(默认值为1)。例如,lwd=2将生成一 条两倍于默认宽度的线条
plot参数
lty 指定线条类型
plot参数
字体
• cex.axis 坐标轴刻度文字的缩放倍数。类似于cex • cex.lab 坐标轴标签(名称)的缩放倍数。类似于cex • cex.main 标题的缩放倍数。类似于cex • cex.sub 副标题的缩放倍数。类似于cex • font 整数。用于指定绘图使用的字体样式。1=常规,2=粗体,3=斜
• 先做一个图,然后输入par(new=T)命令,再以后的作图前都先输入
这个命令新图就不停地叠加。
• 例: • plot(cars,col=2, pch=1) • par(new = TRUE) • plot(lowess(cars),col=1,axes=F,xlab=" ",ylab="",type="l") • par(new = TRUE) • plot(lowess(cars),col=3,axes=F,xlab=" ",ylab="", pch=4)
2、画一个矩形盒,两端边的位臵分别对应数据批的上下四分位数(Q1和Q3)。在 矩形盒内部中位数(Xm)位臵画一条线段为中位线。
•
3、在Q3+1.5IQR(四分位距)和Q1-1.5IQR处画两条与中位线一样的线段,这两条 线段为异常值截断点,称其为内限;在Q3+3IQR和Q1-3IQR处画两条线段,称其为 外限。处于内限以外位臵的点表示的数据都是异常值,其中在内限与外限之间的异 常值为温和的异常值(mild outliers),在外限以外的为极端的异常值(extreme outliers)。四分位距=Q3-Q1。.
同时构造多个散点图
par(mfrow=c(2,2))
• par(mfrow=c(2,2)) • plot(rnorm(50),pch=17) • plot(rnorm(20),type="l",lty=5) • plot(rnorm(100),cex=0.5) • plot(rnorm(200),lwd=2)
4、从矩形盒两端边向外各画一条线段直到不是异常值的最远点,表示该批数据正常 值的分布区间。 5、用“〇”标出温和的异常值.
•
•
• R的stem函数其实是一个比较糟糕的
stem 函数 总结
设计,由于其设计的初衷是让其在控 制台上能尽量简短的显示(否则控制 台宽度不够),所以,当数据之间的 差距较大的时候,就会出问题,他会 跳着提升枝干,所以一般要设臵 sacle,而sacle设臵的越大,分茎越 多,精度越高,如果你的scale较小, 他甚至会自动帮你的数据做四舍五入 (这样会降低精度)
• 注意:在制作茎叶图时,重复出现的数据要重复记录,不能遗漏,特别是
• 对于样本数据:
3.1,2.5,2.0,0.8,1.5,1.0,4.3,2.7,3.1,3.5,也可用茎叶 图表示。
• x1=c(8,13,14,16,23,26,28,33,38,
利用R语言绘制茎叶图
39,51); x2=c(3.1,2.5,2.0,0.8,1.5,1.0,4.3,2.7,3.1,3.5,)
• col 默认的绘图颜色。某些函数(如lines
和pie)可以接受一个含有颜色值的向量 并自动循环使用。例如,如果设定 col=c("red", "blue")并需要绘制三条线,则 第一条线将为红色,第二条线为蓝色,第 三条线又将为红色 col.axis 坐标轴刻度文字的颜色 col.lab 坐标轴标签(名称)的颜色 col.main 标题颜色 col.sub 副标题颜色 fg 图形的前景色 bg 图形的背景色
频数分布表
把分成的组的个数称为组数。 组数一般为5至12组 每一组两个端点的差称为组距
小长方 形的高
组距
绘制四个直方图
par(mfrow = c(2, 2)) hist(islands) hist(islands, col = "gray", labels = TRUE) hist(sqrt(islands), breaks = 12, col = "lightblue", border = "pink") hist(sqrt(islands), breaks = c(4*0:5, 10*3:5, 70, 100, 140),col = "blue1"
没有了
plot参数
坐标轴
• xaxt="n" 禁用x轴的刻度线 • yaxt="n" 禁用y轴的刻度线 • xlim x坐标轴的范围,只写出最小值和最大值 • ylim y坐标轴的范围,只写出最小值和最大值 • 例如:plot(1:10, xlim = c(-10, 10), ylim = c(0, 10)) xlim
R中嵌入的基本绘图功能
• 茎叶图(Stem-and-Leaf display),由统
计学家约翰托奇设计(John Tukey) 较
• 思路:是将数组中的数按位数进行比
茎叶图
• 具体化:将数的大小基本不变或变化
绘制变量的茎叶图
不大的位作为一个主干(茎),将变 化大的位的数作为分枝(叶),列在 主干的后面,这样就可以清楚地看到 每个主干后面的几个数,每个数具体 是多少。
体,4=粗斜体,5=符号字体(以Adobe符号编码表示) • font.axis 坐标轴刻度文字的字体样式 • font.lab 坐标轴标签(名称)的字体样式 • font.main 标题的字体样式 • font.sub 副标题的字体样式 • ps 字体磅值(1磅约为1/72英寸)。文本的最终大小为 ps*cex • family 绘制文本时使用的字体族。标准的取值为serif(衬线)、 sans(无衬线)和mono(等宽)
stem函数
• stem(x1, scale = 1, width = 80, atom = 1e-08) • stem(x2, scale = 1, width = 80, atom = 1e-08)
箱 线 图
• 箱形图的绘制步骤:
•
•
1、画数轴,度量单位大小和数据批的单位一致,起点比最小值稍小,长度比该数据 批的全距稍长。
as.factor(X2)
boxplot 函数
• boxplot(X1~X2,outlier=T) • boxplot(len ~ dose, data = ToothGrowth,boxwex = 0.55, at = 1:3 0.2,subset = supp == "VC", col = "yellow",main = "Guinea Pigs' Tooth Growth",xlab = "Vitamin C dose mg",ylab = "tooth length",xlim = c(0.5, 3.5), ylim = c(0, 35),add=T)
图形叠加 利用lines,points低级作图 命令
• plot(cars, main = "lowess(cars)") • lines(lowess(cars), col =“red") • points(lowess(cars),col="blue")
图形叠加
par(new = TRUE)
•
在统计学中,直方图(英语:Histogram)是一种对 数据分布情况的图形表示,是一种二维统计图表, 它的两个坐标分别是统计样本和该样本对应的某个 属性的度量。
直方图
描述概率分布
假设收集到这63名同学的身高(单位cm) 数据如下:
158 158 160 168 159 159 151 158 159
• plot(x,pin=2,mai=c(5,5,5,5))
plot参数
type类型
plot参数 参考线
• abline(h=yvalues, v=xvalues) • 例如:plot(1:10) • abline(h=c(1,5)) #则在y=1和5处各有一条水平线 • abline(v=c(1,5)) #则在x=1和5处各有一条垂直线
plot参数
• 用于控制图形尺寸和边界大小的参数 • pin 以英寸表示的图形尺寸(宽和高) • mai 以数值向量表示的边界大小,顺序为
“下、左、上、右”,单位为英寸
• mar 以数值向量表示的边界大小,顺序为
图形尺寸和边界尺寸
“下、左、上、右”,单位为英分*。默认 值为c(5, 4, 4, 2) + 0.1
和ylim只是坐标轴的范围,与每个点的x和y坐标没有 关系
plot参数 pch 指定绘制点时使用的 符号
• cex是一个数值,表示绘图符号相对于
plot参数 cex 指定符号的大小 lwd 指定线条宽度。
默认大小的缩放倍数。默认大小为 1,1.5表示放大为默认值的1.5倍,0.5表 示缩小为默认值的50%,等等