样本相关系数r的两个公式
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样本相关系数r的两个公式在我们学习统计学的过程中,样本相关系数 r 可是个重要的家伙。
它能帮助我们弄清楚两个变量之间的线性关系到底有多紧密。
说起样本相关系数 r 啊,它有两个常用的公式,今天咱们就来好好聊聊这两个公式。
先来说说第一个公式,这公式看起来有点复杂,但咱们别怕,一点点来拆解。
假设咱们有两组数据,一组叫 x,一组叫 y。
那这个公式就是r = [∑(xi - x)(yi - ȳ)] / √[∑(xi - x)²∑(yi - ȳ)²] 。
这里面的x和ȳ 分别是x 组数据和 y 组数据的平均值。
就拿咱们班同学的数学成绩和语文成绩来举例吧。
比如说小明,数学考了 85 分,全班数学平均分是 75 分,那小明数学成绩的偏差就是85 - 75 = 10 分。
小红语文考了 90 分,全班语文平均分是 80 分,那小红语文成绩的偏差就是 90 - 80 = 10 分。
咱们把每个同学这两个偏差乘起来再相加,然后除以一个复杂的分母,就能算出数学成绩和语文成绩之间的相关系数啦。
再看第二个公式,r = ∑xy / √(∑x²∑y²) 。
这个公式呢,其实和第一个公式本质上是一样的,就是形式稍微有点不同。
有一次,我给同学们布置了一个作业,让大家去收集自己一周内每天的学习时间和完成作业的正确率。
同学们都特别认真,收集了好多数据回来。
然后我们就用这两个公式来计算学习时间和作业正确率之
间的相关系数。
有的同学一开始看着公式直发懵,觉得太复杂了。
我就带着大家一步一步地算,先算出平均值,再算偏差,一点点地代入公式。
最后算出结果的时候,同学们都特别兴奋,感觉自己好像发现了什么大秘密似的。
在实际应用中,这两个公式都很有用。
比如说研究身高和体重的关系,或者是研究每天锻炼时间和身体健康指数的关系等等。
但要注意哦,样本相关系数 r 只是反映了线性关系,如果两个变量之间的关系不是线性的,那用这个系数可能就不太准确啦。
总之,样本相关系数 r 的这两个公式虽然有点复杂,但只要咱们多练习,多结合实际例子去理解,就一定能掌握好它们,让它们为我们的数据分析服务。
怎么样,是不是对这两个公式有点感觉了?希望大家以后在遇到相关问题的时候,能想起咱们今天说的这些,灵活运用这两个公式,去探索更多数据背后的秘密!。