统计学不得不说的二三事
统计学关我什么事读后感

统计学关我什么事读后感以前我觉得统计学是那种离我特别遥远的东西,就像天上的星星,看得见却摸不着。
可是这本书让我发现,统计学就在我们身边呢。
就拿我们班的考试成绩来说吧。
每次考完试,老师都会统计分数。
老师会算出平均分,这个平均分就是一种统计的结果呀。
老师通过这个平均分就能知道我们整体学得怎么样。
如果平均分很高,说明大家都学得不错;要是平均分低了,那可能就是有很多地方大家没掌握好。
这就像书里说的,统计能让我们快速了解一群事物的大致情况。
还有我们学校的运动会。
在比赛的时候,要统计每个项目有多少人参加。
比如说跑步比赛,有短跑、长跑,不同的距离参加的人数不一样。
学校会根据这些统计的人数来安排比赛的场次、时间什么的。
要是不统计,那运动会肯定会乱成一团。
这就像我们整理自己的小玩具一样,要先知道有多少个,才能更好地摆放它们。
在生活里,我和爸爸妈妈去超市买东西也有统计学的影子。
超市里会统计哪种商品卖得好,哪种卖得不好。
卖得好的商品就会多进货,放在显眼的位置。
就像我最爱吃的薯片,每次去超市都能在很容易看到的地方找到它。
这是因为超市统计了很多顾客的购买情况,知道像我这样喜欢吃薯片的小朋友很多呢。
从这本书里我还知道,统计能帮助我们做选择。
就像我们小组做活动的时候,要决定去哪里玩。
我们可以统计一下大家想去的地方,哪个地方被选的次数最多,我们就去哪里。
这样大家都能玩得开心。
读完这本书,我再也不觉得统计学和我没关系了。
它就像一个隐藏在生活各个角落的小助手,默默地帮助我们把事情做得更好。
我现在看周围的事情都会想到统计学呢,感觉自己变得更聪明了,能发现好多以前没注意到的有趣的事情。
我希望更多的小伙伴也能了解统计学,因为它真的很有用。
统计学知识点总结

统计学知识点总结好嘞,以下是为您总结的统计学知识点,希望能对您有所帮助!咱们先来说说啥是统计学。
统计学呀,简单来说,就是一门研究如何收集、整理、分析和解释数据的学问。
它就像是一个神奇的工具,能帮我们从一堆看似杂乱无章的数据中找出有用的信息和规律。
比如说,咱们去超市买东西,收银员会记录每种商品的销售数量和金额,这其实就是在收集数据。
然后超市经理会把这些数据整理起来,看看哪些商品卖得好,哪些卖得不好,这就是整理数据。
接着,他们会分析为什么某些商品受欢迎,是因为价格便宜,还是质量好,这就是分析数据。
最后,根据分析的结果,决定要多进哪些货,少进哪些货,这就是解释数据的作用啦。
咱们从小学开始,其实就已经在不知不觉中接触到统计学的一些小知识啦。
比如说,老师会让咱们数一数班级里有多少男生,多少女生,这就是在收集简单的数据。
到了初中,统计学的知识就更深入一些啦。
咱们会学习如何画统计图,像什么条形统计图、折线统计图、扇形统计图等等。
比如说,要统计一个班级同学的身高情况,咱们就可以用条形统计图,一眼就能看出哪个身高段的同学最多。
要是想看看一个同学的成绩变化趋势,折线统计图就派上用场啦,能清楚地看到成绩是上升还是下降。
高中的时候,统计学就更复杂也更有趣啦!咱们会学习到一些重要的概念,比如平均数、中位数、众数。
就拿平均数来说吧,有一次我们班组织了一场数学测验,大家的成绩出来后,老师就给我们计算了平均数。
结果发现,全班的平均成绩是 85 分。
这能让我们大概了解全班同学的总体水平。
中位数也很有意思。
还是说那次数学测验,把大家的成绩从小到大排列,正中间的那个数就是中位数。
如果有偶数个成绩,那就取中间两个数的平均值。
比如说,成绩从小到大排列是 60、70、80、90、100、110,那中位数就是 85 分。
众数呢,就是一组数据中出现次数最多的那个数。
比如成绩分别是80、85、85、90、95、95,那众数就是 85 分。
除了这些,高中还会学到方差和标准差。
调侃统计学专业

调侃统计学专业
1、每到年底,都会有看不完的各种报告。
这些报告,往往会以诡异的角度,插入我们的生活,有时候让我们开心,有时候让我们郁闷。
于是大家都会骂,什么破榜单,什么破统计。
统计学是不是一门玄学?
恭喜你,意识到了统计学的本质。
2、发现问题了吗?
统计学本身并不代表真理,只是代表某种手段。
既然是手段,那么有阳间的,自然也有阴间的。
优秀的会计可以把亏损做成赚钱,把赚钱做成亏损,这就是统计学+规则的妙用。
只要用的人骚,统计学可以被玩儿出无数花招。
3、之前和几个朋友去野营,晚上没事儿干瞎聊天,有个是在地质局工作的,有个是把荒野求生刷了好几遍的程序员,有个搞统计的,还有一个我。
我们商量,如果咱们在沙漠里面迷路了,谁活下来的几率大。
我肯定很快就被剔除了,除了以前做尽调被狗追着跑的时候展现过强大的求生欲,野外生存能力几乎为零。
地质局工作的觉得自己能很好的分辨自己在哪里需要如何行进,贝爷爱好者觉得自己终于可以喝大象粪便里面的水了,还有点小期待,但是搞统计的伙伴一句话,我们都服了。
他说搞统计的水分多,活得久。
统计学不得不说的二三事

统计学不得不说的二三事毫不夸张地说,绝大部分国内期刊,甚至在很多低分SCI杂志上,乱用统计学的现象多如牛毛。
还有很多医疗同行,对于统计甚为迷恋,能统计的也统计,不能统计创造条件也要统计,看见P小于0.05比亲爹还亲爹。
话说,统计是门很有神奇的学科,在讲之前我又要开始讲几个冷笑话,看懂了的可以举手。
话说:你知道吗,这个世界上绝大多数人拥有的腿的数量高于平均值?(第一遍没有看懂的小伙伴可以去面壁)再讲一个:你知道一个普通的民众有多笨吗?世界上一半的人都比他更聪明。
(其实这是不对的,世界上一多半的人都比他更聪明。
因为人类的智能有上限,愚蠢却没有下限,所以不是一个完美的正态分布。
)不过瘾,再讲一个:曼德勃罗有一次说,他出生在波兰,但在法国上的学,所以平均而言他是个德国人。
(所以,我出生在广东,但在东北上过学,所以平均而言我是个湖北人……)好冷好冷,我们还是来讲点正事,分享几则统计小故事。
1、两个指标诊断疾病的问题路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。
路人甲以A和B的参考范围上限作为诊断界值,得出了A和B 在该界值下对应的诊断敏感性和特异性。
结果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。
路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。
路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。
诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A和B的诊断价值。
文章的结论到底是想说明A优秀还是B优秀呢?Reject!这个故事说明:统计指标选错了,统计出来的东西往往难以“自圆其说”。
稿件被退了,路人甲有些许郁闷。
经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。
统计学解释

统计学解释
嘿,你知道吗?统计学就像是一个神奇的魔法盒子!比如说,我们
每天的生活就好像是一场数据的大冒险。
早上你看了看天气决定穿什
么衣服,这其实就是一种基于过往天气数据的小小统计呀!
你想想,统计学不就是在帮我们从一堆杂乱无章的数据中找出规律嘛!就像你在一堆糖果中寻找自己最喜欢的口味一样。
我们去超市买
东西,看到那些商品的销量排行榜,那可就是统计学的成果展示呢!“哇,这个东西卖得这么好,肯定很不错!”这就是我们下意识根据统
计结果做出的判断呀。
再说说学校里,老师统计同学们的考试成绩,通过平均分、最高分、最低分这些数据来了解大家的学习情况。
这不就像是给整个班级画了
一幅画像嘛!而且,统计学还能告诉我们很多有趣的事情呢。
比如说,为什么某种疾病在某个地区更容易发生?那就是统计学家们通过大量
的数据研究发现的呀。
我记得有一次,我和朋友们讨论最喜欢的电影类型。
我们各自说出
自己喜欢的,然后发现喜欢科幻片的人最多。
这不就是一个小小的统
计案例嘛!这就好像是在茫茫人海中找到了大家共同的兴趣点。
统计学真的无处不在呀!它就像我们生活中的一个默默付出的伙伴,时刻在帮我们分析、理解这个复杂的世界。
难道你还不觉得统计学超
级有趣、超级重要吗?我反正觉得它就是那个能让我们更好地认识世
界、做出决策的神奇工具!所以呀,一定要好好了解统计学,让它为我们的生活增添更多的精彩!。
统计学的小故事节选

统计学的小故事节选为了从数量上认识和理解,大家在日常生活和工作中看到的各种现象所发生的规律,我们就必须收集、整理和分析数据。
这样子的数据不是一个两个,而是足够多的、大量的,因为只有这样,我们才能得到一般性的规律性的结论。
比如说,出生性别比,如果你调查新出生的5个婴儿的性别,很可能你会发现这五个婴儿中只有1个,或者2个、3个、4个是女孩;如果你把调查的数目增加到10个,其中就几乎一定有3到7个婴儿是女孩;你再把调查的数目扩展到100个,你会发现,一般总是有那么四十多个或五十多个婴儿是女孩;当你把调查的数目扩展到1000个时,令你惊奇的事情发生了,你会发现男婴和女婴的数量比越来越接近于1比1,你会发现1000个婴儿中有四百七八十个男婴,五百一二十个女婴,而不是有700个男婴和300个女婴。
你跟我说,在10个婴儿当中,有7个男婴和3个女婴,这我相信。
但是如果你竟然胆敢说,随意挑选1000个婴儿,里面有700个左右的男婴和300个左右的女婴,这我是很难相信的,除非这些婴儿是经过精心挑选出来的。
所以说,几个特例并不能说明问题,只有当你掌握的数据和材料足够多时,你才有资格说话,你得出的结论才是可信的。
这,就是统计的含义所在。
其实,再说多一点,统计学的基本思想,就来源于两个源头,一个是国情调查,一个是赌博游戏。
三百多年前,在西方工业化早期,西方资本主义国家之间的竞争和资源争夺也比较激烈,那时德国的官员和学者们为了本国的强盛和发展,就搜集和调查了大~量的国情资料,其中不仅包括本国的,也包括他们的竞争对手--英国、法国等国家,他们把搜集过来的资料仔细地整理和分析,希望能够从中找到一些有益于本国长治久安的策略。
这是统计学的一个源头之一。
赌博游戏那一头呢?也是三百年前从法国开始的,那个时候法国的赌博游戏引起了数学家的极大关注。
比如说掷色子、抛硬币、赛马呀等等。
就说抛硬币吧,你抛出一枚硬币,当它落回地面的时候,它向你微笑的那一面,究竟是正面还是反面呢?这太不可预测了!你无从知道!现在你抛10次,你发现了,在地面向你微笑的硬币,它出现了4次正面,6次反面!你再抛,你抛100次,出现了45次正面,55次反面!然后你还抛,一直抛到第1000次,结果出来了,你数了数--一共出现了485次正面,515次反面。
关于统计的常识

关于统计的常识统计是一种科学的方法,用于收集、整理、分析和解释数据。
统计学是一门广泛应用于各个领域的学科,包括社会科学、自然科学、医学、商业和工程等。
在现代社会中,统计学已经成为了一种必不可少的工具,它可以帮助我们更好地理解和解决各种问题。
统计学的基本概念包括总体、样本、参数和统计量。
总体是指我们要研究的所有对象的集合,样本是从总体中随机抽取的一部分对象。
参数是总体的某种特征值,如平均数、标准差等,而统计量是样本的某种特征值,如样本均值、样本标准差等。
通过对样本的统计量进行分析,我们可以推断出总体的参数。
统计学的应用范围非常广泛,其中最常见的应用之一是调查研究。
调查研究是指通过问卷、访谈等方式收集数据,然后对数据进行分析和解释,以了解人们的态度、行为和观点等。
调查研究可以应用于各种领域,如政治、经济、社会和文化等。
除了调查研究,统计学还可以应用于财务分析、市场营销、医学研究、环境保护等领域。
例如,在财务分析中,统计学可以帮助我们分析公司的财务数据,以了解其财务状况和经营绩效。
在市场营销中,统计学可以帮助我们分析市场需求和消费者行为,以制定更有效的营销策略。
在医学研究中,统计学可以帮助我们分析药物的疗效和副作用,以确定最佳的治疗方案。
在环境保护中,统计学可以帮助我们分析环境数据,以了解环境污染的程度和影响。
统计学的应用需要遵循一定的原则和方法。
首先,我们需要确定研究的目的和问题,以确定需要收集哪些数据和如何收集数据。
其次,我们需要对数据进行清理和整理,以确保数据的准确性和完整性。
然后,我们需要对数据进行分析和解释,以得出结论和推断。
最后,我们需要对结论和推断进行验证和评估,以确定其可靠性和有效性。
总之,统计学是一门非常重要的学科,它可以帮助我们更好地理解和解决各种问题。
无论是在学术研究还是实际应用中,统计学都具有广泛的应用价值。
因此,我们应该加强对统计学的学习和应用,以提高我们的分析和解决问题的能力。
统计工作者 座右铭

统计工作者座右铭
作为一名统计工作者,我们需要时刻牢记自己的座右铭,这不仅能够让我们在工作中更加有方向,更能够激励我们不断进取,成为更好的自己。
我的座右铭是:“数据说话,但也会撒谎。
”这句话的意思是,数据在很多情况下都是非常有力的证据,但同时也存在很多局限性,容易被误解和误用。
因此,我们在使用数据时必须谨慎,不能仅仅看到表面的数字,还要深入分析数据背后的意义,了解各种数据之间的关系,并且要考虑到数据的来源和采集方式等因素。
在统计工作中,我们经常需要面对各种复杂的数据和问题,这时候需要我们有耐心和毅力去分析和解决。
我的座右铭也提醒自己要更加勤奋和认真,因为只有在真正深入分析数据的过程中,才能真正找到问题的根源,提出有效的解决方案。
另外一个重要的座右铭是:“数据是为人类服务的。
”这句话的意思是,我们在做统计工作时不应该只是关注数据本身,更应该将数据的应用和服务对象放在首位。
我们需要了解客户或用户的需求和期望,将数据转化为可用的信息和知识,从而为人类的工作和生活带来更多的价值和意义。
在实际工作中,这个座右铭也提醒自己要多与客户和用户进行交流和沟通,了解他们的需求和反馈,积极改进和优化数据分析和应用的过程和结果,为他们提供更好的服务和体验。
以上是我个人的两个座右铭,它们不仅是我工作的指南,更是我
人生的信条。
希望广大统计工作者也能够有自己的座右铭,并且在工作和生活中不断践行,成为更加优秀的自己。
关于统计的趣闻

关于统计的趣闻一、统计的起源和发展统计学作为一门独立的学科,其起源可以追溯到18世纪末的欧洲。
当时,人们开始使用数字和图表来描述社会现象和经济现象,从而形成了统计学这门学科。
随着工业革命的到来,统计学得到了更加广泛的应用,成为了现代社会中不可或缺的一部分。
二、统计数据中的趣闻1. 诞生于1883年的“贝比”名字来源在19世纪末期,英国统计学家弗朗西斯·高尔顿·贝比(Francis Galton)提出了“回归到平均数”的概念。
他通过研究父母身高和子女身高之间的关系,发现子女身高总是趋向于平均水平。
为了表示这种趋势,他用“regression”一词来描述这种现象,并将其缩写为“reg”,后来被称为“回归”。
而后人则将其发音改为“regress”,并缩写为“reg”,最终演变成了今天我们所熟知的“Regression”。
2. 统计数据中的谬误:莫比乌斯带上没有内侧和外侧莫比乌斯带是一种特殊的拓扑结构,其特点是只有一个面和一个边。
然而,如果我们将莫比乌斯带嵌入三维空间中,并且给它染上不同的颜色,就可以得到一种看似有内侧和外侧的结构。
这种谬误在统计学中也很常见,例如当我们只关注数据中的某些特征时,可能会忽略掉其他重要的因素。
3. 统计数据中的巧合:生日悖论生日悖论是指,在一个房间里只需要23个人,就有50%以上的可能性至少有两个人生日相同。
这个结果看起来非常令人惊讶,但实际上它是由于概率计算中的组合问题导致的。
在统计学中,类似的巧合也经常出现,因此我们需要谨慎地处理数据并进行充分的分析。
三、统计学在现代社会中的应用1. 统计学在医学领域中的应用统计学在医学领域中起着至关重要的作用。
通过对大量病例进行分析和研究,可以发现疾病发生和传播规律,并制定相应的预防和治疗方案。
例如,在新冠肺炎疫情期间,统计学家通过对病例数据的分析,帮助医生和政府制定了有效的防控措施,有效地遏制了疫情的传播。
2. 统计学在市场营销中的应用在现代商业社会中,市场营销是企业获得成功的关键之一。
统计分析机构不告诉你的10件事

大部分机构在派发调查样本的时候都会采取一些激励手段。
比如官方统计机构进行的住户调查,即抽查一些城乡家庭做居民开支等情况的跟踪统计,会对配合的记账户家庭给予每月几十元的补贴激励。
但某一些物品奖励则可能对结果造成影响,比如如果用运动水壶和微波炉餐具吸引来的接受调查者可能是完全不同的两个群体,他们给出的答案会让调查结果呈现不同倾向。
04 普查常常不是由一家机构完成官方统计机构的调查方法分为普查和抽样调查两种方式。
“一般来说经济普查、人口普查这样的大型调查,才会是全样本统计,结果也会相对可靠一些。
”北京市一位统计局人士介绍。
但对于大型普查的审核也是一个难题,如人口普查,现有的统计站人员是绝对不够的,就会划区分给当地社区工作者或基础公务员来辅助入户调查。
“对于这类普查的审核也只能靠随机抽查才能发现问题,这本身相当于另一项专项调查的任务量。
”05 它们会用“特技”吸引眼球商业报告中常常喜欢用百分比来描述和展示统计结果,很可能是为了掩盖样本容量过小的事实,而达到宣传商品价值、影响读者的作用等。
比如广告中常常出现“80%的测试人员”一致认可某种牙膏、某种咖啡的质量,而参加测试的人员可能只有5个人。
这一手法被广泛运用到商业报告中。
另外改变图表的横纵坐标范围或比例,也会产生惊人的效果,如为了强调某产品成本的上升,改变了横纵坐标范围或比例,实际成本其实上升了10%,就可以使视觉效果看起来像是30%。
06 选择用同比还是环比有讲究一些房地产网站上统计出的成交量文章和图表,有同比分析的,也有环比分析的,这并不是随机的。
它们的数据来源于房产中介企业,商业目的是要保持市场成交的活跃,也会人为选择数据表述方式。
如果2月成交量很低,3月就用环比分析,让读者以为成交量是大幅增加的,但有可能同比是负增长。
如果3月基数大了,4月就采用同比分析,看起来也是大幅增长,而可能环比只增长了一点。
07 它们的字典与我们日常概念不同“统计在国内的发展时间还比较短,很多是参考国外成熟的指标进行设计的,一些规范和框架一直在微调之中。
和统计有关的10个小故事 知音

和统计有关的10个小故事知音1.度量衡的误差在一个生产工厂中,有一个质量检测部门负责检测每个产品的重量。
为了提高效率,他们使用了一个电子秤来进行测量。
然而,由于设备的精度问题,电子秤的测量结果总是存在一定误差。
于是,这个部门决定进行一次统计,检查电子秤的误差范围。
他们选择了一些已知重量的物品进行多次测量,并将测量结果求平均值。
最终他们发现,这个电子秤的误差范围在正负1克之间。
2.招生人数的统计一所大学的招生部门打算通过开设一门新的专业来吸引更多的学生。
为了确定学生的兴趣,他们进行了一项调查。
调查结果显示大部分学生对新专业感兴趣,于是招生部门将开设新专业的名额增加了50%。
然而,到了报名截止日期,实际报名的学生人数并没有达到他们设定的增加幅度。
招生部门意识到他们在调查中的样本容量过小,导致了估计值的误差。
3.交通事故的统计一个城市的交通规划部门需要对交通事故进行统计分析,以制定更好的交通管理政策。
他们首先收集了一年内的交通事故记录,并将事故类型、发生地点、天气条件等信息输入到统计软件中。
通过分析数据,他们发现高峰时段、雨天和下坡路段是交通事故发生的热点区域和时间。
基于这些统计结果,交通规划部门决定增加交通警力、改善道路状况以及提高司机安全意识,从而减少交通事故的发生率。
4.市场调查的样本容量一家市场调查公司受到一家新公司的委托,希望他们进行一项市场调查来确定市场需求和潜在消费者的偏好。
调查公司采用了随机抽样的方法,在一定时间内对500个人进行了调查。
在调查结果中,他们发现90%的受访者对新产品表示了兴趣。
然而,委托公司并不满意这个结果,因为他们认为500个样本容量太小,无法准确代表整个市场。
于是,他们决定增加样本容量,以获取更具代表性的调查结果。
5.商品价格的统计一家超市决定将某款商品从10元降价到8元,以此来吸引更多的消费者。
为了确定降价政策的效果,超市的统计部门需要收集和分析销售数据。
他们选择了一个月的销售记录,并将销售额和商品单价输入到统计软件中。
统计学常见问题

统计学常见问题统计学啊,真的是一门又爱又恨的学科呢。
就说那些数据吧,感觉像是一堆调皮的小精灵,有时候怎么都搞不定。
比如说抽样这个事儿。
1. 抽样方法那可太多了,简单随机抽样听起来简单,可真做起来,你得确保每个个体都有相同的被抽中的机会,就像从一群小蚂蚁里挑几只出来做代表,可不能有偏心眼儿。
分层抽样呢,就像是把一堆水果先按照种类分好,再从每个种类里挑,这样能让样本更有代表性。
2. 样本量的确定也很让人头疼。
样本量太小吧,得出的结果可能就不准,就像你只尝了一小口汤就说整锅汤的味道,不靠谱。
样本量太大呢,又费时间又费精力,就像要把整个森林里的每片树叶都数一遍一样累人。
再说说平均数这个概念。
平均数有时候可会骗人的哦。
1. 当有极端值的时候,平均数就被拉得偏离中心了。
比如说有一群人的工资,大部分人都几千块,就有一个大老板年薪百万,这时候平均工资就被拉高了好多,那些普通员工看这个平均数,心里肯定想“这可跟我没关系”。
2. 中位数就不一样啦,它就像是中间的那个定海神针,不管极端值怎么捣乱,它都稳稳地在中间,能更真实地反映数据的集中趋势。
还有统计图表。
1. 柱状图就像是一群小士兵,整整齐齐地站着,让你一眼就能看出不同类别之间的数量对比。
但是呢,要是柱子太多了,就会变得密密麻麻,看起来就很费劲,就像一群挤在一起的小豆芽。
2. 折线图就像一条小蛇,弯弯曲曲的,能很好地展示数据的变化趋势。
不过要是数据波动太大,这条小蛇就会变得特别扭,你得仔细看才能看出规律。
3. 饼图呢,就像一个被分成好多块的大饼,能清楚地看到每个部分占总体的比例。
但是如果块数太多,这个饼就会被切得乱七八糟,就像被小老鼠啃过一样。
标准差这个概念也很有趣。
它就像是数据的“离散度测量仪”。
1. 标准差小的时候,说明数据都比较集中,就像一群听话的小绵羊紧紧地挨在一起。
2. 标准差大的时候,数据就比较分散,就像一群到处乱跑的小兔子。
在做统计分析的时候,数据的收集也是个大问题。
统计工作最难忘的二三事

统计工作最难忘的二三事可能因人而异,但一般来说,可能包括以下几个方面:
完成一项重要任务:在统计工作中,可能会遇到一些重要的任务,如进行大型调查、分析复杂数据等。
如果能够成功地完成这些任务,会感到非常有成就感,并且会成为难忘的回忆。
团队合作:在统计工作中,团队合作是非常重要的。
与同事们一起合作,共同完成任务,会让人感到非常愉快和难忘。
发现有趣的数据:在分析数据的过程中,可能会发现一些有趣、出乎意料的结果。
这些结果可能会成为研究的亮点,并且让人感到非常兴奋和难忘。
解决难题:在统计工作中,可能会遇到一些难题,如分析复杂的数据、处理缺失值等。
如果能够成功地解决这些难题,会让人感到非常有成就感,并且会成为难忘的回忆。
参加统计会议:参加统计会议是统计工作中一个非常重要的经历。
在会议上,可以听到来自不同领域的统计学家和数据分析师的演讲,了解他们的研究成果和方法。
此外,还可以与其他参会者交流心得和经验,拓展自己的视野和思路。
总之,统计工作中有很多难忘的经历和时刻,这些经历和时刻会让人感到非常有成就感和满足感,并且成为个人和职业成长的重要部分。
统计学的趣事

统计学的趣事
统计学是一门非常有趣的学科,它涉及到数据分析、概率论和推断等方面。
以下是几个统计学的趣事:
1. 相关不等于因果关系:许多人往往会认为两个事物之间的相关性就意味着它们之间存在因果关系。
但是统计学告诉我们,相关性并不等同于因果关系。
例如,当冰淇淋销量增加时,鲨鱼袭击人的数量也会增加。
这两个事物之间确实存在相关性,但它们之间并没有因果关系。
2. 平均数的误导性:平均数通常被用来表示一组数据的中心位置。
但是,平均数并不总是最好的测量方式。
例如,如果一个班级里有30个学生,其中29个人的年龄为15岁,而另外1个人的年龄为50岁,那么这个班级的平均年龄将会是17岁。
这个数字并不能准确反映这个班级的年龄分布情况。
3. 误差的存在:在统计学中,我们通常需要通过样本来推断总体的一些特征。
然而,样本不可能完全代表总体,因此误差是不可避免的。
因此,我们必须考虑到误差范围,以避免在做出决策时出现错误。
4. 抽样方法的重要性:在进行数据分析时,我们需要进行抽样来获取必要的数据。
然而,抽样方法的选择将会影响到结果的准确性。
因此,在选择抽样方法时,我们需要考虑到它的可靠性和有效性。
5. 数据的可视化:数据可视化是统计学中的一项重要工具。
通过图表、图形和其他可视化方式,我们可以更直观地了解数据,并从
中发现规律和趋势。
这些趣事告诉我们,在统计学中,数据是非常重要的。
正确地收集和分析数据可以帮助我们做出更准确的决策,而错误的数据分析则可能导致错误的结论。
因此,我们需要保持警惕,并学习如何正确地应用统计学知识。
统计学的趣事

统计学的趣事
统计学是一门有趣的学科,它可以让我们了解数据、判断趋势和做出预测。
以下是一些统计学的有趣趣事。
1. 投掷硬币的概率:如果你投掷一枚硬币,那么正面朝上的概率是50%。
但是,如果你连续投掷10次,那么所有正面或反面朝上的概率只有0.1%。
2. 极端值的影响:统计学中的极端值可以对数据的平均值产生很大的影响。
例如,如果你将亿万富翁比尔·盖茨的收入和其他人的收入进行平均,那么平均值会非常高。
3. 统计学的重要性:统计学在现代社会中扮演着非常重要的角色,它可以用于预测天气、股票市场、人口变化等等。
没有统计学,我们无法做出正确的决策。
4. 抽样的艺术:抽样是统计学中非常重要的一环,可以通过抽样来推断整个群体的特征。
但是,必须注意抽样的方式和样本数量,否则可能会导致错误的结论。
5. 误差的存在:统计学中的误差是无法避免的,它可能来自于样本误差、测量误差、数据输入误差等等。
我们必须学会如何处理误差,以便得出正确的结论。
总之,统计学是一门非常有趣的学科,它可以让我们更好地理解和利用数据。
通过掌握统计学的基本知识和技巧,我们可以做出更准确、更可靠的决策。
- 1 -。
统计学的秘密日记

统计学的秘密日记曾经,我以为统计学是一门充满枯燥数字和复杂公式的学科,离我的生活遥不可及。
然而,一次偶然的经历,却让我发现了统计学那隐藏在平凡生活中的神秘魅力。
那是一个阳光明媚的周末,我决定去附近的菜市场逛逛,准备为家里采购一周的食材。
菜市场里人声鼎沸,各种摊位琳琅满目,蔬菜水果、生鲜肉类、粮油副食应有尽有。
我先来到了一个水果摊前,摊主热情地招呼着我:“姑娘,来看看这新鲜的苹果,又大又甜!”我随手拿起一个苹果,问道:“这苹果怎么卖呀?”摊主回答说:“五块钱一斤。
”我心里嘀咕着,这价格好像比上周贵了点。
于是,我决定多逛几家,比较一下价格。
我接着走到了另一个水果摊,这里的苹果看起来也很不错。
我问摊主:“老板,你家苹果多少钱一斤?”老板说:“四块五一斤。
”嘿,价格果然有差别。
我心里暗自想着,这就是简单的价格比较,也算是一种最基础的统计吧。
继续在菜市场里穿梭,我发现不同摊位的苹果价格居然从四块到六块都有。
这让我不禁好奇起来,到底是什么因素导致了这些价格的差异呢?是苹果的品质、产地,还是摊主的进货渠道?为了搞清楚这个问题,我开始仔细观察每个摊位的苹果。
有的苹果色泽鲜艳,个头均匀,表皮光滑;而有的苹果则看起来有些斑点,大小不一。
我还跟摊主们闲聊,了解他们的进货来源。
原来,那些价格较高的苹果,很多是从外地的优质果园进货的,运输成本高,所以价格也贵一些;而价格较低的苹果,大多是本地果园的产出,成本相对较低。
这时候,我突然意识到,我这不就是在做一个小小的市场调查嘛,而这其实也是统计学的一部分呀!我没有着急买苹果,而是又去看了看其他水果的价格。
香蕉、橙子、草莓……每种水果在不同摊位都有着不同的价格和品质。
我拿出随身携带的小本子,把各种水果的价格、品质特点都记录了下来。
旁边的摊主看到我认真的样子,笑着说:“小姑娘,你这是要做啥呀,搞得这么专业。
”我笑着回答:“我就是好奇,想看看这里面的门道。
”在蔬菜区,情况也是一样。
生活中的统计学小例子文档

生活中的统计学小例子统计学是一门研究收集、分析、解释和呈现数据的科学领域,它在我们的日常生活中无处不在。
无论是在购物、运动、医疗还是决策制定过程中,统计学都扮演着重要的角色。
本文将带您了解一些生活中的统计学小例子。
1. 水果摊的销售统计假设您经营一个水果摊位,并记录每天的水果销售情况。
通过统计数据,您可以计算每种水果的销售量、销售额以及利润等信息。
利用这些数据,您可以找出哪种水果最受欢迎,并根据需求做出相应的调整,比如增加库存或调整价格。
此外,通过对销售数据进行分析,您还可以了解不同时间段和季节的销售趋势。
比如,在夏天,人们更喜欢购买清爽的水果,而在冬天,柑橘类水果可能更受欢迎。
这些分析结果将帮助您做出更明智的经营决策,从而提高利润和顾客满意度。
2. 运动健身数据分析在现代社会,越来越多的人开始关注健康和运动。
许多人使用智能手环、运动应用程序等设备来记录他们的运动数据,如步数、心率、卡路里消耗等。
通过将这些数据进行统计分析,人们可以对自己的运动习惯和身体状况有更好的了解。
举例来说,假设您每天记录自己的步数数据。
通过对这些数据进行统计,您可以计算每周、每月的平均步数、最大步数以及步行里程等信息。
这些统计结果将帮助您了解自己的运动量是否达到预期目标,有助于调整和规划自己的运动计划。
3. 调查问卷分析调查问卷是了解人们观点和态度的重要工具。
以一份市场调查问卷为例,您将收集到来自不同人群的信息和回答。
通过对这些数据进行统计学分析,您可以得出一些有关人群喜好、购买偏好、满意度等方面的结论。
例如,您的调查问卷可能涉及到产品偏好问题。
通过对回答进行统计,您可以得知某个产品在不同年龄段、男女比例和地区之间的受欢迎程度。
这些统计信息可以帮助您更好地了解目标客户,并制定更精准的市场推广策略。
4. 药物疗效比较医疗领域也运用了大量的统计学方法。
比如,在研究药物疗效时,通常会进行随机对照试验。
假设你在研究一种新药物的治疗效果,你将招募一组患者,并将其随机分为两组,一组接受新药物治疗,另一组接受常规治疗。
统计学有趣的话题

统计学有趣的话题统计学是一门有趣且广泛应用于各个领域的学科。
从收集、整理和分析数据,到得出结论和预测趋势,统计学帮助我们理解事物之间的关系和模式。
在这篇文章中,我们将探讨一些与统计学相关的有趣话题。
1. 数据的种类和收集方法统计学涉及各种不同类型的数据,如定量数据和定性数据。
定量数据以数字表示,并可以进行数学运算,如测量身高或温度。
定性数据则描述性质或特性,通常以文字或符号表示,如性别或颜色。
了解不同类型的数据以及如何收集数据对于进行有效的统计分析非常重要。
2. 抽样方法和样本误差在统计学中,抽样是从总体中选择代表性样本的过程。
不同的抽样方法可以产生不同的样本,导致样本误差的出现。
了解常用的抽样方法,如随机抽样和分层抽样,并了解如何计算和控制样本误差是进行有效统计分析的关键。
3. 数据可视化和图表数据可视化是将数据转化为图表、图像或图形的过程,以便更直观地理解和交流数据。
常见的数据可视化工具包括柱状图、折线图、散点图和饼图等。
通过选择正确的图表类型和使用适当的颜色、标签和比例尺,我们可以有效地传达数据的关键信息。
4. 假设检验和推断统计假设检验是统计学中常用的方法,用于判断样本数据与总体之间是否存在差异。
它基于样本数据提出一个假设,然后通过计算概率值来判断这个假设是否成立。
推断统计则涉及通过样本数据来推断总体参数的方法,如估计总体平均值或总体比例。
了解假设检验和推断统计的基本概念和步骤,有助于我们理解统计分析的结果。
5. 回归分析和预测回归分析用于研究自变量和因变量之间的关系,并建立线性或非线性模型来预测未来观测值。
通过分析历史数据和识别关键变量,我们可以使用回归分析来预测销售趋势、经济增长或其他变量的未来走势。
6. 实验设计和控制组实验设计是一项重要的统计学技术,用于确定影响因素并消除干扰因素。
在进行实验时,将参与者或对象分为实验组和对照组,并对其进行不同的处理。
通过比较两组的结果,我们可以确定处理的效果和影响因素。
统计科普 关于统计法 必须知道的一些小知识

统计科普关于统计法必须知道的一些小知识统计法是一种科学的数据分析方法,用于研究和描述数据的特征、规律和关系。
它是统计学的基本内容之一,也是社会科学和自然科学研究中不可或缺的工具。
在统计学中,有一些基础知识是必须掌握的,下面我们将介绍一些关于统计法的小知识。
1.样本与总体:在统计研究中,我们通常不能对整个总体(即要研究的对象的整体)进行观察和研究,而是通过抽取一部分样本来代表总体。
样本是总体的一个子集,用来推断总体的统计特征。
2.抽样方法:为了保证样本能够真实地反映总体的特征,需要采用适当的抽样方法进行样本选择。
常见的抽样方法包括简单随机抽样、分层抽样、整群抽样等。
3.描述统计:描述统计是对数据进行总结和概括的方法。
常见的描述统计指标包括平均数、中位数、众数、方差、标准差等,这些指标能够帮助我们了解数据的分布和集中程度。
4.推论统计:推论统计是从样本数据中推断总体特征的方法。
通过对样本数据的分析,可以得出关于总体特征的统计推断,如置信区间和假设检验等。
5.统计图表:统计图表是用来直观地展示数据分布和关系的工具。
常见的统计图表包括直方图、饼图、散点图、折线图等,它们能够帮助我们观察数据的规律和趋势。
6.回归分析:回归分析是一种用于研究变量之间关系的方法。
通过建立数学模型,可以探究变量之间的因果关系,并用于预测未来的数值。
7.方差分析:方差分析是一种用于比较两个或多个群体之间差异的方法。
它可以帮助我们判断某个因素对于结果的影响是否显著。
8.统计假设检验:统计假设检验是用于对统计结果进行验证的方法。
它通过设立一个原假设和一个备择假设,利用样本数据对两个假设进行比较,从而得出结论。
9.统计软件:统计学的发展使得统计分析变得更加便捷和高效。
目前市场上有很多成熟的统计软件,如SPSS、R、Excel等,它们可以帮助研究者对数据进行分析和统计处理。
10.统计误差:由于抽样和实验等过程中的随机性和误差,统计结果可能存在一定的不确定性,这就是统计误差。
统计学有趣的话题

统计学有趣的话题1.数据分析在现代社会中变得越来越重要。
2.千万别被统计学的平均数迷惑,它们可能掩盖了一些非常有趣的信息。
3.通过数据可视化,我们可以更容易地发现数据中隐藏的规律。
4.找到数据中的异常值和离群点可以帮助我们发现问题或机会。
5.对于一些问题,我们需要更精细的分析方法,例如ANOVA和回归分析等。
6.不同的统计方法可能会得到不同的结论,因此我们需要谨慎地选择合适的方法。
7.运用时间序列分析,我们可以预测未来的趋势和变化。
8.数据挖掘可以帮助我们挖掘大量数据中的有用信息。
9.在决策中使用决策树和分类器可以更好地理解数据。
10.了解概率分布和假设检验可以帮助我们判断我们的数据是否符合我们的期望。
11.统计学不仅仅限于数学,它也需要我们有强烈的大局观和分析能力。
12.做好统计学分析需要注意数据的完整性和准确性。
13.人们经常会对采样和样本的大小产生疑问,我们应该带着批判的眼光来解决这些问题。
14.通过Bootstrap方法和置信区间分析,我们可以更加准确地评估我们的统计估计。
15.在学习统计学的同时,我们也需要关注一些伦理和道德考虑。
16.了解大数据和机器学习的概念可以为我们在当前数字化时代的决策和业务提供帮助。
17.一些有趣的统计现象,例如“蒙特霍尔问题”和“贝叶斯定理”,可以让我们更好地理解统计学的核心概念。
18.有时,掌握更高级的统计学知识可以帮助我们设计更好的实验和研究。
19.需要提醒的一点是,统计学分析不能代替良好的实地研究和分析。
20.有趣的调查可以让我们更好地理解社会和人们的行为。
21.某些统计指标在不同领域中的应用也非常有趣,例如在运动中测量运动员的表现。
22.通过保存和共享数据集,我们可以从其他人的工作中学习到各种分析技能,加强我们的研究能力。
23.统计学的重要性在迅速增长,它是现代社会中取得成功的关键之一。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学不得不说的二三事毫不夸张地说,绝大部分国内期刊,甚至在很多低分SCI 杂志上,乱用统计学的现象多如牛毛。
还有很多医疗同行,对于统计甚为迷恋,能统计的也统计,不能统计创造条件也要统计,看见P小于0.05比亲爹还亲爹。
话说,统计是门很有神奇的学科,在讲之前我又要开始讲几个冷笑话,看懂了的可以举手。
话说:你知道吗,这个世界上绝大多数人拥有的腿的数量高于平均值?(第一遍没有看懂的小伙伴可以去面壁)再讲一个:你知道一个普通的民众有多笨吗?世界上一半的人都比他更聪明。
(其实这是不对的,世界上一多半的人都比他更聪明。
因为人类的智能有上限,愚蠢却没有下限,所以不是一个完美的正态分布。
)不过瘾,再讲一个:曼德勃罗有一次说,他出生在波兰,但在法国上的学,所以平均而言他是个德国人。
(所以,我出生在广东,但在东北上过学,所以平均而言我是个湖北人……)好冷好冷,我们还是来讲点正事,分享几则统计小故事。
1、两个指标诊断疾病的问题路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。
路人甲以A和B的参考范围上限作为诊断界值,得出了A和B在该界值下对应的诊断敏感性和特异性。
结果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。
路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。
路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。
诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A 和B的诊断价值。
文章的结论到底是想说明A优秀还是B 优秀呢?Reject!这个故事说明:统计指标选错了,统计出来的东西往往难以“自圆其说”。
稿件被退了,路人甲有些许郁闷。
经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。
路人甲很快绘制了ROC曲线,统计结果表明,A的曲线下面积为0.80,B的曲线下面积为0.82。
路人甲欣喜若狂,赶紧动笔写论文,并且理直气壮地给文章定了一个结论:B的诊断效率是优于A 的,其理由就是因为B的曲线下面积大于A。
路人丙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:从表面上看,B的曲线下面积高于A,但是导致这种差异的原因有两种,一种是抽样误差,一种是试验效应,即B确实是高于A的。
你怎么能确定这不是抽样误差呢?在统计学上,要确定0.82是否高于0.80,就一定要经过统计学检验的。
Reject!这个故事说明:在医学科研中,没有经过统计学检验的结论多半是不科学的。
稿件被退了,路人甲很是郁闷。
他吸取了经验教训,自学了很多统计学理论,终于弄清楚了采用何种方法去比较曲线下面积。
接下来的事情就是改稿,然后另选杂志继续投稿。
路人甲在文稿中特别注明了,曲线下面积是经过了统计学检验的,B的曲线下面积(0.82)与A的曲线下面积(0.80)之间的差异是有统计学意义的,而且还大摇大摆地在后面加了个括号,写明P=0.01。
路人甲仰天长叹了一口气,很郑重地给自己的研究下了结论:本研究表明B的诊断效率是优于A的。
路人丁是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:B是常见的诊断指标,其检测结果并不对临床医师设盲,在很大程度上可以检测影响临床医师对疾病的诊断。
A是新进发现的诊断指标,其结果完全对临床医师设盲,不可能影响医生的诊断。
所以作者的结论(B 比A优秀)是不可靠的。
再说得通俗点,如果把A和B分别理解成法庭上的原稿和被告,那B无疑既充当了辩护律师,又充当了法官的角色。
在这种情况下,A输掉了官司是十分正常的。
如果换一个公平的、独立的法官来断案,B能否胜出就不好说了。
Reject!这个故事说明:实(试)验设计有缺陷,再优秀、再正规的统计学方法也于事无补。
稿件又被退了,路人甲的心情极度郁闷。
思来想去,决定把实验重做一遍,让A和B在一个公平的环境中比较(为便于描述,此处忽略医学伦理学问题)。
在新开展的研究中,A和B都是对临床医生设盲的,不可能影响金标准。
这下A和B的比较结果应该比较可靠了吧,路人甲又仰天长叹了一口气,感觉自己如释重负了。
科研太折腾人了,太不容易了!统计结果很快出来,A的曲线下面积是0.80,B的曲线下面积则变成了0.77,经过统计学检验后发现,A的诊断效能确实是高于B 的。
整个研究的试验设计滴水不漏,统计学过程天衣无缝,我就不信还有人敢拒这篇稿件,路人甲心中开始暗喜。
路人戊是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:A和B的检测并不矛盾,他们之间的关系不应该是竞争关系,而应该是合作关系。
读者最关心的问题显然不是A和B“孰强孰弱”的问题,虽然这个问题有一定的专业价值。
如果我是坐诊医生,我会说:A和B 谁强谁弱关我什么事?总之来一个病人我就A和B都检测,我的患者都不差钱!作者的研究重点应该是明确A和B能否互补,联合使用是否能有助于提高诊断准确性的问题,而非A和B“孰强孰弱”的问题。
简单地说,就是明确1 1是否大于1的问题。
Reject!文章又被拒稿了。
这个故事说明:研究方向错了,即使是无懈可击的实(试)验设计和天衣无缝的统计方法,也是无济于事。
这四个故事说明:医学科研是很痛苦的,不重视统计学和科研设计,会走很多弯路的。
2、降糖药的研究、学生自杀事件路人甲长期从事降糖药的研究,最近他发现了一种药物,可以降低患者的血糖。
为了评价该药的降糖效果,路人甲费尽心机地设计了一个看似完美的随机对照试验(RCT),为了保证结果可靠,路人甲严格遵守RCT设计准则,包括随机、双盲、安慰剂对照等措施。
研究结果表明,实验组和对照组在接受药物治疗前血糖浓度的均值都是10mmol/L,差异无统计学意义,表明两组研究对象的基线特征具有可比性。
对照组未经任何药物治疗(为便于描述,此处忽略医学伦理学问题),血糖浓度还是10mmol/L;实验组经过药物干预后,血糖浓度变成了9mmol/L,统计学检验结果表明,实验组和对照组治疗后的血糖浓度的差异是有统计学意义的(P)。
路人甲赶紧撰写论文,并毫不客气地给研究下了个结论:该药可以降低患者血糖。
路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:却要确实可以降低血糖,但是一个只能降低1mmol/L的降糖药有何临床价值?Reject!这个故事说明:有统计学意义不一定有专业意义。
路人甲做了一个调查,同处一地的A和B两所中学,各有1000名学生,过去的一年,A校有5名学生自杀(自杀率为0.5%),B校没有学生自杀(自杀率为0%)。
统计学结果表明,两校自杀率的差异无统计学意义(P=0.07,Fisher确切概率法,笔者进行了统计)。
于是路人甲得出结论:A和B两校的自杀率是没有差异的,A校5名学生自杀纯属小概率事件。
路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:5个鲜活的生命就这样没有了,5个家庭就这样毁了,你却告诉我这纯属小概率事件,你就不怕“人神共愤”吗?Reject!这个故事说明:有专业意义不一定有统计学意义。
这两个故事说明:做医学科研,不能死磕统计。
3、如何看待统计学结果路人甲经历数十年的研究,动用了各种高精尖的研究手段,发现了一个新的蛋白(命名为蛋白A)。
在肝癌患者中展开的研究表明,蛋白A和甲胎蛋白(AFP)有很好的相关性,其相关程度之好,几乎可以用“一塌糊涂”来形容,相关系数达到了0.99(P)。
路人甲欣喜若狂,尽管蛋白A的检测过程还十分繁琐,检测费用还十分高,但是路人甲还是把持不住内心的激动,日夜兼程地撰写论文,宣称自己找到了一个新的肝癌标志物。
路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:统计结果表明蛋白A和AFP的相关性十分明显。
如果是这样,在临床实践中,通过检测AFP完全就可以得知蛋白A的浓度了,蛋白A在肝癌中的临床价值完全可以被AFP代替,还不说蛋白A的检测过程繁琐,费用太高的问题,你说蛋白A还有什么价值?Reject!这个故事说明:统计学阳性的结果未必是“好结果”。
路人甲发明了两套诊断肺癌的方案,分别命名为A和B。
为了明确这两种方到底谁“更胜一筹”,路人甲找了100个肺癌患者和100个疑似肺癌患者(结核、肺炎等),分别用A、B两套方案去进行鉴别诊断。
在200个研究对象中(100个肺癌和100个非肺癌),方案A正确了100回,准确率50%,方案B仅仅正确了50回,准确率仅为25%。
卡方检验表明:方案A和B准确率之间的差异有统计学意义(P)。
很明显,方案A的准确性要高于方案B。
路人甲赶紧发表论文,指出:方案A诊断肺癌的准确性优于方案B。
路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:如果我(审稿人本人)是坐诊医生,他就会反着看方案B的结果,凡是方案B认为是肺癌的,他就认为病人不是肺癌;反之亦然。
这样下来,200个病人中,方案B应该能正确识别150个人,准确率为75%,统计学结果表明,方案B的准确率(75%)是高于方案A(50%)的,所以真实的情况是方案B优于方案A。
实际上,当面对这200名患者的时候,随便到城隍庙找个瞎子来“算命(猜患者是否患病)”,按照统计学理论,准确率也应该是50%,方案A的价值可以说是“一无是处”。
Reject!这个故事说明:统计学阴性的结果未必是“坏结果”。
还是那个AFP与蛋白A 的例子。
路人甲发现蛋白A和甲胎蛋白(AFP)之间有很好的相关性,也开始撰写论文,但是他的结论并不是“蛋白A是诊断肝癌的标记物”。
他认为,既然蛋白A与AFP之间有很强的相关性,那提示AFP和蛋白A之间可能存在十分密切的“调节”或者“被调节”关系。
最终,路人甲围绕“蛋白A与AFP之间的调节或者被调节关系”做了很多分子生物学试验,指出蛋白A是调节AFP表达的唯一(注意“唯一”这两个字)因子,因此二者之间才会呈现如此强烈的相关性。
这是一项基础研究,虽然未能直截了当地地指出蛋白A的临床价值,但是这个研究形象生动地讲述了一个完整的分子生物学事件,丰富了我们对于肝癌发生与发展分子机制的认识。
最终,论文“堂而皇之”地accept了。
这个故事说明:同一统计学结果,从不同的专业角度去解释,结论是完全不同的。
这三个故事说明:对统计学结果的解读一定要结合专业!从专业中来,到专业中去!今天就策到这里,我也理解统计对于临床大夫很难,所以,大家要是时间搞不懂,别自己闷着头苦干,可以像统计专业人士寻求帮助!。