统计学-部分经典文献
统计显著性_一个被误读的P值_基于美国统计学会的声明_郝丽
收 稿 日 期 :2016-04-06;修 复 日 期 :2016-10-11 基金项目:国家社会科学基金项目 《基于大数据分析的城市社区养老模式研究》(15BRK002) 作 者 简 介 :郝 丽 ,女 ,安 徽 寿 县 人 ,经 济 学 硕 士 ,副 教 授 ,研 究 方 向 :体 育 与 健 康 大 数 据 统 计 分 析 ;
2016年3月7日,美国统计学会执行主任 Ron- ald L.Wasserstein 代 表 美 国 统 计 学 会 理 事 会 在 《The American Statistician》杂 志 (网 络 版 )上 发 表 了名为《关 于 统 计 显 著 性 与 P 值》的 官 方 声 明。 之 后 ,在 中 国 统 计 学 门 户 网 站 “统 计 之 都 ”上 ,邱 怡 轩 发 表博文“美 国 统 计 协 会 开 始 正 式 吐 槽 (错 用 )P 值 啦”;2016年3月23日,在微信公 众 号“科 研 圈”上, 谭坤编译了“美国统计学会权威发布:P 值应该这么 用 ,学 界 有 错 须 改 正 ”的 有 关 内 容 。
比 较 ,视 实 际 值 落 入 接 受 区 域 还 是 拒 绝 区 域 ,做 出 是
否拒绝原假设 H0 的结论。 具体来说,当需要采用 Z 统 计 量 进 行 右 侧 检 验
时,检验规则为:当Z ≥zα时,拒绝 H0;当Z <zα时, 不能拒绝 H0。
假设检验的规则实 际 上 就 是 “小 概 率 原 理”,即
关键词:统计显著性;P 值;心理统计学;贝叶斯统计 中 图 分 类 号 :C829.29∶O211.9 文 献 标 志 码 :A 文 章 编 号 :1007-3116(2016)12-0003-08
统计学简史汇总
统计学简史l、起源,分布统计是初产生于研究对国家,特别是对其经济以及人口的描述。当时现代数学尚未形成。因此那时的统计史基本上是经济史的范畴。现代统计主要起源于研究总体(population),变差(variation)和简化数据(reduction of data)。第一个经典文献属于John Graunt(1620-1674),其具有技巧的分析指出了把一些庞杂、令人糊涂的数据化简为几个说明问题的表格的价值。他注意到在非瘟疫时期,一个大城市每年死亡数有统计规律,而且出生儿的性别比为1.08,即每生13个女孩就有14个男孩。大城市的死亡率比农村地区要高。在考虑了已知原因的死亡及不知死亡年龄的情况下,Graunt估计出了六岁之前儿童的死亡率,并相当合理地估计出了母亲的死亡率为1.5%。因此,他从杂乱无章的材料中得出了重要的结论。他还给出了一个新的生命表。Edmond Helley(哈雷)(1656-1742)利用了Breslau的记有死亡年龄的数据,改进了Graunt的生命表并引进了死亡率的定义。瑞士数学家Leonhard Euler(欧拉)(1707-1783)提出了平稳生命表的概念。John DeWitt(625-1672)等人最早讨论退休金和人寿保险的方案。Thomas Robert Malthus(马尔萨斯)(1766-1834),Alfred James lotke(1880-1949),Ronald Aylmer Fisher(费歇)(1890-1962),及William Feller(费勒)(1906-1970)等人用渐趋复杂的数学来研究生命表的理论,这对人类及其它总体的动方学描述具有显著意义。William Petty(1623-1687)是Graunt同时代的经济学家及朋友。他认为需要建立中央统计部来利用人口统计学的知识;由行政区利用列出记录年龄,性别,婚姻状况等细节的记录表格来收集数据;要有出生,死亡,婚姻,收入,教育和商业等方面的统计数据。当时在研究诸如死亡等时间序列时,Graunt注意到了随机的起伏;但他仅以机械的术语加以描述一把这些与钟表运动的忽动忽停相联系。实际上,这种不规则的变化也影响赌博和天文学。因此,其后进一步导致了随机误差的误差分布概念的出现。赌博产生了第一个机会事件的模型:如果硬币就骰子的每一面都有相同概率,则导致估计抛一个均衡的硬币所出现的正面次数或掷一个均衡的骰子的总点数。更一般地,Abraham de Moivre(棣美佛)(1667-1754)导出了对二项分布的一个近似;这使每一个概率都等于正态曲线下的一块面积,这是一种的中心极限定理。Pierre simon Laplace(拉普拉斯)(1749-1827)导出了对男子出生比例的类似的渐近公式。Jacob Bernoulli(伯努利)(1654-1705)以弱大数定律支持了对大样本均值的使用。Tomas simpson(辛普森)(1710-1761)计算了同分布随机变量和的精确分布,同样也支持了对大样本均值的使用。在天文学中,要对一些运动星体位置的未知参数进行估计,通常某种意义上“最好的”估计都是来源于一些注定不和谐的观察值,因为只要观察值在数量上超过参数,就会产生度量误差。Roger Cotes(1682-1716),Thomas Bayes(贝叶斯)(1702-1761),Euler,Johann Toblas Mayer(1723-1762),Rudger Josif Boskovic(1711-1787),Laplace,和Adrien Marie Legendre(勒让德)(1752-1833)都在研究这个问题。后来被Friedrich Gauss(高斯)(1777-1855)解决。John Michell(米歇尔)(1724-1793)用统计方法证明了双星的存在。然而,认定现代统计理论是由精算科学,人口学和天文学的需要而发展来的观点是不正确的;事实上,它是由心理学,医学,人体测量学,遗传学和农业的需要发展出来的。直到1830年,几乎所有的经验分布都是关于一维误差或一个非数值变量。在1830年之后,天文学家和社会学家Adolphe Jacques Quetele(1796-1874)使得诸如身高体重之类的度量值的变量的经验分布通俗化。他在生物统计研究中大量利用了理论二项分布和正态分布。后来Ladislaus von Bortkiewicz(1868-1931)报告了在普鲁士兵团中由马踢造成的受伤事故,发现Poisson(普阿松)分布和官方统计学有关。在计算血红细胞数目上,Poisson分布也被Ernst Abbe(1840-1905)所用。从那时起,该分布被大量地用于计数的试验中,比如闪光的计数。在生物学上,统计方法使得Johann Gregor Mendel(孟德尔)(1822-1884)认识到某些主要遗传基因的存在,它们在0,l和2三个水平显现,其中水平0(双隐性)能和水平1和2区别开来。他能确定有相同或不相同的水平的个体之间交配的结果,而且提出了某些生物学事件等价于掷一个硬币的模型;他能对任意交配的结果给出概率并用实验来验证其假设。虽然经济学没有产生超出用初等理论来求解问题,但在较早的医学统计中却夹生了有意思的问题。Philippe Pinel(1745-1826)和Pierre Charles alexandre Louis(1787-1872)开始了建立疾病分类的困难课题;这些工作人员保存了精确和完整的所有病例的记录,并且能给出和预后有关的统计数字。Louis能有利用跟踪调查的方法反驳以当时广泛滥用的放血疗法。他的三个学生是值得一提的:Jules Gavarret(1808-1890)写了一本医学统计的教科书;书中有应用Simeon Dents Poisson(1780-1840)理论来对两个比例进行检验的许多应用;Oliver Wendell Holmes(1809-1894)和他的不知名的数学顾问对一系列分娩热病例给出了有趣的分析,证明该病是传染的,这优于任何十九世纪的类似研究;William Farr(1807-1883)在官方统计学中建立了新的惯例。更直接的原动力来自于遗传学(确切地说是优生学)。Francis Galton(1822一1911)在1886年研究了两代豌豆重量之间的相关时发现了Y关于一个正态变量X 的线性回归及类似于椭圆的等概率线。从此,多元正态分布就经常出现在文献之中;而两个和三个变量的正态分布在Lapface时就已经知道了。该联合分布能够由互相独立的正态随机变量的线性变换而构造,例如Giovanni Antonio amedeo Plana(1781-1863)和Irenee-Jules Bravais(1811-1863)和Irenee-Jules Bravais(1811-1863)所做,而且,反过来它能分解为互相独立的正整随机变量的积,如Auguste Bravais(l820-l884)在最小二乘理论上导出了一般形式的多元正态分布;Arthur Cayley(1821-1895)把xTAx化简为平方和并确定了该常数值。这些人都未对A-1=V的非对角线元素感兴趣,这里V是协方差矩阵。Galton后来说“这些误差或偏差正是我想要研究并了解的。”正态分布在理论统计中扮演了一个非常重要角色。有许多理由来说明这一点;一般来说,如果一个模型包含着正态分布的几个非平凡特性,则它必须具备所有的特性。在1895年,Karl Pearson(皮尔森)(1857-1936)认识到更理论的统计分布的需要,并且得到作为微分方程(Pearson方程组)解的密度函数;和另外一些统计学家一样,Andrei andreevic Markov(马尔科夫)(1856-1922)不愿意用Pearson分布方程组,因为即使得了皮尔森Г曲线作为一个极限分布,也没有明显的模型来产生它们。Markov进一步证明Pearsonχ2统计量为样本尺寸乘以Wihelm Hector Bichard albrecht Lexis(1837一1914)的离散系数。Walter Frank Raphael Weldon(1860-1906)利用取独立初第二项变量和的方法得到二项变量的联合分布。许多作者,比如Alexander Craig Aitken(1895-1967),已经参与了发展该思想;但是许多其它思想已经被用来获得联合分布。在KarlPearson的方法不能产生更多的联合分布之后,Sergei Natanovic Bernstein(1880-1968)认为一个更具有生产价值的方法可能存在于随机过程的领域中。2、KarPearson时代,1890-1920到1920年为止的英国生物统计学派的主要就为(i)收集并化简了许多经验数据;(ii)定义了具有多重和总相关系数ρ的联合正态分布,还定义了估计误差的联合分布;(iii)关于拟合度的χ2检验,比较观察分布和理论分布,包括由Herbert Edward Soper(1865-1930)引进的条件Poisson变量;(iV)分析列联表,特别是利用χ2统计量;(V)当边缘分布充分细分时由最大似然法估计ρ;(Vi)当边缘分布没有充分定义时估计ρ;(Vii)由一个统一的参数估计系统来描述一组曲线,即矩方法;(Viii)利用正态定理到遗传选择问题;(iX)通往独立性一般定理的某些进展;(X)通往估计和检验估计精确性的一个理论的进展;(Xi)构造了适当的表。与此同时,在法国的Feli院x Edouard Justin emile borel(1871-1956),Maurice Frenchet(1878-1973)及Jules Henri Poincare(1854-1912),和在俄国的Alekandr Aleksandrovic Cuprov(1874-1926),A.A.Markov和Vsevolod Ivanovic Romanovsky(l879-1954)作出许多贡献,特别是把数据的数学处理严格化。3、R.A.FISHER时代,1921-1936所有的皮尔森的方法都可以应用于大样本,而且可以对方差作出较精确的估计。但对于出现在实际应用中的小样本,这些方法就未必奏效了。William Sealy Gosset(1876一1937)由此导出了一个检验;按照R.A.Fisher的建议该检验在作了一个变换之后成为现在熟悉的t-检验。Fisher以其四篇值得纪念的论文开创了一个新纪元;相关系数估计的精确分布;协调一致了Mendelian和生物统计对遗传学的不同方法;正确解释了列联表;估计和推断的一般定理。在1920年之后,在Rothamsted实验室,Fisher发展了有广泛应用价值的方差分析和试验与分析的理论。Fisher有很强的数学功底,特别是在组合论(combinatorics)方面,他能吸引其他数学家作为助手。他对应用领域的选择是很幸运的;研究结果都能立即应用并有明显的经济效应;能够有效地简化假设,比如误差的正态性和独立性;和一些顽固的教条斗争;试验的花费都很低;没有伦理问题。许多重要的步骤用来发展上面提到的Pearson学派的工作的一些分支。在(iii)和(iV)中的许多重要问题被解决了;给出了正确的自由度;K.Pearson已经为该目标前进了一段;在(Vii)中Fisher发明了更有效的方法来估计;他拒绝了用矩方法来确定分布;在(Vi)中Fisher和Y ate发表了统计表。Fisher在误差分布和互相独立性的假设使其能用正交变换来保持线性和二次型之间的独立性,这样就可合理地利用t-检验和F-检验。Fisher看到农业试验能利用更复杂的设计。于是,双向表的影响能够按地理因素(行和列)及处理来分别分析。这能推广到n维Latin方的应用,把处理用于Latin方相应的不同字母的位置上;该方法通过实行Graeco-Latin方来实现。Fisher及其助手和同事研究了设计问题,缺损值问题,非正交性等等;这些人包括Maurice Stevenson Bartlett(1910-),William Gemmell cochran(1909-1982),他们后来在美国特别有影响。此外,还有David John Finney(1917-),Joseph Oscar Irwin(1898—1982),Kanneth Mather(1911一),及Frank Y ates(1902-)。4、NEYMAN-PEARSON时代,1937-1949Jerzy Neyman(1894-1981)及Egon sharpe Pearson(1895一1980)在一系列的杰出的文章中澄清了推断理论,特别是有关显著性检验的基本原理一其合理性以往是常被批评。早期的显著性检验为关于二项变量之间或均值之间的,它们被K.Pearson推广至χ2检验,被R.A.Fisher推广到F-检验,推广了Student T-检验。Neyman和 E.S.Fearson看出,为了更有效,应该考虑与待检验的零假设相对应的备选假设。他们在这样的检验中设立两种误差并因素导致了他们的基本引理,似然比检验,及势的概念;他们顺便验证了大多数常见的显著性检验的应用;他们还引进了置信限;但是他们的体系从未被Fisher所承认。Neyman和Pearson的工作影响了许多人,特别是美国人。5、现代,1950—统计变得越来越数学化了。为了解对分布和推断理论的一般描述,需要测度论;Fourie分析成为研究波动最自然的工具;在分析方差的推断上,和在具对称性的设计以及在诸如Graeco Latin方及Steiner三元体的特别结构的代数的推断上需要应用群论和数论。组合理论能用于编码理论和有限几何。因此统计数学成为纯粹数学的一部分,并且因其在各种领域的广泛应用而被研究。因为通常的统计检验已经彻底地研究了,而且往往被置身于某些具体应用领域的实际工作者所应用,所以在研究人员和实际工作者之间出现了一个距离;但是这种现象在其他开拓性的领域中也能看到。电子计算机已经带来了巨大的变化。数据,比如海洋学中水面的高程,电磁能(特别是无线电波)的流量,工业过程的状态,生物的状态,都能用计算机收集;没有计算机这些是不实际或不可能的。计算机节省了大量人力,特别是在同样输出的重复计算上,例如在计算多元分析的相关系数和其它检验统计量时。由于计算软件包可用于所有通常的检验,特别是关于方差分析,则节省更多。高速计算使得有可能运用匹配和排列检验。当分布不能写成一个封闭的分析公式时,显著性水平也能计算;另外,计算机能用Monte Carlo方法计算每一个事件的概率或近似显著性水平。由于利用软件包很方便,有时导致对统计问题欠考虑而产生的结论,特别是在多重比较上。模型在统计和科学工作中的作用现已被广泛承认;虽然基于应用领域的经验和知识,模型的选择在某种程度上是美学上的和任意的;但是一旦模型被选定,所有的推断都是数学的,用不着进一步的假设或原则。所用的推断体系在某种程度上也是任意的;备选体系已经被大量研究。基于信仰的推断不再扮演重要的角色。贝叶斯模型在Fisher时代曾一度失色,之后又被更广泛地应用。信息论已被引进;多数统计推断看来仍然以和Neyman—Pearson理论一致的方式来运作,运用在K.Pearson和Fisher时代引人的检验。现代国家的增长的能力和兴趣要求以低花费收集更多的数据。Antlers Nicolai Kiaer(1838-1919)有远见地建议概率抽样应补充到人口普查方法中。这样的抽样已经在其被Prasanta chandra Mahalanobis(1893-1972)引进之后成为在印度和其它地方的标准实践。被Andrew Shewhart(1891-1967)所推广的工业质量控制方法也有类似的意图。许多新的分支或专门化和应用已经被发展了:决策论,时间序列,多元分析,经济计量学,博奕论,临床试验,非参数推断,序贯分析,数学生物分类学,及可靠性。数量统计及其应用正在继续发展和扩大。[ncaster 中国人民大学统计学系吴喜之译][译自Encyclopedia of Statistical Science,wiley,New Y oyk 1988]。
(完整word版)文献综述部分参考写法
非负矩阵分解文献综述一、国内外研究现状近年来,技术传感器技术和计算机硬件的发展导致数据量的增加,许多经典数据分析工具被迅速压倒.因为信息采集设备只有有限的带宽,收集到的数据并不经常准确.其次,在很多情况下,从复杂现象观察到的数据,其往往代表几个相互关联的变量共同作用的综合结果。
当这些变量更少的精确定义时,在原始数据中包含的实际信息往往是重叠的、模糊的.为了处理这些海量数据,科学家产生了新的关注。
1999年,在刊物Nature上,Daniel Lee 和Sebastian Seung开始的一系列新的NMF的研究,数以百计的论文引用Lee 和Seung的论文,但一些较不为人知的事实是,在Lee 和Seung 的论文发表之前,Pentti Paatero开始了相关的工作. 虽然Lee和Seung引用Paatero的论文,Lee和Seung将Paatero的工作称为正矩阵分解,然而,Paatero的工作很少被后来的作者所引用。
这是因为Paatero将其工作称为正矩阵分解,这是误导Paatero创建NMF算法.实际上Paatero年前发表了他最初的分解算法[1]。
2005年,Lin为了加速Lee和Seung的NMF迭代算法的收敛速度,最近提出使用投影梯度有约束的优化方法[2],该方法与标准的(乘法更新规则)的方法相比,计算似乎有更好的收敛性.使用某些辅助约束,可以降低分解有约束的优化假设,降低投影梯度方法的局限性。
2007年,V。
Blondel等对标准NMF算法进行了加权改进,提出了加权NMF方法[3]。
通过加权,更好的表述了数据中的重要区域。
其加权方法是:首先,定义数据中的重要区域,然后,在优化过程中,如果在该重要区域中重建错误,就给他分配更多的权重.国内对NMF的研究相对开始的较晚。
2001 年,原微软中国研究院的李子青博士、张宏江博士等人发现Lee和Seung提出的经典NMF算法在人脸图像未得到配准的情况下,不能学习得到人脸的部件。
统计学 文献综述
统计学文献综述统计学是研究如何从数据中提取有用信息,以及如何通过这些信息来做出决策和预测的科学。
在过去的几十年里,统计学得到了广泛的应用和发展,涉及的领域包括生物学、医学、经济学、社会学等。
以下是对统计学领域的一些重要文献的综述。
一、描述性统计学描述性统计学是统计学的基础,它主要研究如何通过图表、表格和数字来描述数据的特征和规律。
以下是一些重要的描述性统计学文献:《统计学基础》(作者:David Freedman)这本书是统计学入门教材的经典之作,它详细介绍了描述性统计学的概念和方法,包括平均数、中位数、众数、方差、标准差等。
此外,书中还涵盖了概率论和概率分布的基础知识,为进一步学习统计学打下了坚实的基础。
《实用回归分析》(作者:David Freedman)这本书是回归分析领域的经典之作,它详细介绍了线性回归分析的概念和方法,包括最小二乘法、模型拟合度、变量选择等。
此外,书中还介绍了非线性回归分析和其他回归分析方法,为数据分析和预测提供了重要的工具。
二、推断性统计学推断性统计学是统计学的核心,它主要研究如何通过样本数据来推断总体特征。
以下是一些重要的推断性统计学文献:《概率论与数理统计》(作者:吴喜之)这本书是概率论与数理统计的经典教材之一,它详细介绍了概率论和数理统计的基本概念和方法,包括大数定律、中心极限定理、参数估计、假设检验等。
此外,书中还涵盖了贝叶斯统计学和其他推断性统计方法,为数据分析提供了重要的理论支撑。
《实验设计与分析》(作者:John Maurice Hoey)这本书是实验设计与分析领域的经典之作,它详细介绍了实验设计和数据分析的方法和技巧,包括单因素和多因素实验设计、方差分析、协方差分析等。
此外,书中还介绍了实验设计在实践中的应用,为科研人员和工程师提供了重要的参考。
三、机器学习与数据挖掘随着大数据时代的到来,机器学习和数据挖掘在统计学领域的应用越来越广泛。
以下是一些重要的机器学习和数据挖掘文献:《机器学习》(作者:Tom M. Mitchell)这本书是机器学习领域的经典之作,它详细介绍了机器学习的概念和方法,包括分类、聚类、决策树、神经网络等。
统计学丨课程思政案例分享
统计学丨课程思政案例分享01课程思政内容统计学发展史许宝驟:中国统计的一代宗师(第1章导论)课程思政目标(1)了解我国统计学发展史,尤其通过中外统计学发展史的比较,有利于我们总结历史经验,了解国情。
(2)通过对许宝驟老师等优秀统计学家热爱祖国、兢兢业业工作的光荣事迹的研究,增强爱国主义情怀。
教学实施过程(1)课外阅读:统计学发展史、许宝驟:中国统计的一代宗师(2)课堂讨论:我国统计发展的几个阶段及其特点;中外统计发展对比(中国的统计思想前期比西方繁荣,后期发展缓慢,原因是什么?之后的改进有哪些?);介绍一位我国的统计学家;其他读后感。
02课程思政内容统计调查(第2章数据的搜集)课程思政目标引导学生在统计调查过程中实事求是、严谨求真,培养耐心细致的工作作风和严肃认真的科学精神。
统计职业道德规范的基本内容包括:忠诚统计,乐于奉献;量力而行,不出假数;依法统计,严守秘密;公正透明,服务社会。
个中,量力而行、不出假数是统计职业道德的核心内容。
教学实施过程(1)要求学生课外精读文献《经验研究中的枢纽细节》、《实地调查基础之上的研究报告写作》,这是与统计调查亲昵相干的经典文献。
(2)学生会商,发表读后感想(3)老师总结,在实施统计调查以及在此基础上完成分析报告应注意的事项。
03课程思政内容设计统计调查方案,开展问卷调查,撰写分析报告。
(第2章数据的搜集、第3章数据的图表展示)课程思政目标(1)引导学生在统计调查过程中实事求是,在撰写调查报告过程中不出假数。
统计职业道德规范的基本内容包括:忠诚统计,乐于奉献;实事求是,不出假数;依法统计,严守秘密;公正透明,服务社会。
其中,实事求是、不出假数是统计职业道德的核心内容。
(2)根据调查数据撰写调查报告时,引导学生透过现象看本质,强化实践能力和创新能力,培养耐心细致的工作作风和严肃认真的工作态度。
(3)问卷设计与展开统计调查过程中,培养学生具备团队协作的优良品质。
讲授实施进程教师:教师团队之前获得过一项横向项目《上海民间投资发展环境分析》,跟学生讲述具体的调研和撰写调查报告的过程,培养学生团队协作的优良品质和严谨求真的科学精神。
应用统计学专业推荐选读书目
应用统计学专业推荐选读书目一、数学文化部分1.《怎样解题》波利亚著,科学出版社1982年版2.《数学与猜想》波利亚著,科学出版社1984年版3.《数学与似真推理》波利亚著,福建人民出版社1985年版4.《数学的发现》波利亚著,科学出版社1982年版5.《古今数学思想》(1—4卷)克莱茵著,上海科技出版社1979—1981年版6.《数学的精神、思想与方法》朱芷国著,四川教育出版社1986年版7.《高观点下的初等数学》 F.克莱茵著,湖北教育出版社1986年版8.《数学手稿》马克思著,人民出版社1976年版9.《数学领域中的发明心理学》江苏教育出版社1989年版10.《人人关心数学教育的未来》世界图书出版社1993年版11.《美国数学的现在和未来》复旦大学出版社1986年版12.《从惊讶到思考—数学悖论》科学技术文献出版社1984年版13.《数学加德纳》戴维·A.克拉纳著,上海教育出版社1987年版14.《从混沌到有序》伊·普里戈金等著,上海译文出版社1986年自版15.《猜想与反驳》波普尔著,上海译文出版社1986年版16.《数学—它的内容、方法与意义》(1—3卷)亚历山大著,科学出版社2001年版17.《数学史上的里程碑》伊夫斯著,北京科学技术出版社1993年版18.《数论妙趣》阿尔伯特著,上海教育出版社1998年版19.《大众数学》(上下册)范格本著,科学普及出版社1992年版20.《数学确定性的丧失》M.克莱茵著,湖南科技出版社1997年版21.《数学:新的黄金时代》德夫林著,上海教育出版社1998年版22.《自然哲学之数学原理宇宙体系》牛顿著,武汉大学出版社1977年版23.《数学方法论先讲》徐利治著,华中工学院出版社1983年版24.《数学与文化》邓东皋等著,北京大学出版社1990年版25.《数学与教育》丁石孙等著,湖南教育出版社1991年版26.《数学与社会》胡作玄著,湖南教育出版社1991年版27.《数学与经济》史济怀著,湖南教育出版社1990年版28.《数学与语言》冯志伟著,湖南教育出版社1991年版29.《数学分析的方法及例题选讲》徐利治等著,高等教育出版社1982年版30.《数学思想发展简史》袁小明等著,高等教育出版社1992年版31.《从数学教育到教育数学》井中等著,四川教育出版社1989年版32.《几何中机器证明的基本定律》吴文俊著,科学出版社1984年版33.《21世纪数学展望》江苏教育出版社1992年版34.《中国数学通史》李迪著,辽宁教育出版社1997年版35.《世界数学通史》梁宗巨著,辽宁教育出版社1995年版36.《九章算术》辽宁教育出版社2000年版37.《华罗庚》王元著,开明出版社1994年版38.《数:上帝的宠物》谈祥柏著,上海教育出版社1998年版39.《科学发现纵横谈》王梓坤著,湖南教育出版社1979年版40.《科学发现纵横新编》王梓坤著,北京师范大学出版社1992年版41.《中国数学史》钱金琛著,科学出版社1992年版42.《现代数学设计论》盛群力等编,浙江教育出版社1998年版43.《混沌控制》胡岗著,上海科技出版社2000年版44.《Mathcad7.0实用教程》思索著,人民邮电出版社1998年版45.《Matlab应用程序接口用户指南》刘志俭著,科学出版社2000年版46.《数学奇妙》西奥妮.帕帕著,上海科技出版社1999年版47.《数学的源与流》张顺燕著,高等教育出版社2000年版48.《世界著名数学家评传》袁小明著,江苏教育出版社1990年版50.《古今数学思想》(1-4 册),M. 克莱因,北京大学译,上海科学技术出版社, 1979-198151.《数学 -- 它的内容、方法和意义》( 1-3 卷),亚历山大洛夫等,科学出版社, 1958--196252.《数学史概论》, H. 伊夫斯,欧阳绛译,山西人民出版社, 198653.《中国数学简史》,中外数学简史编写组,山东教育出版社, 198654.《外国数学史讲义》(上),张洪光,赣南师院数学系讲义, 198355.《数学简史》,冯长彬,赣南师院数学与计算机系, 199156.《数学史教程》,李文林编著,高等教育出版社, 1999二、统计学基础部分57.《统计学》 David Freedman等著,魏宗舒、施锡铨等译,中国统计出版社。
统计学经典书籍推荐
统计学经典书籍推荐这是我碰巧在网上看到有人做了一些关于统计学经典书籍推荐和建议的总结,所以特意转载与此,希望对大家有用。
一、统计学基础部分1、《统计学》David Freedman等著,魏宗舒,施锡铨等译中国统计出版社据说是统计思想讲得最好的一本书,读了部分章节,受益很多。
整本书几乎没有公式,但是讲到了统计思想的精髓.2、《Mind on statistics(英文版)》机械工业出版社只需要高中的数学水平,统计的扫盲书.有一句话影响很深: Mathematics as to statistics is somethinglike hammer,nails,wood as to a house,it's just the material andtools but not the house itself。
3、《Mathematical Statistics and Data Analysis(英文版.第二版)》机械工业出版社看了就发现和国内的数理统计树有明显的不同。
这本书理念很好,讲了很多新的东西,把很热门的Bootstrap方法和传统统计在一起讲了。
Amazon上有书评。
4、《Business Statistics a decision making approach(影印版)》中国统计出版社在实务中很实用的东西,虽然往往为数理统计的老师所不屑5、《Understanding Statistics in the behavioral science(影印版)》中国统计出版社和上面那本是一个系列的.老外的书都挺有意思的6、《探索性数据分析》中国统计出版社和第一本是一个系列的。
大家好好看看陈希儒老先生做的序,可以说是对中国数理统计的一种反思。
二、回归部分1、《应用线性回归》中国统计出版社还是著名的蓝皮书系列,有一定的深度,道理讲得挺透的。
看看里面对于偏回归系数的说明,绝对是大开眼界啊!非常精彩的书2、《Regression Analysis by example (3rd Ed影印版)》这是偶第一本从头到底读完的原版统计书,太好看了。
统计学的故事
统计学的故事纪宏袁卫文2004年1月形式来描述。
用土话说,自然和社会都是有规律的,这种规律虽然不受人的主观意志的影响,却能被人的思维所理解。
又过了很多很多年,经过无数人大胆的观察、敏锐的猜想、天赋的直觉和一不怕苦二不怕死的精神,建立了现代科学的理论体系和思想体系。
在天文学、物理学、生物学、人文社会科学以及数学和哲学等领域都取得了重大成果。
虽然数百年来,科学和哲学的门派林立,各自有各自的掌门人,各自占据着各自的山头,都因自己发现真理而笑傲江湖。
但有一个基本观点被大多数人承认,即这个世界是有规律的。
我们是否可以用身边的事和通俗的语言解读一下科学巨匠们所研究的规律。
请想一想,我们身边经常发生的重复出现的、有规律的现象:太阳每天从东方升起,冬天过去春天就要来临,物体失去支撑就会坠落,“神舟五号”飞航按设计的轨道运转,经济按市场规则运行,奔波的人们按自己的哲学度日。
对不同领域中的规律进行探索和描述便形成了不同的学科。
将不同学科的理论、方法、思想进行提炼,便形成了哲学、数学、统计学这样一些横断科学。
同时,我们在发现我们周围的事物没有任何一次重复是完全的“克隆”,没有任何东西会把一切细节完全重复出来。
太阳每天从东方升起,但天安门广场上与太阳同时升起的国旗其升旗时间却每天不同;冬天过去春天就要来临,但今年的春色比去年更加明媚;物体失去支撑就会坠落,但受风速、风向、地心引力等很多细小因素的影响,两个同样重的物体坠落速度和落点会有差别;“神舟五号”飞船按设计的轨迹运转,但每次经过我国领空的时间都略有差距;经济按市场规则运行,但今年的GDP比去年增长8%;奔波的人们按自己的哲学度日,但一年又一年我们的生活逐渐发生了改变。
因此,任何科学都只能预见大体上的重复现象。
行笔至此,我们是否感到统计学太重要了。
统计学就是通过差异描述规律;透过现实走向理性,走出混沌,走向秩序的学科。
“可以毫不夸大地说,现代科学的发展是在关注大数目现象的标志下进行的,很快就不会有不了解研究的随机性——统计方法的知识分支了”。
统计学简史
统计学简史统计学简史1统计是初产生于研究对国家,特别是对其经济以及人口的描述。
当时现代数学尚未形成。
因此那时的统计史基本上是经济史的范畴。
现代统计主要起源于研究总体(population),变差(variation)和简化数据(reduction of data)。
第一个经典文献属于John Graunt(1620-1674),其具有技巧的分析指出了把一些庞杂、令人糊涂的数据化简为几个说明问题的表格的价值。
他注意到在非瘟疫时期,一个大城市每年死亡数有统计规律,而且出生儿的性别比为1.08,即每生13个女孩就有14个男孩。
大城市的死亡率比农村地区要高。
在考虑了已知原因的死亡及不知死亡年龄的情况下, Graunt估计出了六岁之前儿童的死亡率,并相当合理地估计出了母亲的死亡率为1.5%。
因此,他从杂乱无章的材料中得出了重要的结论。
他还给出了一个新的生命表。
Edmond Halley(哈雷)(1656-1742)利用了Breslau的记有死亡年龄的数据,改进了Graunt的生命表并引进了死亡率的定义。
瑞士数学家Leonhard Euler(欧拉)(1717-1783)提出了平稳生命表的概念。
Joha De Witt(1625-1672)等人最早讨论退休金和人寿保险的方案。
ThomasRobert MalthuS(马尔萨斯)(1766-1834),Alfred James Lotke(1881-1949),Ronald Aylmer Fisher(费歇)(189l-l962),及William Feller(费勒)(1906-1970)等人用渐趋复杂的数学来研究生命表的理论,这对人类及其它总体的动力学描述具有显著意义。
William Petty(1623-1687)是Graunt同时代的经济学家及朋友。
他认为需要建立中央统计部来利用人口统计学的知识;由行政区利用列出记录年龄,性别,婚姻状况等细节的记录表格来收集数据;要有出生,死亡,婚姻,收入,教育和商业等方面的统计数据。
[统计学专业毕业论文参考文献]统计学参考文献
[统计学专业毕业论文参考文献]统计学参考文献统计学论文参考文献(一)[1]苏伟,聂宜民,胡晓洁,李强,张建国.农田土壤微量元素的空间变异及Kriging估值[J].华中农业大学学报.2004(02)[2]詹绍康.正确应用相关回归分析[J].劳动医学.1997(04)[3]颜艳,徐勇勇.统计思想是第一位的--教育部面向21世纪课程教材《医学统计学》评介之一[J].中国卫生统计.2001(04)[4]胡良平.医学实验中常见设计类型的辨析及统计方法的合理选用[J].中国应用生理学杂志.2000(01)[5]方积乾,凌莉,张敏瑞.近期医学论文中常见统计错误及其纠正[J].中山医科大学学报.1999(04)[6]程萍,祖述宪.临床医学论文统计方法应用的调查分析[J].安徽医科大学学报.1998(02)[7]王倩,张博恒.五种中华医学会系列杂志论着中统计方法的应用现况[J].中华医学杂志.1998(03)[8]刘勤,金丕焕主编.分类数据的统计分析及SAS编程[M].复旦大学出版社,2002[9]陈峰编着.医用多元统计分析方法[M].中国统计出版社,2000[10]孙尚拱编着.医学多变量统计与统计软件[M].北京医科大学出版社,2000[11]胡良平主编.医学统计应用错误的诊断与释疑[M].军事医学科学出版社,1999[12]毛宗福,丁元林,陈东峨,张金荣,王圣基.临床论着中统计推断应用缺陷特征及对策[J].中国卫生统计.1998(03)[13]胡良平主编.现代统计学与SAS应用[M].军事医学科学出版社,1996[14]胡良平.医学科研与新药评价等工作中一个不可忽视的问题--轻视和误用统计学[J].军事医学科学院院刊.1996(03)统计学论文参考文献(二)[2]钟晓兰,周生路,赵其国,李江涛,廖启林.长三角典型区土壤重金属有效态的协同区域化分析、空间相关分析与空间主成分分析[J].环境科学.2007(12)[3]张仁铎着.空间变异理论及应用[M].科学出版社,2005[4]张建同,孙昌言编着.以E某cel和SPSS为工具的管理统计[M].清华大学出版社,2005[5]王政权编着.地统计学及在生态学中的应用[M].科学出版社,1999[6]李小建主编.经济地理学[M].高等教育出版社,1999[7]王政权编着.地统计学及在生态学中的应用[M].科学出版社,1999[8]杜瑞成,闫秀霞主编.系统工程[M].机械工业出版社,1999[9]侯景儒等编着.实用地质统计学[M].地质出版社,1998[10]陈静生,周家义主编.中国水环境重金属研究[M].中国环境科学出版社,1992[11]国家环境保护局主持,中国环境监测总站主编.中国土壤元素背景值[M].中国环境科学出版社,1990[12]王仁铎,胡光道编.线性地质统计学[M].地质出版社,1988[13]史舟,李艳,程街亮.水稻土重金属空间分布的随机模拟和不确定评价[J].环境科学.2007(01)[14]乔胜英,蒋敬业,向武,唐俊红.武汉地区湖泊沉积物重金属的分布及潜在生态效应评价[J].长江流域资源与环境.2005(03)[15]张丽旭,任松,蔡健.东海三个倾倒区表层沉积物重金属富积特征及其潜在生态风险评价[J].海洋通报.2005(02)统计学论文参考文献(三)[1]冯克忠,万庆,励惠国.基于组件技术的GIS广义空间分析[J].地球信息科学.2003(01)[2]陈斐,杜道生.空间统计分析与GIS在区域经济分析中的应用[J].武汉大学学报(信息科学版).2002(04)[3]肖斌,赵鹏大,陈玉玲,侯景儒.时空多元协同克立格的理论研究[J].物探化探计算技术.1998(01)[4]毛政元,李霖着.空间模式的测度及其应用[M].科学出版社,2004[5]刘阳.基于地统计学的县/团区域土壤养分空间变异研究[D].新疆农业大学2006[6]杨中庆.基于R语言的空间统计分析研究与应用[D].暨南大学2006[7]杨红芳.基于合理城市空间模式的杭州适度人口规模研究[D].浙江大学2007[8]冯锦霞.基于GIS与地统计学的土壤重金属元素空间变异分析[D].中南大学2007[9]陈述彭主编.地学信息图谱探索研究[M].商务印书馆,2001[10]刘昌明,岳天祥,周成虎主编,朱海燕,刘卓澄责任编辑.地理学的数学模型与应用[M].科学出版社,2000[11]王政权编着.地统计学及在生态学中的应用[M].科学出版社,1999[12]李小建主编.经济地理学[M].高等教育出版社,1999[13]侯景儒等编着.实用地质统计学[M].地质出版社,1998[14]郭仁忠着.空间分析[M].武汉测绘科技大学出版社,1997[15]徐建华编着.现代地理学中的数学方法[M].高等教育出版社,1996。
金融学、经济学研究生和博士必读书目和经典文献
金融学研究生必读书目和经典文献一、经济学理论推荐阅读书目1. 萨缪尔森:《经济学》(第十八版),中国邮电出版社,2006年。
2. 曼昆:《经济学原理》,北京大学出版社,上海三联出版社,1999年。
《宏观经济学》,上海财经大学出版社。
3. 马克思:《资本论》,人民出版社,2004年。
4.斯蒂格利茨:《经济学》(第四版),中国人民大学出版社。
5. 杨小凯:《发展经济学——超边际与边际分析》,社会科学文献出版社,2006年。
《经济学-新古典与新古典框架》,社会科学文献出版社; 第1版(2003年) 6.罗默:《高级宏观经济学》,上海财经大学出版社7.范里安:《微观经济学-现代观点》,(第七版),格致出版社8.平狄克:《微观经济学》(第七版),人大出版社9. 杨奎斯特:《递归宏观经济理论》,人大出版社10. 伍德福德:《利息与价格——货币政策理论基础》,人大出版社11. 巴罗:《经济增长》,第二版,格致出版社; (2010年11月1日)12. 菲利普·阿吉翁:《内生增长理论》,北京大学出版社13. 蒋中一:《数理经济学的基本方法》,北京大学出版社14. 肖红叶:《高级微观经济学》,中国金融出版社,2003年。
15. 龚六堂:《高级宏观经济学》,武汉大学出版社,2005年。
16. 亚当·斯密:《国民财富的性质与原因的研究》,商务印书馆,2004年。
17. 瑟尔沃:《增长与发展》,中国财政经济出版社,2001年。
18. 埃克伦德,赫伯特:《经济理论与方法史》,中国人民大学出版社,1996年。
19. 薛求知:《行为经济学》,复旦大学出版社,2003年。
20.速水佑次郎、神门善久:《发展经济学——从贫困走向富裕》,社会科学文献出版社,2008年。
21、(英)安格斯·麦迪森(Angus Maddison),《世界经济千年史》,北京大学出版社。
22.凯恩斯:《就业、利息与货币通论》,商务印书馆,2004年。
高校人才培养模式的探索——以统计学为例
心科教论坛科技风2021年5月DOU10.19392/ki.1671-7341.202114011高校人才培养模式的探索——以统计学为例孙一月武警工程大学陕西西安710086摘要:计算机和信息技术的发展将社会推到了一个全新数据时代,整个社会都在进行产业重塑。
各高校立足本校定位根据社会需求和政策引导相继改革和创新人才培养模式,取得了一些成绩。
本文首先探讨新工科背景下人才培养模式的內涵,其次以统计学为例探讨统计学人才培养现状以及出现的问题,最后给出人才培养模式创新的着力点和路径方向,力图为高校统计学人才培养和高等教育发展提供服务。
关键词:统计学;人才培养模式一、新工科背景下人才培养模式的内涵“人才培养模式”是院校基于办学定位和培养目标,为学生构建知识、能力、素质的培养框架并进行实施的方法或手段,是随着教育理念和培养目标的转变而不断变化的。
改革开放以来我国高校人才培养由精英教育向大众教育转变,为经济的高速发展提供了强有力的人才保障。
随着社会发展和综合国力的提升,国家为应对新一轮科技革命和产业革命提岀了一个全新的概念一一新工科,要求高校加快升级传统专业设置,积极布局未来战略领域人才培养。
为此,下面将以统计学为例,着重研究统计学人才培养模式的发展现状和面临的挑战,并给岀人才培养模式改革的切入点和路径二、统计学人才培养发展现状(一)统计学人才培养发展历程统计学作为注重解决实际问题的社会科学,其培养目标和培养模式随着社会发展一直在转变和创新。
在计划经济阶段,统计学科主要为计划经济的编制、执行与监督培养统计专业人才1978年,国家统计局召开“峨眉会议”,明确社会经济统计学是方法论学科。
大数据信息时代又为统计学发展带来了新的机遇。
以往很多未开设统计学专业的各高校相继开设统计学专业。
已开设统计学专业的部分高校开始尝试校际合作、校企合作,争取社会资源培养学生的实践能力;试行学科交叉培养,或者专业设置上倾向于以数据为导向、以实践为重点的培育模式。
医学统计论文15篇(医学科技论文统计学误用分析)
医学统计论文15篇医学科技论文统计学误用分析医学统计论文摘要:医学统计学是医学与统计学的交叉学科,是一门运用统计学的原理和方法,研究医学中有关数据的收集、整理和分析的应用科学[1]。
随着现代医疗信息化,大量的医疗数据及生命现象,均需要借助统计学和计算机去探寻规律。
因此,医学统计学在医疗大数据和循证医学中发挥着越来越重要的作用。
为了应对大数据时代的挑战,医学各专业学生都应培养统计学思维,掌握一些统计学方法及应用技能。
关键词医学统计统计论文统计医学统计论文:医学科技论文统计学误用分析1统计学应用中存在的常见问题1.1单因素方差分析(ANOVA)两两比较误用独立样本t检验单因素方差分析设计3组以上的均数比较,如果总体比较有差异,需进行两两比较,一般用SNK法或LSD法。
但部分研究者却将资料进行拆分,应用独立样本t检验进行两两比较,导致第Ⅰ类统计学错误发生率(假阳性率)增加,从而掉进了一个常见的“统计陷阱”,使所得结论可信度大大降低甚至得出错误结论。
SNK法与LSD法虽然并非等价,实质是一致的。
SNK法一般用于经方差分析结果具有统计学意义时才决定进行的两两事后比较,而LSD法可用于方差分析不足以具有统计学意义时也能进行两两比较[1]。
比较两种方法在SPSS的输出结果形式,SNK是“分堆”比较,一目了然,对于组别数较多的研究更为好用,但没有具体P值,而LSD是在进行“两两”比较时,能给出具体的P值。
1.2两两比较时检验水准的重新调定χ2检验或秩和检验3组以上整体比较有差异时,需应用分割法进行两两比较,这时检验水准应由原0.05调定为0.0167,否则会增加第Ⅰ类统计学错误的发生率。
特别当P值处于0.0167~0.05时,按照P<0.0167的标准,差异无统计学意义,而按照P<0.05的标准,却有意义,与事实相悖,出现假阳性,很容易得出错误结论。
这种分割法有时很保守,当行列表资料分组多且为有序时可用Mantel-Haenszel卡方检验,也称线性趋势检验(testforlineartrend)或定序检验(Linear-by-Lineartest)[2]。
统计学简史(吴喜之)
统计学简史H.O.Lancaster中国人民大学统计学系吴喜之译l.起源,分布统计是初产生于研究对国家,特别是对其经济以及人口的描述。
当时现代数学尚未形成。
因此那时的统计史基本上是经济史的范畴。
现代统计主要起源于研究总体(population),变差(variation)和简化数据(reduction of data)。
第一个经典文献属于John Graunt(1620-1674),其具有技巧的分析指出了把一些庞杂、令人糊涂的数据化简为几个说明问题的表格的价值。
他注意到在非瘟疫时期,一个大城市每年死亡数有统计规律,而且出生儿的性别比为1.08,即每生13个女孩就有14个男孩。
大城市的死亡率比农村地区要高。
在考虑了已知原因的死亡及不知死亡年龄的情况下,Graunt估计出了六岁之前儿童的死亡率,并相当合理地估计出了母亲的死亡率为1.5%。
因此,他从杂乱无章的材料中得出了重要的结论。
他还给出了一个新的生命表。
Edmond Helley(哈雷)(1656-1742)利用了Breslau的记有死亡年龄的数据,改进了Graunt的生命表并引进了死亡率的定义。
瑞士数学家 Leonhard Euler(欧拉)(1707-1783)提出了平稳生命表的概念。
John DeWitt(625-1672)等人最早讨论退休金和人寿保险的方案。
Thomas Robert Malthus(马尔萨斯)(1766-1834),Alfred James lotke(1880-1949),Ronald Aylmer Fisher (费歇)(1890-1962),及 William Feller(费尔勒)(1906-1970)等人用渐趋复杂的数学来研究生命表的理论,这对人类及其它总体的动方学描述具有显著意义。
William Petty(1623-1687)是Graunt同时代的经济学家及朋友。
他认为需要建立中央统计部来利用人口统计学的知识;由行政区利用列出记录年龄,性别,婚姻状况等细节的记录表格来收集数据;要有出生,死亡,婚姻,收入,教育和商业等方面的统计数据。
统计学相关文献
统计学相关文献统计学在科学研究中扮演着重要的角色,它通过收集、整理和分析数据来揭示现象和规律。
本文将介绍一些与统计学相关的经典文献,这些文献涵盖了统计学的基本概念、方法和应用。
一、《统计学导论》《统计学导论》是一本经典的统计学教材,由美国统计学家蒙哥马利(George Cobb)和麦考利(David S. Moore)合著。
该教材以简洁清晰的语言介绍了统计学的基本概念和原理,包括数据的收集、整理和分析方法,以及统计推断和假设检验等内容。
本书适合初学者阅读,能够帮助读者快速理解统计学的核心概念。
二、《统计学习方法》《统计学习方法》是一本由李航教授编著的机器学习经典教材。
该书详细介绍了统计学习的基本原理和常用方法,包括线性回归、逻辑回归、支持向量机和决策树等。
通过对大量实例的分析和讨论,读者可以掌握如何利用统计学方法进行模式识别和预测分析。
这本书在机器学习领域具有很高的影响力,被广泛用于大学教育和科研工作中。
三、《统计学的目标》《统计学的目标》是统计学家乔治·E·佐格(George E. P. Box)于1978年撰写的重要论文。
这篇论文探讨了统计学的目标和应用,强调了统计学在科学研究中的重要性。
佐格指出,统计学的目标是通过数据分析来推断和预测现象,为决策提供科学依据。
他提出了统计学中的一些基本原则,如模型建立、实验设计和模型诊断等,这些原则对于统计学家和研究人员具有重要的指导意义。
四、《统计学的历史》《统计学的历史》是由英国统计学家戴维·S·摩尔(David S. Moore)编著的一本专著。
该书详细介绍了统计学的发展历程和重要人物,从古代的数据收集方法到现代的统计学理论,全面梳理了统计学的演变过程。
摩尔通过对历史事件和案例的分析,展示了统计学在各个领域的应用和影响,使读者更好地理解统计学的发展脉络和应用前景。
五、《统计学方法与应用》《统计学方法与应用》是由韦斯特夫人(Janet A. Kern)和霍尔顿教授(Barbara Illowsky)合著的一本应用统计学教材。
统计学文献综述范文3000字
统计学文献综述范文3000字1.面对的机遇(1)进一步明确和强化社会经济统计学的学科地位。
社会经济统计学体系的构建,从根本上确立了一级学科的地位,并且在日后不断深化完善过程中多发挥的作用也会越来越大。
作为一门一级学科,社会经济统计学是有着广泛的数据和现实依据,在我国传统的教育内容中早已经存在,只是由于其相关的知识涵盖范围被社会经济学所包含,导致没有成为一门一级学科,具体的研究内容也仅限于表面肤浅的研究,对实际的经济发展促进作用不是很明显。
如今成为了一级学科后,社会统学的发展得到了很大程度上的促进,使得研究内容更加丰富,对经济活动中的数据统计的结果所起到的作用也是与日俱增,为其发展奠定了现实基础。
(2)彰显社会统计学的学科特色。
由于社会经济统计学成为了一门一级学科,其相关的研究目标得到了具体的确定,相应的学科特色也得到了彰显。
社会经济统计学的研究主要是社会经济活动中的相应数据和指标,通过统计学的处理来为实际工作提供参考和指导,保证经济发展处在一个健康有序的轨道中,推动整体经济发展具有重要的现实意义。
2.遇到的挑战(1)学科类别有待确定。
社会经济统计学所属于的学科范畴目前还没有形成一致的观点,有些学者认为其研究的对象是社会经济,那么理应属于经济学范畴,但是反方面的观点是统计学基础主要是运用统计原理进行分析,应该划归理学。
相关的争议导致学科内容和相关联系还没有明确确定,成为了学科发展所遇到的挑战之一。
(2)课程机构问题。
由于还未明确划分所属范围,导致学科内容容易出现重理轻经济的现象,理科课程占据了主体,而对经济的研究停留在浅显的层次,课程结构出现偏差,导致学生对发展方向出现了一定程度的迷茫。
三、社会经济统计学遵循的原则分析1.遵循历史发展轨迹统计学最开始的发展是以统计人口、财产、土地等数据发展而来的一门专业学科,其相应的历史发展轨迹是统计学发展的主线,也是学科研究和发展的重要指向,社会经济统计学在成为了一级学科之后,虽然研究的内容和运用的知识及方法较最初出现了一定程度的不同,但是却不妨碍社会经济统计学的发展所需要遵循的历史轨迹,其出现的差异只是时代发展的体现,并不能成为偏离发展轨迹的依据。
统计学经典教材-推荐下载
一、统计学基础部分1、《统计学》 David Freedman等著,魏宗舒,施锡铨等译中国统计出版社据说是统计思想讲得最好的一本书,读了部分章节,受益很多。
整本书几乎没有公式,但是讲到了统计思想的精髓。
2、《Mind on statistics(英文版)》机械工业出版社只需要高中的数学水平,统计的扫盲书。
有一句话影响很深:Mathematics as to statistics is somethinglike hammer, nails, wood as to a house, it's just the material andtools but not the house itself。
3、《Mathematical Statistics and Data Analysis(英文版.第二版)》机械工业出版社看了就发现和国内的数理统计树有明显的不同。
这本书理念很好,讲了很多新的东西,把很热门的Bootstrap方法和传统统计在一起讲了。
Amazon上有书评。
4、《Business Statistics a decision making approach(影印版)》中国统计出版社在实务中很实用的东西,虽然往往为数理统计的老师所不屑5、《Understanding Statistics in the behavioral science(影印版)》中国统计出版社和上面那本是一个系列的。
老外的书都挺有意思的6、《探索性数据分析》中国统计出版社和第一本是一个系列的。
大家好好看看陈希儒老先生做的序,可以说是对中国数理统计的一种反思。
二、回归部分1、《应用线性回归》中国统计出版社还是著名的蓝皮书系列,有一定的深度,道理讲得挺透的。
看看里面对于偏回归系数的说明,绝对是大开眼界啊!非常精彩的书2、《Regression Analysis by example (3rd Ed影印版)》这是偶第一本从头到底读完的原版统计书,太好看了。
统计学专业相关的文献
统计学专业相关的文献以下是一些统计学专业相关的经典文献:1. "The Design of Experiments" by Ronald A. Fisher: 这本书是关于实验设计和统计推断的经典之作,探讨了如何设计实验和如何分析实验结果。
2. "Statistical Methods for Research Workers" by Ronald A. Fisher: 这本书是Fisher的另一部重要著作,介绍了一些基本的统计方法,包括显著性检验和方差分析。
3. "Probability Theory: The Logic of Science" by E. T. Jaynes: 这本书讨论了概率理论和统计推断的逻辑基础,强调了概率作为一种逻辑思维工具的应用。
4. "The Elements of Statistical Learning" by Trevor Hastie, Robert Tibshirani, and Jerome Friedman: 这本书介绍了统计学习的基本概念和方法,包括回归分析、分类分析和聚类分析等。
5. "Bayesian Data Analysis" by Andrew Gelman, John B. Carlin, Hal S. Stern, David B. Dunson, Aki Vehtari, and Donald B. Rubin: 这本书介绍了贝叶斯统计学的基本原理和实际应用,包括贝叶斯推断和模型选择等重要内容。
6. "Causal Inference in Statistics: A Primer" by Judea Pearl, Madelyn Glymour, and Nicholas P. Jewell: 这本书讨论了因果推断在统计学中的重要性和应用,介绍了一些因果推断的基本原理和方法。
统计学专业毕业论文发表范文(2)
统计学专业毕业论文发表范文(2)统计学论文发表范文篇3浅谈统计学对地质工作的重要作用摘要:随着我国经济水平和科技水平不断的提高,地质工作的发展越来越受到社会的关注,为了做好地质工作,相关人员在其中应用了统计学,并取得了显著的效果。
关键词:统计学;地质工作;重要作用;研究近些年来,我国对地质工作的重视程度不断提高,投入的资金力度也有所增加,在国家的大力支持下,地质工作取得了一定的进展,但和发达国家相比较,还存在一些问题。
此种情况导致我国地质工作的发展受到阻碍,为了解决其中存在的问题,工作人员将统计学相关知识和地质工作结合在一起,通过有效的应用此方面的知识,推动了我国地质工作的发展。
一、地质统计学的概念地质统计学是在1962年由法国的著名学者G.马特隆教授提出的,此统计学的基础是区域变化量,是在使用变异函数的情况下对随机性以及空间性等为一体的自然现象进行热分析的一门科学。
只要是和空间数据所具有的随机性以及结构性,或者是依赖性等有关系的研究,或者是使用无偏内插的方式来对数据进行估计,再或者是对数据所具有的波动性等进行模拟,都可以使用地质统计学理论[1]。
二、地质统计和经典统计两者之间差异地质统计和经典统计两者之间是存在差异的,具体表现在以下几个方面:第一,经典统计在对地质变量进行深入研究的时候,并没将样品所具有的空间分布特性考虑在内,要知道,即使地质变量的均值以及方差是一样的,若是其样品的分布位置不同,则其地质变量的稳定性也会是不相同的;第二,经典统计学的研究对象是随机抽取出来的,所以这些对象都是按照一定概率来进行分布的,而地质统计则不同,在地质统计下的地质变量是集结构性以及随机性为一体的;第三,经典统计对变量的原则可以进行无数次的实验,并且每次实验的结果可能都存在差异,而地质变量则做不到这一点;第四,经典统计学对抽样的要求是独立进行,而地质变量则并没有这一方面的要求,反而是要求抽样之间具有空间相关性[2]。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Estimation in Two Classes of Semiparametric Diffusion Models两类半参数扩散模型的估计In this paper we propose an estimation method for two classes of semiparametric scalar diffusion models driven by a Brownian motion: In the first class, only the diffusion term is parameterised while the drift is unspecified; in the second, the drift term is specifified while the diffffusion is of unknown form. The estimation method is based on the assumption of stationarity of the observed process. This allows us to express the unspecified term as a functional of the parameteric part and the stationary density. A MLE-like estimator for the parametric part and a kernel estimator of the nonparametric part are defined for a discrete sample with a fixed time distance between the observations. We show that the parametric part of the estimator is n consistent while the nonparametric part has a slower convergence rate. Also, the asymptotic distribution of the estimator is derived. To illustrate the usefulness of these two classes, we fit a specific model from the first class to a proxy of the Eurodollar short-term interest rate. We find non-linearities in both the drift and diffusion function that standard parametric models are unable to capture.本文提出了两类半参数标量的估计方法由布朗运动驱动的扩散模型:在第一类中,只有扩散项参数化,而漂移是未指定的;在第二种情况下,漂移项被指定,而扩散项形式未知。
估计方法是基于的假设观测过程的平稳性。
这允许我们将未指定项表示为参数部分的函数和稳态密度。
对于有固定观测时间距离的离散样本,定义了参数部分的极大似然估计量和非参数部分的核估计量。
我们证明了参数部分估计量是n一致的,而非参数部分收敛速度较慢。
同时,给出了估计量的渐近分布。
为了说明这两个类的有用性,我们将第一个类拟合一个特定模型与欧洲美元短期利率的代表相匹配。
我们发现,漂移和扩散函数的非线性标准参数模型无法捕获。
Statistical estimation in variable coefficient models变系数模型的统计估计Varying coefficient models are a useful extension of classical linear models. They arise naturally when one wishes to examine how regression coefficients change over different groups characterized by certain covariates such as age. The appeal of these models is that the coefficient functions can easily be estimated via a simple local regression. This yields a simple one-step estimation procedure. We show that such a one-step method cannot be optimal when different coefficient functions admit different degrees of smoothness. This drawback can be repaired by using our proposed two-step estimation procedure. The asymptotic mean-squared error for the two-step procedure is obtained and is shown to achieve the optimal rate of convergence. A few simulation studies show that the gain by the two-step procedure can be quite substantial. The methodology is illustrated by an application to an environmental data set.变系数模型是经典线性模型的一个有用的推广模型。
当一个人想要研究回归系数在不同的群体中是如何变化的,并以特定的协变量(如年龄)为特征时,回归系数就会自然地出现。
这些模型的优点是通过简单的局部回归就可以很容易地估计出系数函数。
这产生了一个简单的一步估计过程。
我们证明,当不同的系数函数有不同的平滑度时,这种一步法不可能是最优的。
这个缺陷可以通过使用我们提出的两步估计过程来修复,得到了两步法的渐近均方误差,并证明了其收敛速度是最优的。
一些仿真研究表明,两步法实现的程序可能相当复杂。
该方法通过应用于环境数据集进行了说明。
Analysis of Longitudinal Data With Semiparametric Estimation ofCovariance Function半参数纵向数据分析协方差函数的估计Improving efficiency for regression coefficients and predicting trajectories of individuals are two important aspects in the analysis of longitudinal data. Both involve estimation of the covariance function. Yet challenges arise in estimating the covariance function of longitudinal data collected at irregular time points. A class of semiparametric models for the covariance function by that imposes a parametric correlation structure while allowing a nonparametric variance function is proposed.A kernel estimator for estimating the nonparametric variance function is developed. Two methods for estimating parameters in the correlation structure-a quasi-likelihood approach and a minimum generalized variance method-are proposed. A semiparametric varying coefficient partially linear model for longitudinal data is introduced, and an estimation procedure for model coefficients using a profile weighted least squares approach is proposed. Sampling properties of the proposed estimation procedures are studied, and asymptotic normality of the resulting estimators is established. Finite-sample performance of the proposed procedures is assessed by Monte Carlo simulation studies.The proposed methodology is illustrated with an analysis of a real data example.提高/改进回归系数的效率和预测个体轨迹是纵向数据分析的两个重要方面。
两者都涉及到协方差函数的估计。
然而,在估计不规则时间点收集的纵向数据协方差函数时出现了挑战。
提出了一类协方差函数的半参数模型,该模型在允许通过强加一个参数关联结构到非参数方差函数。
提出了一种估计非参数方差函数的核估计量。
关联结构中参数的估计有两种方法,拟似然法和最小广义方差法。
介绍了一种纵向数据半参变系数部分线性模型,及一种基于剖面加权最小二乘法的模型系数估计方法。
研究了估计过程的抽样性质,建立了估计量的渐近正态性。
通过蒙特卡罗模拟对所提方法的有限样本性能进行了评估,并以一个实际数据案例分析,对提出的方法予以说明。