定量变量的分级方法对logistic模型影响的研究_周凌峰

合集下载

第8章:Logistic回归分析

第8章:Logistic回归分析

3、Logistic 回归模型的参数估计 对 Logistic 回归模型的参数估计可以采用极大似然法或者迭 代法。 极大似然法的基本思想是先建立似然函数,然后求使得似然 函数达到最大的参数估计值。 对于已有样本,可建立样本的似然函数为:
L piyi (1 pi )1 yi
i 1 n
样本的对数似然函数为:
ln L [ yi ln pi (1 yi ) ln(1 pi )]
n
将 pi 代入得:
i 1
ln L [ yi ( 0 1 xi1 2 xi 2 k xik )
i 1
n
ln(1 exp(0 1xi1 2 xi 2 k xik ))]
根据极大似然原理,对 lnL 求一阶导数并令其为0,再用 Newton-Raphson 迭代方法求解,得到参数估计值及其标准误。
4、 Logistic 回归的评价及统计检验 ⑴对于整体模型的检验 logistic回归方程求解参数是采用极大似然估计方法,因此 其回归方程的整体检验通过似然函数值( Likelihood )。 所谓似然函数值表达的是一种概率,即在假设拟合模型为真 实情况时能够观察到这一特定样本数据的概率,因此这个函数 值处于[0,1]之间。
e pi 1 e 0 1x1 2 x2 k xk e 0 1x1 2 x2 k xk 1 pi 1 1 e 0 1x1 2 x2 k xk
其中:pi 表示第 i 个观测中事件发生的概率,1-pi 表示第 i 个观 测中事件不发生的概率。
Logistic 回归分析根据因变量取值类别不同,又可以分为二 元 Logistic 回归分析和多元 Logistic 回归分析。

一种基于连续区间直觉模糊Theil测度的多属性群决策方法

一种基于连续区间直觉模糊Theil测度的多属性群决策方法

一种基于连续区间直觉模糊Theil测度的多属性群决策方法罗敏;张志;周晗;吴群;陶志富
【期刊名称】《重庆工商大学学报(自然科学版)》
【年(卷),期】2017(034)003
【摘要】针对区间直觉模糊信息的不确定性,提出了一种基于连续区间直觉模糊Theil(C-IVIFT)测度的多属性群决策方法.首先基于连续区间直觉模糊有序加权平均(C-IVIFOWA)算子定义了连续区间直觉模糊Theil测度,并研究该测度的一些性质;其次,构建以C-IVIFT测度偏差最小化为目标的最优化模型用以确定专家权重和属性权重,进而得到不同方案的综合属性值,并利用相似性函数和精确函数对方案进行排序;最后,通过ERP软件择优实例说明提出的决策方法的合理性和有效性.
【总页数】9页(P56-64)
【作者】罗敏;张志;周晗;吴群;陶志富
【作者单位】安徽大学经济学院,合肥,230601;安徽大学经济学院,合肥,230601;安徽大学数学科学学院,合肥230601;安徽大学数学科学学院,合肥230601;安徽大学经济学院,合肥,230601
【正文语种】中文
【中图分类】C934
【相关文献】
1.基于连续直觉模糊相似测度的多属性群决策方法 [J], 罗敏;周晗;陶志富;吴澎;曹博学
2.一种基于新的区间二型梯形模糊相似测度的多属性群决策方法 [J], 王凤;平轶男;周礼刚;陈华友
3.基于TOPSIS的区间直觉模糊集多属性群决策方法研究综述 [J], 李敏; 苏变萍; 张强强
4.基于知识测度的区间直觉模糊多属性群决策方法 [J], 郭凯红; 程锦云; 牟有静
5.基于熵权的区间梯形直觉模糊数型VIKOR多属性群决策方法 [J], 杜康; 袁宏俊因版权原因,仅展示原文概要,查看原文内容请购买。

多分类有序反应变量Logistic回归及其应用

多分类有序反应变量Logistic回归及其应用

3、社会心理因素:老年人的心理状态、生活环境、生活习惯等也会对其睡 眠质量产生影响。例如,孤独、抑郁、生活压力等心理问题可能导致睡眠障碍。
有序多分类Logistic回归分析
为了探讨上述因素对老年人睡眠质量的影响,我们采用有序多分类Logistic 回归分析方法进行建模和分析。有序多分类Logistic回归是一种统计方法,它能 够根据有序类别变量的取值来估计多个类别的影响因素,并计算各因素的影响方 向和作用大小。
还应注意其他潜在影响因素的作用,以便更好地预防和改善公务员的亚健康 状况。
谢谢观看
பைடு நூலகம்
(2)数据拟合:将数据带入Logistic回归模型,用最大似然估计法对模型 参数进行估计。
(3)模型评估:通过交叉验证、准确率、AUC值等指标对模型进行评估,判 断其预测性能。
(4)模型优化:根据模型评估结果,对模型进行优化调整,包括特征选择、 参数调整等。
3、结果解读
多分类有序反应变量Logistic回归的结果解读包括以下几个方面:
影响因素
老年人睡眠质量受到多种因素的影响,包括身体健康状况、药物使用、社会 心理因素等。
1、身体健康状况:老年人往往存在各种健康问题,如慢性疾病、疼痛、呼 吸困难等,这些疾病会直接或间接影响睡眠质量。
2、药物使用:部分老年人在日常生活中需要使用药物来控制血压、治疗疼 痛等。然而,某些药物可能导致不良反应,从而影响睡眠质量。
1、因变量的处理:将亚健康状况分为5个等级(非常健康、健康、轻微不健 康、不健康、非常不健康),并将其作为有序分类变量进行统计处理。
2、自变量的选择:选择工作压力、生活方式、心理状况等作为自变量,并 将其进行标准化处理,以便进行比较和分析。
3、模型的建立:采用有序多分类logistic回归分析方法,建立模型并拟合 数据。通过模型的结果,可以观察各个自变量对因变量的影响程度及比较各个自 变量之间的相对重要性。

喷墨印花纹理图像的期望最大化聚类分割算法

喷墨印花纹理图像的期望最大化聚类分割算法

喷墨印花纹理图像的期望最大化聚类分割算法周佳男;冯志林;朱向军【摘要】Aiming at the limitation for ink-jet printing images of clustering segmentation algorithm,a new image segmentation algorithm based on clustering technology combined with expectation-maximization was proposed.Firstly,the proposed segmentation algorithm was featured by incorporating spatial correlations,and the autoregressive model was applied to generate primitive homogeneous texture regions.Secondly,in order to improve the precision of parameter estimation for the segmentation model,a block-labeling mechanism was further introduced into the expectation-maximization algorithm,which can solve the maximum likelihood parameter estimation and deal with the parameter estimation of incomplete data.Finally,the image data sets were divided into some pieces of data block and went through clustering to make similar elements have a high similarity.After block clustering,pixels in the texture image were classified division for the following task of incorporating received result to achieve the correct segmentation of the target texture image.Experimental results show that,the proposed algorithm can provide a significant improvement over other common clustering segmentation methods to solve the ink-jet printing image segmentation problem.%针对聚类分割算法对喷墨印花纹理图像存在的局限性,提出了一种结合期望最大化(EM)的喷墨印花纹理图像聚类分割算法(CSA).首先,将空间相关性引入聚类分割中,利用自回归模型表征纹理同质区域;然后,为了提高分割模型参数估计的精度,将分块标定机制引入期望最大化算法中,实现了参数极大似然估计的迭代算法,解决了不完全数据参数估计问题;最后,利用数据集分块并进行聚类,使同类元素具有较高的相似度,从而对图像中的像素进行了归类划分,并将得到的结果进行了合并,实现了目标图像的正确分割.实验结果表明,和传统的聚类分割算法相比,该算法能更好地解决喷墨印花纹理图像的分割问题.【期刊名称】《机电工程》【年(卷),期】2013(030)008【总页数】4页(P1029-1032)【关键词】喷墨印花纹理;期望最大化;聚类分割算法【作者】周佳男;冯志林;朱向军【作者单位】浙江商业职业技术学院信息技术学院,浙江杭州310053;浙江工业大学之江学院,浙江杭州310024;浙江工业大学之江学院,浙江杭州310024【正文语种】中文【中图分类】TP317.40 引言喷墨印花纹理是一种细致型纹理,特点是微小、稠密,其纹理图像的灰度级相对较集中。

logit回归 控制变量

logit回归 控制变量

logit回归控制变量
在logistic回归中,控制变量是指在分析中被用来控制其他变量对因变量影响的变量。

控制变量的作用是排除其他可能对因变量产生影响的因素,以更准确地评估感兴趣的自变量对因变量的影响。

在logistic回归中,通常使用以下步骤来引入和控制变量:
识别潜在的控制变量:在进行logistic回归之前,通过理论或实证研究,识别可能对因变量产生影响的其他变量。

数据收集:确保收集了所有可能的控制变量和主要研究变量的数据。

这可能需要考虑潜在的混杂变量,以确保你在模型中进行了适当的控制。

建立模型:设计logistic回归模型时,将主要研究变量(自变量)添加到模型中。

然后,逐步引入控制变量,确保在模型中控制其他可能的影响因素。

解释结果:在模型中加入控制变量后,重新评估主要研究变量的系数。

这有助于确定控制变量是否影响主要研究变量与因变量之间的关系。

检验共线性:在引入多个控制变量时,需要注意共线性问题。

共线性可能导致模型不稳定,因此需要进行适当的检验和调整。

报告结果:在结果报告中,明确说明使用的控制变量,并提供它们的系数和统计显著性。

这有助于其他研究者理解你的研究设计和分析过程。

通过控制变量,logistic回归能够更精确地评估主要自变量对因变量的影响,提高模型的可解释性和泛化性。

1。

大步长路径跟踪内点新算法

大步长路径跟踪内点新算法

大步长路径跟踪内点新算法周广付;姚奕荣;王筱莉【期刊名称】《上海大学学报(自然科学版)》【年(卷),期】2011(017)005【摘要】An interior point algorithm based on large-step path following for solving constrained nonlinear programming problem is presented. To overcome the difficulty of initialization in the interior point method, an equivalent problem that incorporates an auxiliary variable is introduced. An inequality is constructed to proof the global convergence. Based on the work done before, a large-step path-following interior point algorithm is established. The proposed algorithm only requires a finite number of iterations to reach a near-optimal solution. Numerical tests are given to show feasibility of the algorithm.%给出一种求解约束非线性规划问题的大步长路径跟踪内点新算法.首先,为克服内点法初始点选取的困难,通过引入辅助变量来构造原问题的等价问题;其次,构造一个新的关系不等式来证明算法的全局收敛性;最后,在此基础上设计一个新的大步长路径跟踪内点算法.该算法在有限步内能得到原问题的近似最优解,并且数值试验表明,该算法是可行的.【总页数】6页(P614-619)【作者】周广付;姚奕荣;王筱莉【作者单位】上海大学理学院,上海200444;上海大学理学院,上海200444;上海大学理学院,上海200444【正文语种】中文【中图分类】O221.2【相关文献】1.下限极限分析的子迭代路径跟踪内点算法 [J], 钱向东;吴有奇;林荔珊2.凸二次规划基于新的核函数的大步校正原始-对偶内点算法 [J], 汪燕;张明望3.单调线性互补问题基于新的核函数的大步校正内点算法 [J], 龙冰;张明望4.基于一类新方向的宽邻域路径跟踪内点算法 [J], 刘长河;尚有林;李锦睿5.P_*(κ)线性互补问题基于一类新核函数的大步校正内点算法(英文) [J], 陈月姣;张明望因版权原因,仅展示原文概要,查看原文内容请购买。

Logistic回归分析

Logistic回归分析

对于模型(10-115),采用最大似然估计法(Maximum likelihood estimation,MLE)进行估 计,它与用于估计一般线性回归模型参数的普通最小二乘法(OLS)形成对比。OLS 通过使 得样本观测数据的残差平方和最小来选择参数,而最大似然估计法通过最大化对数似然值 (log likelihood)估计参数。最大似然估计法是一种迭代算法,它以一个预测估计值作为参数 的初始值,根据算法确定能增大对数似然值的参数的方向和变动。估计了该初始函数后,对 残差进行检验并用改进的函数进行重新估计,直到收敛为止(即对数似然不再显著变化) 。 [例 10-1]设有住房及收入情况的统计资料如表 10-55所示。 表 10-55 住房及收入数据

② ③
特别指出,本章介绍的 Logistic 回归,应与第八章的 Logistic 曲线模型(即 S 或倒 S 形曲线)相区别。 与第八章的符号表示不同,本章中 p 表示事件发生的概率,而用 k 表示自变量个数。 (11-1)是一个线性概率模型,可用 WLS 进行估计,但仍存在许多问题。
186
《实用现代统计分析方法与 SPSS 应用》初稿/2000 年/张文璋
0 1 1
k k
0
1
1
k
k
表 10-54 p 和 logit(p)之间的关系(一部分)
p
Logit(p)
0.3 -0.847
0.4 -0.405
0.5 0.0
0.6 0.405
0.7 0.847
0.8 1.386
0.9 2.197
0.95 2.944
0.99 4.595
第二节
Logistic 回归模型的估计与检验
住房 Y

宫颈糜烂影响因素的多分类Logistic回归分析

宫颈糜烂影响因素的多分类Logistic回归分析

宫颈糜烂影响因素的多分类Logistic回归分析
杨铮;万崇华;张云飞;袁萍
【期刊名称】《中国预防医学杂志》
【年(卷),期】2004(5)5
【摘要】目的分析宫颈糜烂的影响因素。

方法采用整群抽样调查搜集资料 ,采用多分类回归分析筛选影响因素。

结果宫颈糜烂Ⅰ度、Ⅱ度和Ⅲ度的患病率分别为 3 3 69%、 19 74%和 7 5 8% ,其影响因素为年龄、初潮年龄、是否怀过孕、
经期下水田、洗澡频率5个因素。

结论为了有效预防宫颈糜烂,应尽量避免早婚、多孕和人工流产 ,并养成良好的个人卫生习惯。

【总页数】3页(P340-342)
【关键词】宫颈糜烂;Logistic回归分析;影响因素;初潮年龄;经期;患病率;人工流产;搜集资料;结论;养成
【作者】杨铮;万崇华;张云飞;袁萍
【作者单位】昆明医学院公共卫生学院;澄江县妇幼保健院
【正文语种】中文
【中图分类】R711;R169.42
【相关文献】
1.民宿众筹成效的影响因素分析——基于有序多分类Logistic回归分析 [J], 皮常玲;殷杰
2.泸州市女性围绝经期综合征影响因素的无序多分类logistic回归分析 [J], 唐兰
兰; 李卉; 杨超; 魏道芳; 张容; 叶运莉; 张俊辉
3.图书馆众筹绩效影响因素的实证分析——基于有序多分类Logistic回归分析 [J], 郭韫丽; 尹小莉
4.老年人睡眠质量影响因素的有序多分类Logistic回归分析 [J], 付利婷;门瑞雪;范志光;郑闪闪;安倩倩
5.基于中医文化家庭养老倾向影响因素的有序多分类Logistic回归分析 [J], 谷兰凌;汪晓凡;游江南
因版权原因,仅展示原文概要,查看原文内容请购买。

定量和定类

定量和定类

定量和定类
定量和定类是数据分析和统计检验中的两种主要方法,它们在数据类型和研究方法上存在一些区别。

定量数据是可以被量化或者测量的变量,其值通常以数字形式表示。

在统计学、社会科学和自然科学等领域中,定量变量是数值化的,可以进行数学计算和分析。

例如,如果收集两组高血压患者的数据,一种服用抗高血压药物,另一种作为对照组不做处理,想要分析两组患者服药后的血压值是否有差异,那么血压值(Y)就是定量变量。

常见的定量统计分析方法包括t检验、方差分析等。

定类数据则是不能被量化或者测量的变量,其值通常以分类方式表示。

在社会科学、生物学等领域中,定类变量是用来表示个体或者群体之间的差异。

例如,学历通常被视为定类变量,因为它只能以分类方式表示(如本科、硕士、博士等)。

尽管学历也可以有数值形式(如学历等级),但在大多数情况下,它被视为分类变量。

常见的定类统计分析方法包括卡方检验、列联表分析等。

总之,定量和定类方法在数据类型和研究方法上存在差异。

定量方法适用于数值型数据,可以进行数学计算和分析;而定类方法适用于分类数据,主要用于表示不同个体或群体之间的差异。

在选择统计检验方法时,需要先进行数据类型鉴别,然后根据数据类型和研究问题选择合适的方法。

利用机器学习技术确定同伦分析解中的收敛控制参数

利用机器学习技术确定同伦分析解中的收敛控制参数

利用机器学习技术确定同伦分析解中的收敛控制参数作者:周童晖柳银萍来源:《华东师范大学学报(自然科学版)》2022年第02期摘要:同倫分析方法是求解强非线性问题解析近似解的有效方法,已被广泛应用于解决科学研究和工程技术中的一些重要问题. 相对于其他已有的解析近似方法,同伦分析方法通过引入若干个辅助参数和辅助函数来控制级数解的收敛区域和收敛速度.针对现有的同伦分析方法中收敛控制参数的选择问题,采用了一种根据机器学习的参数选择算法,首次将同伦分析方法和机器学习技术结合起来,求解非线性数学物理方程收敛性更好的解析近似解. 通过将该算法应用到具体的实例中,可以看出,所获得的同伦分析解明显优于已有的同伦分析解,同时,该算法更具普适性和灵活性.关键词:同伦分析方法; 辅助函数; 控制参数; 机器学习中图分类号: O175.14 文献标志码: A DOI: 10.3969/j.issn.1000-5641.2022.02.005Determination of convergence control parameters in homotopy analysis solutions based on machine learning techniqueZHOU Tonghui1 , LIU Yinping2,3(1. School of Computer Science and Technology, East China Normal University, Shanghai 200062, China;2. School of Mathematical Sciences, East China Normal University, Shanghai 200241,China;3. Shanghai Key Laboratory of PMMP, East China Normal University, Shanghai 200241,China)Abstract: Homotopy analysis method is an effective method for constructing approximate analytical solutions to strongly nonlinear problems. The technique has been widely applied to solve important problems in scientific research and engineering technology. Compared with other existing techniques, this method leverages auxiliary parameters and functions to adjust and control the convergence region and convergence speed of approximate analytical solutions. In this paper, we present a parameter selection algorithm based on machine learning techniques to determine the optimal values of convergence control parameters for homotopy analysis solutions. This marks the first time that homotopy analysis method and machine learning techniques have been combined to obtain approximate analytical method with better convergence for strongly nonlinear mathematical and physical equations. By applying the method to several examples, we show that the convergence of solutions using the proposed method is better than those obtained from existing homotopy analysis methods. In addition, our algorithm is both more universal and flexible.Keywords: homotopy analysis method; auxiliary function; control parameter; machine learning0 引言微分方程是描述自然现象最常用的数学模型.因此,微分方程的解法研究是数学物理领域的常青树 .19世纪以后,线性微分方程的求解方法已经发展得较为成熟,然而自然界中的绝大多数现象都是非线性的.相对于线性微分方程,非线性微分方程的求解要困难得多.现代计算机技术的不断发展和各种数学软件的日益成熟为微分方程的求解提供了强有力的工具.微分方程的解法,根据解的类型可分为:精确解法、数值解法和解析近似解法.由于许多非线性微分方程无法获得其精确解,因此数值解法是工程技术中常用的方法,但数值解法无法给出解的具体表达形式.摄动方法[1-3]是一种被广泛使用的解析近似方法,这种方法已被许多杰出的学者用来解决实际工程中的很多问题.但因为摄动法的使用需要系统中有物理小参数,这在很大程度上限制了其适用范围[4-5]. 为了打破这个限制, Lyapunov 分解算法和 Adomian 分解法等相继诞生[6-7] ,这些方法虽然克服了对物理小参数的依赖,但往往解的收敛性没法得到保证. 为了从根本上解决解析近似方法的物理小参数依赖性强和收敛区间小的问题,廖世俊[8]基于拓扑理论中的同伦概念提出了一种新的求解非线性微分方程的解析近似方法—同伦分析方法.该方法不依赖于物理小参数,且总能将非线性问题转化为一系列的线性子问题,通过自由选取线性算子和基函数列,方便了线性子问题求解,并且能通过辅助参数和辅助函数来控制级数解的收敛区域和收敛速度,确保所获得的解析近似解具有较高的精度.该方法引起了国内外很多学者的关注,这些学者的不断探索和研究使得同伦分析方法的理论基础更加牢固,例如,Odibat[9]给出了同伦级数解收敛的一个充分条件, Yabushita 等[10]使用余量的平方度量近似解析解的准确度.文献[11-12]初步研究了辅助线性算子和收敛控制参数的选取.赵银龙[13]通过定义逆算子进一步提高了高阶形变方程的求解效率等.本文将同伦分析方法和机器学习技术相结合,首先,应用同伦分析方法求得非线性系统的m (m >0)阶带参数的解析近似解.然后,将所获得的解代入非线性微分方程中,进一步将所获得的余量作为目标函数,采用机器学习技术中常用的小批量梯度下降法(Mini-Batch Gradient Descant)进行优化[14] ,获得余量最优的参数值. 最后,获得原方程精度很高的解析近似解.本文所提出的方法不仅可以通过训练集范围来调节解析近似解在不同的自变量区间的逼近效果,还可以同时对多个参数进行优化.另外,对于部分算例,本文将辅助函数进行了二阶加权展开,以此来获得更优的辅助函数和收敛性更好的解析近似解.实验表明,对于大部分非线性方程,本文所提出的方法可以获得精度更高的解析近似解.1 算法原理1.1 同伦分析解的构造思路简述考虑一个非线性微分方程N[u(x)]= 0. (1)式(1)中: N 为非线性微分算子; u(x)为所要求解的未知函数. 该系统中可能还包含若干个未知的物理参数,如频率、振幅等. 采用同伦分析方法求解式(1),首先要构造所谓的零阶形变方程(1− q)L[Φ(x, q)− V0(x)]= qhH(x)N[Φ(x, q)]. (2)式(2)中: L 为辅助线性算子; h 为辅助参数; H(x)为辅助函数;Φ(x, q)为 x, q 的函数; V0(x)为初始猜测解; q ∈[0, 1]为嵌入参数. 由式(2)可知,由于 h 0且 H(x) 0 ,当 q =0 时,式(2)的解为Φ(x, q)= V0(x);当 q =1 时,式(2)的解变为Φ(x, 1)= u(x). 由此可见,当 q 从0 变化到1 时,Φ(x, q)从初始猜测解演化到u(x). 根據泰勒展开定理,将Φ(x, q)关于q 展开成如下幂级数(3)令Vi(x)= i!· ∂qi q=0 ,(4)根据式(4),可将式(3)简化为Φ(x, q)= V0(x)+ Vm(x)qm .利用Φ(x, 1)= u(x),可得到解的级数展开式u(x)= V0(x)+ Vm(x).对零阶形变方程式(2)的两边关于q 求m 阶导数,再令q =0 ,得到m 阶形变方程式(5)中:Rm(Vm −1)= (m −1)!· ∂qm −1 q=0;依次迭代求解高阶形变方程(5),则可得到u(x)的m 阶解析近似表达式式(6)即为所求系统的 m 阶解析近似解.需要说明的是,所获得的解中含有收敛控制参数和辅助函数,收敛控制参数可以调节和控制解的收敛区域和收敛速度,辅助函数可以确保所获得的解符合解表达法则. 另外,式(6)的解中可能还包含有系统中未知的物理参数,如何确定式(6)的解表达式中的未知参数和未知函数,使所获得的解收敛性更好呢?同伦分析方法本身提供了若干个法则来确定解中的未知物理参数,但是该思路并不具有普适性,需要针对不同的系统进行分析.本文将机器学习技术应用到同伦分析方法中,应用机器学习技术中的小批量梯度下降法来确定同伦分析解中的未知参数,以获得收敛性较好的解及系统中未知的物理参数值.1.2 利用机器学习的收敛控制参数确定算法在上述算法所获得的同伦分析解中包含有未知的收敛控制参数和辅助函数,也可能包含未知的物理参数. 如何确定这些未知参数和未知函数?本文应用机器学习方法中的小批量梯度下降法对同伦分析解中的未知参数进行优化.令θ= {h,ω} , h 为式(2)中出现的辅助参数,ω表示线性辅助算子 L 、初始猜测解V0(x)以及辅助函数 H(x)中用以加速收敛与控制收敛范围的其他控制参数,该集合中也可能会包含其他的未知参数. N[V(x0,θ)]2作为余量的平方度量了以上解析近似解 V(x0,θ)趋于u(x0)的程度,当 N[V(x0,θ)]2 →0 时,有V(x0,θ)→ u(x0),因此最小化rΩN[V(x,θ)]2dx 得到的θ可以使解析近似解收敛得更快、更好.定义目标函数摄动方法[1-3]是一种被广泛使用的解析近似方法,这种方法已被许多杰出的学者用来解决实际工程中的很多问题.但因为摄动法的使用需要系统中有物理小参数,这在很大程度上限制了其适用范围[4-5]. 为了打破这个限制, Lyapunov 分解算法和 Adomian 分解法等相继诞生[6-7] ,这些方法虽然克服了对物理小参数的依赖,但往往解的收敛性没法得到保证. 为了从根本上解决解析近似方法的物理小参数依赖性强和收敛区间小的问题,廖世俊[8]基于拓扑理论中的同伦概念提出了一种新的求解非线性微分方程的解析近似方法—同伦分析方法.该方法不依赖于物理小参数,且总能将非线性问题转化为一系列的线性子问题,通过自由选取线性算子和基函数列,方便了线性子问题求解,并且能通过辅助参数和辅助函数来控制级数解的收敛区域和收敛速度,确保所获得的解析近似解具有较高的精度.该方法引起了国内外很多学者的关注,这些学者的不断探索和研究使得同伦分析方法的理论基础更加牢固,例如,Odibat[9]给出了同伦级数解收敛的一个充分条件, Yabushita 等[10]使用余量的平方度量近似解析解的准确度.文献[11-12]初步研究了辅助线性算子和收敛控制参数的选取.赵银龙[13]通过定义逆算子进一步提高了高阶形变方程的求解效率等.本文将同伦分析方法和机器学习技术相结合,首先,应用同伦分析方法求得非线性系统的m (m >0)阶带参数的解析近似解.然后,将所获得的解代入非线性微分方程中,进一步将所获得的余量作为目标函数,采用机器学习技术中常用的小批量梯度下降法(Mini-Batch Gradient Descant)进行优化[14] ,获得余量最优的参数值. 最后,获得原方程精度很高的解析近似解.本文所提出的方法不仅可以通过训练集范围来调节解析近似解在不同的自变量区间的逼近效果,还可以同时对多个参数进行优化.另外,对于部分算例,本文将辅助函数进行了二阶加权展开,以此来获得更优的辅助函数和收敛性更好的解析近似解.实验表明,对于大部分非线性方程,本文所提出的方法可以获得精度更高的解析近似解.1 算法原理1.1 同伦分析解的构造思路简述考虑一个非线性微分方程N[u(x)]= 0. (1)式(1)中: N 为非线性微分算子; u(x)为所要求解的未知函数. 该系统中可能还包含若干个未知的物理参数,如频率、振幅等. 采用同伦分析方法求解式(1),首先要构造所谓的零阶形变方程(1− q)L[Φ(x, q)− V0(x)]= qhH(x)N[Φ(x, q)]. (2)式(2)中: L 为辅助线性算子; h 为辅助参数; H(x)为辅助函数;Φ(x, q)为 x, q 的函数; V0(x)为初始猜测解; q ∈[0, 1]为嵌入参数. 由式(2)可知,由于 h 0且 H(x) 0 ,当 q =0 时,式(2)的解为Φ(x, q)= V0(x);当 q =1 时,式(2)的解变为Φ(x, 1)= u(x). 由此可见,当 q 从0 变化到1 时,Φ(x, q)从初始猜测解演化到u(x). 根据泰勒展开定理,将Φ(x, q)关于q 展开成如下幂级数(3)令Vi(x)= i!· ∂qi q=0 ,(4)根据式(4),可将式(3)简化为Φ(x, q)= V0(x)+ Vm(x)qm .利用Φ(x, 1)= u(x),可得到解的级数展开式u(x)= V0(x)+ Vm(x).对零阶形变方程式(2)的两边关于q 求m 阶导数,再令q =0 ,得到m 阶形变方程式(5)中:Rm(Vm −1)= (m −1)!· ∂qm −1 q=0;依次迭代求解高阶形变方程(5),则可得到u(x)的m 阶解析近似表达式式(6)即为所求系统的 m 阶解析近似解.需要说明的是,所获得的解中含有收敛控制参数和辅助函数,收敛控制参数可以调节和控制解的收敛区域和收敛速度,辅助函数可以确保所获得的解符合解表达法则. 另外,式(6)的解中可能还包含有系统中未知的物理参数,如何确定式(6)的解表达式中的未知参数和未知函数,使所获得的解收敛性更好呢?同伦分析方法本身提供了若干个法则来确定解中的未知物理参数,但是该思路并不具有普适性,需要针对不同的系统进行分析.本文将机器学习技术应用到同伦分析方法中,应用机器学习技术中的小批量梯度下降法来确定同伦分析解中的未知参数,以获得收敛性较好的解及系统中未知的物理参数值.1.2 利用机器学习的收敛控制参数确定算法在上述算法所获得的同伦分析解中包含有未知的收敛控制参数和辅助函数,也可能包含未知的物理参数. 如何确定这些未知参数和未知函数?本文应用机器学习方法中的小批量梯度下降法对同伦分析解中的未知参数进行优化.令θ= {h,ω} , h 为式(2)中出现的辅助参数,ω表示线性辅助算子 L 、初始猜测解V0(x)以及辅助函数 H(x)中用以加速收敛与控制收敛范围的其他控制参数,该集合中也可能会包含其他的未知参数. N[V(x0,θ)]2作為余量的平方度量了以上解析近似解 V(x0,θ)趋于u(x0)的程度,当 N[V(x0,θ)]2 →0 时,有V(x0,θ)→ u(x0),因此最小化rΩN[V(x,θ)]2dx 得到的θ可以使解析近似解收敛得更快、更好.定义目标函数摄动方法[1-3]是一种被广泛使用的解析近似方法,这种方法已被许多杰出的学者用来解决实际工程中的很多问题.但因为摄动法的使用需要系统中有物理小参数,这在很大程度上限制了其适用范围[4-5]. 为了打破这个限制, Lyapunov 分解算法和 Adomian 分解法等相继诞生[6-7] ,这些方法虽然克服了对物理小参数的依赖,但往往解的收敛性没法得到保证. 为了从根本上解决解析近似方法的物理小参数依赖性强和收敛区间小的问题,廖世俊[8]基于拓扑理论中的同伦概念提出了一种新的求解非线性微分方程的解析近似方法—同伦分析方法.该方法不依赖于物理小参数,且总能将非线性问题转化为一系列的线性子问题,通过自由选取线性算子和基函数列,方便了线性子问题求解,并且能通过辅助参数和辅助函数来控制级数解的收敛区域和收敛速度,确保所获得的解析近似解具有较高的精度.该方法引起了国内外很多学者的关注,这些学者的不断探索和研究使得同伦分析方法的理论基础更加牢固,例如,Odibat[9]给出了同伦级数解收敛的一个充分条件, Yabushita 等[10]使用余量的平方度量近似解析解的准确度.文献[11-12]初步研究了辅助线性算子和收敛控制参数的选取.赵银龙[13]通过定义逆算子进一步提高了高阶形变方程的求解效率等.本文将同伦分析方法和机器学习技术相结合,首先,应用同伦分析方法求得非线性系统的m (m >0)阶带参数的解析近似解.然后,将所获得的解代入非线性微分方程中,进一步将所获得的余量作为目标函数,采用机器学习技术中常用的小批量梯度下降法(Mini-Batch Gradient Descant)进行优化[14] ,获得余量最优的参数值. 最后,獲得原方程精度很高的解析近似解.本文所提出的方法不仅可以通过训练集范围来调节解析近似解在不同的自变量区间的逼近效果,还可以同时对多个参数进行优化.另外,对于部分算例,本文将辅助函数进行了二阶加权展开,以此来获得更优的辅助函数和收敛性更好的解析近似解.实验表明,对于大部分非线性方程,本文所提出的方法可以获得精度更高的解析近似解.1 算法原理1.1 同伦分析解的构造思路简述考虑一个非线性微分方程N[u(x)]= 0. (1)式(1)中: N 为非线性微分算子; u(x)为所要求解的未知函数. 该系统中可能还包含若干个未知的物理参数,如频率、振幅等. 采用同伦分析方法求解式(1),首先要构造所谓的零阶形变方程(1− q)L[Φ(x, q)− V0(x)]= qhH(x)N[Φ(x, q)]. (2)式(2)中: L 为辅助线性算子; h 为辅助参数; H(x)为辅助函数;Φ(x, q)为 x, q 的函数; V0(x)为初始猜测解; q ∈[0, 1]为嵌入参数. 由式(2)可知,由于 h 0且 H(x) 0 ,当 q =0 时,式(2)的解为Φ(x, q)= V0(x);当 q =1 时,式(2)的解变为Φ(x, 1)= u(x). 由此可见,当 q 从0 变化到1 时,Φ(x, q)从初始猜测解演化到u(x). 根据泰勒展开定理,将Φ(x, q)关于q 展开成如下幂级数(3)令Vi(x)= i!· ∂qi q=0 ,(4)根据式(4),可将式(3)简化为Φ(x, q)= V0(x)+ Vm(x)qm .利用Φ(x, 1)= u(x),可得到解的级数展开式u(x)= V0(x)+ Vm(x).对零阶形变方程式(2)的两边关于q 求m 阶导数,再令q =0 ,得到m 阶形变方程式(5)中:Rm(Vm −1)= (m −1)!· ∂qm −1 q=0;依次迭代求解高阶形变方程(5),则可得到u(x)的m 阶解析近似表达式式(6)即为所求系统的 m 阶解析近似解.需要说明的是,所获得的解中含有收敛控制参数和辅助函数,收敛控制参数可以调节和控制解的收敛区域和收敛速度,辅助函数可以确保所获得的解符合解表达法则. 另外,式(6)的解中可能还包含有系统中未知的物理参数,如何确定式(6)的解表达式中的未知参数和未知函数,使所获得的解收敛性更好呢?同伦分析方法本身提供了若干个法则来确定解中的未知物理参数,但是该思路并不具有普适性,需要针对不同的系统进行分析.本文将机器学习技术应用到同伦分析方法中,应用机器学习技术中的小批量梯度下降法来确定同伦分析解中的未知参数,以获得收敛性较好的解及系统中未知的物理参数值.1.2 利用机器学习的收敛控制参数确定算法在上述算法所获得的同伦分析解中包含有未知的收敛控制参数和辅助函数,也可能包含未知的物理参数. 如何确定这些未知参数和未知函数?本文应用机器学习方法中的小批量梯度下降法对同伦分析解中的未知参数进行优化.令θ= {h,ω} , h 为式(2)中出现的辅助参数,ω表示线性辅助算子 L 、初始猜测解V0(x)以及辅助函数 H(x)中用以加速收敛与控制收敛范围的其他控制参数,该集合中也可能会包含其他的未知参数. N[V(x0,θ)]2作为余量的平方度量了以上解析近似解 V(x0,θ)趋于u(x0)的程度,当 N[V(x0,θ)]2 →0 时,有V(x0,θ)→ u(x0),因此最小化rΩN[V(x,θ)]2dx 得到的θ可以使解析近似解收敛得更快、更好.定义目标函数摄动方法[1-3]是一种被广泛使用的解析近似方法,这种方法已被许多杰出的学者用来解决实际工程中的很多问题.但因为摄动法的使用需要系统中有物理小参数,这在很大程度上限制了其适用范围[4-5]. 为了打破这个限制, Lyapunov 分解算法和 Adomian 分解法等相继诞生[6-7] ,这些方法虽然克服了对物理小参数的依赖,但往往解的收敛性没法得到保证. 为了从根本上解决解析近似方法的物理小参数依赖性强和收敛区间小的问题,廖世俊[8]基于拓扑理论中的同伦概念提出了一种新的求解非线性微分方程的解析近似方法—同伦分析方法.该方法不依赖于物理小参数,且总能将非线性问题转化为一系列的线性子问题,通过自由选取线性算子和基函数列,方便了线性子问题求解,并且能通过辅助参数和辅助函数来控制级数解的收敛区域和收敛速度,确保所获得的解析近似解具有较高的精度.该方法引起了国内外很多学者的关注,这些学者的不断探索和研究使得同伦分析方法的理论基础更加牢固,例如,Odibat[9]给出了同伦级数解收敛的一个充分条件, Yabushita 等[10]使用余量的平方度量近似解析解的准确度.文献[11-12]初步研究了辅助线性算子和收敛控制参数的选取.赵银龙[13]通过定义逆算子进一步提高了高阶形变方程的求解效率等.本文将同伦分析方法和机器学习技术相结合,首先,应用同伦分析方法求得非线性系统的m (m >0)阶带参数的解析近似解.然后,将所获得的解代入非线性微分方程中,进一步将所获得的余量作为目标函数,采用机器学习技术中常用的小批量梯度下降法(Mini-Batch Gradient Descant)进行优化[14] ,获得余量最优的参数值. 最后,获得原方程精度很高的解析近似解.本文所提出的方法不仅可以通过训练集范围来调节解析近似解在不同的自变量区间的逼近效果,还可以同时对多个参数进行优化.另外,对于部分算例,本文将辅助函数进行了二阶加权展开,以此来获得更优的辅助函数和收敛性更好的解析近似解.实验表明,对于大部分非线性方程,本文所提出的方法可以获得精度更高的解析近似解.1 算法原理1.1 同伦分析解的构造思路简述考虑一个非线性微分方程N[u(x)]= 0. (1)式(1)中: N 为非线性微分算子; u(x)为所要求解的未知函数. 该系统中可能还包含若干个未知的物理参数,如频率、振幅等. 采用同伦分析方法求解式(1),首先要构造所谓的零阶形变方程(1− q)L[Φ(x, q)− V0(x)]= qhH(x)N[Φ(x, q)]. (2)式(2)中: L 为辅助线性算子; h 为辅助参数; H(x)为辅助函数;Φ(x, q)为 x, q 的函数; V0(x)为初始猜测解; q ∈[0, 1]为嵌入参数. 由式(2)可知,由于 h 0且 H(x) 0 ,当 q =0 时,式(2)的解为Φ(x, q)= V0(x);当 q =1 时,式(2)的解变为Φ(x, 1)= u(x). 由此可见,当 q 从0 变化到1 时,Φ(x, q)从初始猜测解演化到u(x). 根據泰勒展开定理,将Φ(x, q)关于q 展开成如下幂级数(3)令Vi(x)= i!· ∂qi q=0 ,(4)根据式(4),可将式(3)简化为Φ(x, q)= V0(x)+ Vm(x)qm .利用Φ(x, 1)= u(x),可得到解的级数展开式u(x)= V0(x)+ Vm(x).对零阶形变方程式(2)的两边关于q 求m 阶导数,再令q =0 ,得到m 阶形变方程式(5)中:Rm(Vm −1)= (m −1)!· ∂qm −1 q=0;依次迭代求解高阶形变方程(5),则可得到u(x)的m 阶解析近似表达式式(6)即为所求系统的 m 阶解析近似解.需要说明的是,所获得的解中含有收敛控制参数和辅助函数,收敛控制参数可以调节和控制解的收敛区域和收敛速度,辅助函数可以确保所获得的解符合解表达法则. 另外,式(6)的解中可能还包含有系统中未知的物理参数,如何确定式(6)的解表达式中的未知参数和未知函数,使所获得的解收敛性更好呢?同伦分析方法本身提供了若干个法则来确定解中的未知物理参数,但是该思路并不具有普适性,需要针对不同的系统进行分析.本文将机器学习技术应用到同伦分析方法中,应用机器学习技术中的小批量梯度下降法来确定同伦分析解中的未知参数,以获得收敛性较好的解及系统中未知的物理参数值.1.2 利用机器学习的收敛控制参数确定算法在上述算法所获得的同伦分析解中包含有未知的收敛控制参数和辅助函数,也可能包含未知的物理参数. 如何确定这些未知参数和未知函数?本文应用机器学习方法中的小批量梯度下降法对同伦分析解中的未知参数进行优化.令θ= {h,ω} , h 为式(2)中出现的辅助参数,ω表示线性辅助算子 L 、初始猜测解V0(x)以及辅助函数 H(x)中用以加速收敛与控制收敛范围的其他控制参数,该集合中也可能会包含其他的未知参数. N[V(x0,θ)]2作为余量的平方度量了以上解析近似解 V(x0,θ)趋于u(x0)的程度,当 N[V(x0,θ)]2 →0 时,有V(x0,θ)→ u(x0),因此最小化rΩN[V(x,θ)]2dx 得到的θ可以使解析近似解收敛得更快、更好.定义目标函数。

基于稳健估计和变量分离的大坝监测数据异常值识别方法

基于稳健估计和变量分离的大坝监测数据异常值识别方法

第45卷第3期人民珠江 2024年3月 PEARLRIVERhttp://www.renminzhujiang.cnDOI:10 3969/j issn 1001 9235 2024 03 015基金项目:四川省科技厅重点研发项目(2022YFS0535)收稿日期:2023-10-27作者简介:梁汇彬(1999—),男,硕士研究生,主要研究方向为大坝及库岸边坡安全监测和评估。

E-mail:2404129818@qq.com通信作者:张瀚(1978—),男,副教授,主要从事水工建筑物结构安全监测、致灾机理及风险早期识别评估研究。

E-mail:zhanghan@scu.edu.cn梁汇彬,张瀚,张林松,等.基于稳健估计和变量分离的大坝监测数据异常值识别方法[J].人民珠江,2024,45(3):138-145.基于稳健估计和变量分离的大坝监测数据异常值识别方法梁汇彬1,2,张 瀚1,2,张林松1,2,曹宇鑫1,2,周靖人1,2(1.四川大学水力学与山区河流开发保护国家重点实验室,四川 成都 610065;2.四川大学水利水电学院,四川 成都 610065)摘要:大坝原观监测数据是掌握大坝运行性态最重要的资料,监测数据中的异常值又是分析过程中关注的重点。

异常值分为两类,一类由测量误差产生,应给予剔除或补测,避免影响后续分析,另一类由于结构突变产生异常,应高度重视。

目前坝工领域主要的异常值识别方法多未考虑结构异常的影响,仅从传统数学统计角度出发,造成识别准确率不高。

为此,在深入研究大坝监测数据及异常值特征的基础上,首先采用稳健MM估计消除内外因正常影响,再利用剩余测值前后逐差消除稳定异常影响,最后根据极小值法对剩余值进行异常识别,通过对大坝实测数据的应用,证明了该法可以更有效、稳健地识别测量异常,避免结构稳定异常的干扰。

关键词:异常值识别;时间序列数据;稳健估计;大坝监测;变量分离中图分类号:TV3 文献标识码:A 文章编号:1001 9235(2024)03 0138 08OutlierDetectionMethodofDamMonitoringDataBasedonRobustEstimationandVariableSeparationLIANGHuibin1牞2牞ZHANGHan1牞2牞ZHANGLinsong1牞2牞CAOYuxin1牞2牞ZHOUJingren1牞2牗1.StateKeyLaboratoryofHydraulicsandMountainRiverEngineering牞SichuanUniversity牞Chengdu610065牞China牷2.CollegeofWaterResources&Hydropower牞SichuanUniversity牞Chengdu610065牞China牘Abstract牶Theoriginalmonitoringdataofdamsisthemostimportantdatatograsptheoperationbehaviorofthedams牞andtheoutliersinthedataarethefocusduringtheanalysis.Outliersaredividedintotwocategories.Onecategoryiscausedbymeasurementerrorsandshouldbeeliminatedorsupplementedtoavoidaffectingsubsequentanalysis.Theotheriscausedbystructuralmutationsandshouldbehighlyvalued.Atpresent牞mainoutlierrecognitionmethodsindamengineeringarebasedontraditionalmathematicalstatisticsanddonotconsidertheinfluenceofstructuralanomalies牞whichresultsinlowrecognitionaccuracy.Therefore牞basedonanin depthstudyofdammonitoringdataandoutliercharacteristics牞thispaperfirstemploysrobustMMestimationtoeliminatethenormalinfluenceofinternalandexternalfactorsandthenadoptstheresidualmeasuredvaluetoeliminatethestableabnormalinfluencebydifferencebeforeandafter.Finally牞accordingtotheminimumvaluemethod牞outlieridentificationisconductedontheresidualvalues.Theapplicationofthemeasureddamdataprovesthattheproposedmethodcanidentifythemeasurementoutliersmoreeffectivelyandrobustly牞andavoidtheinterferenceofstructuralstabilityanomalies.Keywords牶outlierdetection牷timeseriesdata牷robustestimation牷dammonitoring牷variableseparation第3期梁汇彬,等:基于稳健估计和变量分离的大坝监测数据异常值识别方法大坝的安全关系着下游流域的安全,为了监控大坝的运行,大坝埋设了大量监测仪器,这些监测仪器采集的数据是分析大坝运行性态的重要资料[1-5]。

上市公司资信评级的多元因变量Logit模型

上市公司资信评级的多元因变量Logit模型

上市公司资信评级的多元因变量Logit模型
周晶晗;邱长溶
【期刊名称】《华中科技大学学报(社会科学版)》
【年(卷),期】2003(017)003
【摘要】文章应用多元统计中的因子分析、Logit模型对上市公司企业素质、经营效益、偿债能力、发展前景等方面的综合信息进行统计分析,构建企业资信评级的多元有序变量Logit模型,进而对新上市公司进行资信等级评估.
【总页数】4页(P91-94)
【作者】周晶晗;邱长溶
【作者单位】西安交通大学,经济与金融学院,陕西,西安,710061;西安交通大学,经济与金融学院,陕西,西安,710061
【正文语种】中文
【中图分类】F830.91
【相关文献】
1.上市公司信用评价模型——二元因变量模型的应用 [J], 唐小岸;孟庆福
2.多元有序Logit模型用于上市公司信用评级探析 [J], 刘瑞霞;张晓丽;陈小燕;郝艳丽
3.基于Logit模型的上市公司财务危机预警分析--以制造业上市公司为例 [J], 高忠
4.基于面板数据和Panel-Logit模型的上市公司风险预警模型研究 [J], 徐依朋;齐鲁豫;邢思铭;王宇;渠正识
5.我国科创板上市公司信用风险评估——基于KMV模型和有序Logit模型的研究[J], 陶秋月
因版权原因,仅展示原文概要,查看原文内容请购买。

一种改进的变分水平集的图像分割算法

一种改进的变分水平集的图像分割算法

一种改进的变分水平集的图像分割算法张桂梅;周飞飞;储珺【摘要】为了解决灰度不均匀现象对医学图像的干扰问题,提出了基于局部极性信息的活动轮廓模型。

通过引入局部图像信息,该模型能有效地分割灰度不均匀图像。

在规则化项中增加的能量惩罚项,使得水平集函数在演化过程中保持为近似的符号距离函数。

该算法将图像分割问题归结为曲线能量泛函的最小化,首先建立包含局部灰度信息(极性信息)和改进的符号距离函数的曲线演化能量泛函;然后采用变分水平集方法求解能量函数的最小值,得到最终的分割结果。

真实医学图像和人工合成图像的实验结果表明,此方法对灰度不均匀的医学图像有较高的分割精确度,在图像分割速度上有较大提高。

由于利用了局部灰度信息,可以有效地分割灰度不均匀的医学图像,而改进后的变分水平集可以完全避免重新初始化,使得图像分割效率大大提高了。

%To solve the problem caused by intensity inhomogeneity in medical images, this paper proposed an active contour model based on the local polarity information. By incorporating the local information of image, the proposed model can efficiently segment the image which intensity is nonuniform. Through introducing a penalizing energy term into the regularization, the level set function can be approximated as a signed distance function all the time in the process. This algorithm regarded the image segmentation as the task to minimize the curve of energy functional. Firstly, to establish the evolution curve of energy functional including the local gray level information (polarity information) and the improved signed distance function. Then to solve the minimization of energy function by using the variational level set methodto be able to get the final segmentation result. The experiment results of real medical images and artificial synthesis images have shown that our method can get a higher precision of segmentation for the medical images with uneven grayscale. In addition, the image processing speed has been improved greatly. Because of the utilization of local gray information, we can segment the medical image with uneven grayscale effectively, the improved variational level set can completely avoid the re-initialization,and greatly improve the efficiency of image segmentation.【期刊名称】《图学学报》【年(卷),期】2015(000)005【总页数】7页(P740-746)【关键词】变分水平集;图像分割;符号距离函数;极性信息【作者】张桂梅;周飞飞;储珺【作者单位】南昌航空大学,江西省图像处理与模式识别重点实验室,江西南昌330063;南昌航空大学,江西省图像处理与模式识别重点实验室,江西南昌330063;南昌航空大学,江西省图像处理与模式识别重点实验室,江西南昌330063【正文语种】中文【中图分类】TP391.41图像分割是图像处理领域中基础的工作,也是进行后续图像处理和分析的重要步骤,随着计算机对图像处理领域的研究发展,图像分割在工业自动化、遥感卫星图像处理、生物医学图像处理、视频图像处理,以及军事、农业工程等方面已经得到广泛地应用。

社会科学定量研究的变量类型、方法选择及范例解析书评

社会科学定量研究的变量类型、方法选择及范例解析书评

社会科学定量研究的变量类型、方法选择及范例解析书评《社会科学定量研究的变量类型、方法选择及范例解析》书评社会科学定量研究是社会科学领域中一种重要的研究方法,它通过对数字化数据的收集、整理和分析,来揭示社会现象的规律和关联。

而变量类型和方法选择是社会科学定量研究中至关重要的内容。

本书《社会科学定量研究的变量类型、方法选择及范例解析》系统介绍了社会科学中常见的变量类型和方法选择,以及通过实例分析来说明如何应用这些变量类型和方法选择来进行研究。

本书既适合学术研究人员作为参考资料,也适合社会科学相关专业的学生作为教材。

作者首先对社会科学研究中的定性变量和定量变量进行了详细的解释和分类。

定性变量是指表征事物属性或特征的变量,如性别、民族等;定量变量则是指可以进行量化和计量的变量,如芳龄、收入等。

这些变量的选择在研究设计和数据收集阶段就起到了至关重要的作用,因为不同的变量类型对于后续的数据分析和解释模型都有着不同的要求。

在介绍变量类型后,作者对社会科学研究中常用的方法进行了系统的介绍。

从双变量分析到多元回归分析,作者通过清晰的案例和实例说明了各种方法在不同研究场景下的应用和意义。

尤其是在多元回归分析中,作者详细解释了常见的控制变量和中介变量的概念,帮助读者更好地理解和运用这些概念在研究中。

书中所展示的案例和分析范例也丰富多样,涵盖了政治、经济、社会等多个领域。

作者用实例说明了在研究政府支出对经济增长的影响时,需要如何选择变量类型和分析方法,以避免无效结果或者误导性结论的出现。

这些案例不仅仅是理论上的介绍,更是实践中的指导,能够帮助读者更好地理解和运用书中所介绍的知识。

本书对于社会科学定量研究的变量类型和方法选择进行了系统和全面的介绍,通过丰富的案例和实例分析,帮助读者更加深入地理解和运用这些知识。

作者对于社会科学研究的个人观点和理解也为读者在学术研究中提供了更多的启发和思考。

这本书不仅是一部教材,更是一本对于社会科学研究方法的重要参考读物。

中国居民收入与家庭碳达峰:基于CGSS数据与多项Logit模型

中国居民收入与家庭碳达峰:基于CGSS数据与多项Logit模型

中国居民收入与家庭碳达峰:基于CGSS数据与多项Logit
模型
陈林;王佳莹;陈臻;周立宏
【期刊名称】《中国软科学》
【年(卷),期】2024()4
【摘要】基于2015年和2018年CGSS家庭微观数据,构建多项Logit模型,实证检验居民收入对家庭碳达峰偏离度的影响。

研究发现:居民收入增长对家庭直接碳达峰偏离度和间接碳达峰偏离度均产生显著的促进作用,进而提升家庭部门碳达峰偏离度,且家庭碳达峰偏离水平越低,收入增长产生影响的可能性就越小。

异质性分析表明,中西部地区家庭的低碳消费模式较为稳定,东部地区则需关注高碳排放风险,且教育水平提升能够缓解因居民收入增长带来的家庭碳达峰偏离度提升问题。

因此,我国政府应引导培养家庭节约集约的绿色生活观念,以推动家庭消费绿色低碳转型和碳达峰碳中和目标的实现。

【总页数】10页(P166-175)
【作者】陈林;王佳莹;陈臻;周立宏
【作者单位】暨南大学产业经济研究院;中国科学院科技战略咨询研究院;浙江大学经济学院
【正文语种】中文
【中图分类】F062.1
【相关文献】
1.中国实现碳达峰的政策建议——基于碳定价机制模型的多情景模拟分析
2.基于多目标模型的中国低成本碳达峰、碳中和路径
3.基于LMDI-STIRPAT模型的中国钢铁行业碳达峰路径研究
4.中国煤炭产区碳排放影响因素及碳达峰组合情景预测——基于LMDI和门限—STIRPAT模型
5.“碳达峰”目标下中国碳排放强度预测——基于LSTM和ARIMA-BP模型的分析
因版权原因,仅展示原文概要,查看原文内容请购买。

有关数据预处理的探讨

有关数据预处理的探讨

科技创新Sc fe nt i.ac and T e chnol ogi c al I nnova t i on 霭藏逦曼有关数据预处理的探讨梁晓佳周菊玲(新疆师范大学数学科学学院新疆乌鲁木齐830054)摘要本文对居中型和区间型两种适度指标进行论证和例证,考察了这两种数据处理方法对主成分和因子分析这种综合评价结果的影响。

另外,本文用文献①‘‘初始化”思想对极差法进行分析,得到结论,即处理后数据的协方差矩阵不仅消除了指标量纲和数量级的影响,还能包含原始数据的全部信息。

关键词数据处理同趋势化标准化变异中图分类号:TP391文献标识码:AT he D i s cuss i on of D at a Pr epr oces s i ngL I A N G X i aoj i a.Z H O U J ul i ng(D epar t m ent of M at hem at i cal sci ence s,X i nj i a ng N or m al U ni vers i t y,U rum qi,X i nj i ang830054)A bs t r act A r gum ent and i l l ust r at i on of s om e ki nds of a ppr opri a t e i ndi cat or s i s do ne i n t hi s paper,s uch as t he i ndi cat or s of m edi um and i nt er va l.A nd t he pap er l oo ks at t he ef f ec t of t he com pr eh ens i ve e va l ua t i on r e sul t s f r omt he t w o da t a pr o ces s i ng m e t hod on pr i nci pa l com ponen t s anal ysi s and f a ct or anal ysi s.I n addi t i on,t hi s ar t i cl e anal ys es t he process accordi ng t o t he m e t hod of”I ni t i al i za t i on”i n t he l i t e rat ure[1】,t hen com e t o a con cl us i on of w hi c h t he da t a covar i ance m at ri x af t er pr o ces s i ng not on l y e l i m i na t e t he i nf l uence of i nd ex di m en s i on and order of m agni t ude,and a l so C an cont ai n all t he i n f or m at i o n i n t he r a w dat a.K ey w or ds dat a proces si ng;com m unal i t i es;st andar di zed;vari at i on0引言综合评价是依据被评价对象的过去或当前一段时间的相关信息,对被评价对象进行客观、公正、合理的全面评价。

基于Logistic混沌映射的改进麻雀算法

基于Logistic混沌映射的改进麻雀算法

X
t B
X
t Di,
j
X
t B
X t1 Di, j
X
t Di,
j
K
X
t Di ,
j
X
t L
fi fw
fi fg fi fg
(5)
式中: X B 是当前全局最优位置; fi 是当前麻雀个体的适应度; fg , fw 分别为当前全局最优和最差的麻雀
个体适应度; 是步长控制参数,服从方差为 1 均值为 0 的正态分布的随机数;K 1, 1 是一个随机数;
本文利用 Logistic 混沌映射提高初始解质量,提升麻雀算法的全局搜索能力,改善群体智能算法在接
近最优解时,种群多样性减少,易陷入局部最优等问题,利用线性递减权重法,降低群体智能算法容易早 熟的风险,减少后期在全局最优解附近出现的振荡现象[11],提出了基于 Logistic 混沌映射的改进型麻雀算法.
f
FX
X 21
X 22
X2d
f
X n1
X n2
X nd
(2)
SSA 算法在寻优过程中,具有较高适应度的发现者在迭代搜索过程中会优先获取食物,由于发现者为
整个种群提供觅食搜索方向,故发现者拥有比加入者更大的搜索范围.在迭代过程中,发现者位置更新公
式为
X
t 1 Fi, j
X
t Fi ,
Q
exp
X
t L
X
t Ji
,
j
i2
X
t 1 P
X
t Ji
,
j
X
t 1 P
L A
i 0.5n i 0.5n
(4)
式中: X P 为当前发现者所在的最优位置; X L 为当前全局最差的位置; L 是维数为1 d 且元素全为 1 的矩

基于遗传算法和学习向量化网络的基因表达数据的阈值分析

基于遗传算法和学习向量化网络的基因表达数据的阈值分析

基于遗传算法和学习向量化网络的基因表达数据的阈值分析刘珑龙;周西龙;刘雪峰
【期刊名称】《中国海洋大学学报(自然科学版)》
【年(卷),期】2013(043)012
【摘要】常用的P值法对于非正态分布的基因表达数据的分类效果不理想,且运算量较大.为了对大规模的基因表达数据进行二值化分类,本文提出1种基于遗传算法的学习向量量化神经网络.采用遗传算法优化的自适应最大类间差算法,通过统计类间总体离差,构造阈值判别函数,从而得到较理想的动态分割阈值,进而获得了较为精准的网络训练集.实验结果表明了新方法具有较好的分类效果,能够有效地挖掘出基因表达数据的特征.
【总页数】6页(P111-116)
【作者】刘珑龙;周西龙;刘雪峰
【作者单位】中国海洋大学数学科学学院,山东青岛266100;中国海洋大学数学科学学院,山东青岛266100;中国海洋大学数学科学学院,山东青岛266100
【正文语种】中文
【中图分类】TP183
【相关文献】
1.基于遗传算法的基因表达数据的K-均值聚类分析 [J], 姜明宇;马文丽;郑文岭
2.自动向量化中基于数据依赖分析的循环分布算法 [J], 黄磊;姚远;侯永生;杨明
3.基于遗传算法及聚类的基因表达数据特征选择 [J], 任江涛;黄焕宇;孙婧昊;印鉴
4.基于并行免疫遗传算法基因表达数据的动态模糊聚类 [J], 郑明;刘桂霞;周春光;王晗;郑小红;李艳文
5.基于ART2神经网络的基因表达数据分析 [J], 李春涛;白英龙
因版权原因,仅展示原文概要,查看原文内容请购买。

logistics_等级变量_解释说明以及概述

logistics_等级变量_解释说明以及概述

logistics 等级变量解释说明以及概述1. 引言1.1 概述本文将探讨关于logistics等级变量的定义、解释以及概述。

在现代物流行业中,等级变量是一种常用的分析工具,用于衡量和描述不同物流要素之间的差异和优劣。

等级变量可以被应用到各个领域,在物流管理、供应链优化、运输规划等方面都具有重要作用。

1.2 文章结构本文主要分为五个部分:引言、等级变量的定义与解释、Logistics模型入门、等级变量与业务实践的关系分析以及结论与展望。

引言部分将对文章进行整体概述和提纲,为读者提供一个全面了解文章内容的框架。

1.3 目的本文旨在介绍和阐述logistics等级变量在物流行业中的重要性和应用。

通过对等级变量概念的界定以及其特点和应用领域的分析,读者将能够深入理解该概念,并了解它在Logistics模型中的使用方法以及如何解释和理解相关系数。

此外,本文还将通过实际案例研究,展示等级变量在物流行业中不同场景下的应用,并总结其作用和发展趋势。

希望通过本文的阐述,读者能够更全面地认识和应用等级变量,提升物流管理和优化决策的能力。

以上是“1. 引言”部分的简要介绍,下一部分将进一步深入探讨“2. 等级变量的定义与解释”,以便更好地理解该概念及其在物流领域中的应用。

2. 等级变量的定义与解释:等级变量是一种衡量或分类对象特征的变量。

它是基于一定的标准或规则对对象进行分组或排序,通常用来表示对象在某个属性上的不同水平或层次。

等级变量可以是有序的,也可以是无序的。

2.1 等级变量概念:等级变量指的是对某一属性进行评估、分类或排序后得到的结果。

例如,在物流行业中,我们可以使用等级变量来衡量货物运输速度、服务质量、安全性等属性。

这些等级变量可以分为多个水平,如快速、普通、慢速;高质量、中等质量、低质量;安全、一般安全、不安全等。

2.2 等级变量特点:(1)有序性:等级变量具有明显的顺序或大小关系,在不同水平之间存在着可比较性。

等级资料常用检验方法

等级资料常用检验方法

?等级资料的分析方法是否和 一般计数资料的检验方法相同呢? 等级资料的分析应该选用什么方法?
实例1 考察硝苯地平治疗老年性支气管炎的疗效,治疗组 60人,用硝苯地平治疗,对照组58人,常规治疗,两组患 者的性别、年龄、病程无显著性差异,治疗结果见表1。
表 1 治疗组与对照组疗效比较
例数 组别 例数
以频数格式录入数据,即相同的观测值只录入 一次,另加一个频数变量(count)用于记录 该数值共出现的次数。因此我们使用此过程:
2、卡方检验
分析结果:
Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases
Kendall等级相关意义:当一个变量的等级为标准时, 另一个变量的等级与它不一致的情况(可分析两个以 及多个变量间的等级相关性)。
Spearman等级相关公式:
rs = 1-
6d 2
n(n 1)
n:总例数 d:每一对值的等级差
Spearman 等 级 相 关 意 义 : 两 个 变 量 之 间的等级相关性。
实例4 在某药治疗闭塞性动脉炎的临床试验中,治疗26例下肢溃疡 的病人溃疡改善情况见表6,评价该药有无促进溃疡愈合的作用。
表 6 溃疡改善程度(例数)
溃疡改善程度 溃疡面积不变 溃疡面积缩小≤20% 溃疡面积缩小 20%~50% 溃疡面积缩小≥50% 完全治愈 合计
第1周 14 2 8 2 0 26
Asymp. Sig.
RESULT 6.528 2 .038
结论:按α=0.05的检验水平,三组间差异有统计学意义。
注意:
计算结果中显示的χ2值并不是χ2检 验,只是Kruskal-Wallis Test的检验统计 量H,此时近似χ2分布,所以按χ2分布 的近似值来确定概率,它的自由度υ = 组数-1。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
* :南 方 医 科 大 学 公 共 卫 生 与 热 带 医 学 学 院 课 外 科 研 项 目 ( GWXS20110211) 1. 贵阳市南明区城北片区经济发展局(550002) 2. 南方医科大学公共卫生与热带医学学院生物统计学系(510515) △通信作者:安胜利,E-mail:ASL0418@ 126. com
极差四等分( 其次)
AUC
0. 7737154 0. 7549407 0. 7025692 0. 6808300 0. 7371542 0. 7371542 0. 7124506 0. 6739130 0. 7519763 0. 7480237
【Abstract】 Objective Through Logistic regression analysis simulation,to obtain correctly dividing method that transform Quantitative variable into Categorical variable under different circumstances. And finally forming systemic,comprehensive dividing suggestion through tables or graphs w hich facilitate interpreting. Methods Calculating the areas under the ROC curve ( AUC) and AIC of different dividing methods under three kinds of distribution by the R programming language simulation. Then comparing methods’advantages and disadvantages. Results Variables w ith different distribution should be subject to different dividing methods,w hich can affect the model fit. Conclusion Under the specific distribution,w e can obtain the best and fixed dividing method. While for other distributions,AUC and AIC of different dividing methods should be calculated. We can choose the better one by comparing the tw o indexes.
2. 因变量
为了保证原始数据中自变量与因变量经 logistic 回
归分析具有一定的联系,因变量可利用自变量通过公式
产生;鉴于因变量 0、1 的分布在实际数据中存在不同,
我们通过调整 OR 值来改变 Y 的分布。方法如下:
利用 logistic 回归模型计算阳性事件发生概率 P :
P=
1
(1)
1 + exp[- ( β0 + β1 X1 + β2 X2 + … + βmXm + e) ]
·560·
Chinese Journal of Health Statistics,Aug 2014,Vol. 31,No. 4
式中 e 为随机误差,服从标准正态分布。 假定 β0 为 任 意 已 知 常 数,如 0. 2,取 βm 为 log ( OR) ,并取多种 OR 值情况( 如 OR = 1. 5 ~ 5,以 0. 5 为间隔) 。当确定某 OR 值后,便可通过上式计算相应 的阳性事件发生概率 P,对应的因变量 Y 则由 0-1 二 项分布函数计算得到。 3. 确定样本含量 对上述产生的数据逐步增加样本含量,并观察自 变量转换后,其与因变量的关系变化,当这种关系稳定 时所对应的样本含量即为所需模拟的样本含量大小。 经测试,样本量为 1500 时满足上述要求。 4. 自变量分级方法 共考虑三种分级数,即二级、三级、四级分类。 (1) 二级分类 均数分级:以均数为分割点分为两级;中位数分 级:以中位数为分割点分为两级;ROC 分级:对自变量 与因变量做 ROC 曲线,取约登指数最大的自变量值为 分割点。分别赋为 0、1。 (2) 三级分类 百分位三等分:将自变量从小到大排序,依据总的 样本量大致平均分为三级,各级观察单位数约占总样 本量的 33% ;四分位数分级:分别以 25% 与 75% 分位 数为分割点,分为三级;极差三等分分级:将自变量最 大值减最小值所得区间平均分为三份;按照x珋± s 或 x珋 ± 2s 分为三级。分别赋为 0、1、2。
中国卫生统计 2014 年 8 月第 31 卷第 4 期
·559·
定量变量的分级方法对 logistic 模型影响的研究*
周凌峰1 安胜利2△
【提 要】 目的 获得 logistic 回归模型将定量自变量转化为等级变量的正确划分方法。方法 R 语言编程模拟计 算三种分布下不同分级方法所得 ROC 曲线下面积、logistic 回归 AIC 信息量,并比较优劣。结果 服从不同的分布的自变 量,其分级方法不同,拟合效果也不同。结论 特定分布下,可得到相对固定的较优分级方法。非特定分布下,通过计算 各分级方法的 ROC 曲线下面积以及 AIC 信息量,并比较指标优劣可获得较优分级方法。
OR 值 < 3 时,AIC 信息量曲线略有交叉,OR > 3 后百
2. 实例分级验证
分位数四等分分级 AIC 略优于极差四等分,但二者区
首先,确定该定量变量( neu9) 的分布,经 Kolmog-
别不大。
orov-Smirnov 以及 Shapiro-Wilk 正态性检验,P 值均大
实例考核
于 0. 10,可以近似看作正态分布。经 logistic 回归分析, 有统计学意义,并计算出该变量 OR 值为 1. 1,假定欲将
【关键词】 定量变量分级 logistic 回归 ROC AIC
A Study of the Influence of Dividing Methods of Quantitative Variable on Logistic Model
Zhou Lingfeng,An Shengli( Department of Bio-Statistics,School of Public Health and Tropical Medicine,Southern Medical University (510515) ,G uangzhou)
偏态分布时,首选 ROC 分级,ห้องสมุดไป่ตู้余方法 AUC 和 在交叉,结果略不稳定。
中国卫生统计 2014 年 8 月第 31 卷第 4 期
·561·
图 2 正态分布分三级
偏态时,均数 ± 标准差不宜作为统计描述指标,因
某研究在各个时间点均获得 57 名病人的各指标
此不做模拟,从优到劣的分级方法顺序为百分位三等 结果,如 neu,wbc,crp 等,并以记录病人是否发生了
(3) 四级分类 百分位四等分:将自变量从小到大排序,并依据总 的样本量平均分为四级,各级观察单位数约占总样本 量的 25% ;极差四等分分级:自变量最大值减最小值 所得区间平均分为四份,分别赋为 0、1、2、3。 5. 评价指标 从现行的一些研究来看,学者们[6 - 9]较为关注两 个方面,一方面是分级后的自变量对因变量的预测准 确程度;另一方面,分级后变量在回归中的拟合效果。 对于前者,人们普遍采用 ROC 曲线下面积 AUC[10]来 衡量其优劣程度,本研究亦采用 AUC 作为其中一种 评价指 标。 在 第 二 方 面,本 研 究 拟 采 用 AIC 信 息 量[11]。 在各种 参 数 条 件 下 ( OR = 1. 5 ~ 5,以 0. 5 为 间 隔) ,对模拟数据 ( 分别对不分级、各分级情形) 计算 AUC,同时再进行 logistic 回归计算 AIC 信息量,重复 模拟 1000 次,并计算上述两指标的平均值及标准差。 6. 模拟次数确定 不同分布、不同 OR 值下,当 AUC、AIC 均值达到 稳定时所对应的模拟次数即为所需模拟的总次数。经 过测试,本研究各种情况下模拟次数取 1000 次即可达 到稳定。
【Key words】 Division of quantitative variable;Logistic regression;ROC;AIC
logistic 回归分析是用于筛选影响因素及建立预 测模型的最常用的方法之一,它的综合预报效果具有 很好的稳健性和非模糊性[1 - 2]。在 logistic 回归分析 中,常会用到三种自变量类型:定量变量、等级变量及 分类变量,为使得 OR 值具有更明确的临床意义或便 于预测模型的实际应用,研究者[3 - 5]常将有统计学意 义的定量变量转化为两个或两个以上等级,并赋予相 应的分数。但目前等级划分方法大多是由研究者主观 决定,若分界点选择不当,其模型预测效果便会受到影 响,甚至会影响到研究结论的正确性。本研究拟在计 算机上以常用的非条件二分类 logistic 回归分析为例 进行模拟研究,在不同的参数条件下,对有统计学意义 的自变量进行不同数量、不同方式的等级划分,建立预 测模型,考察其预测效果的变化规律,并对所得结论以 实例进行考核,以期发现各种参数条件下合理的等级 划分方法。为建立更准确、实用的 logistic 预测模型提 供可靠的变量转化依据。
方法
为了便于解释,本研究将模拟数据简化设计为仅
有一个自变量 X ( 连续变量) 及一个因变量 Y (0-1 变
量) ,然后观测各种转换方法对预测模型的影响规律,
进而延伸说明多个自变量情况下该指标的变化状况。
1. 自变量
利用 R 语言,模拟产生单个自变量,考虑三种分
相关文档
最新文档