影响戒烟成功因素的分析--数学建模

合集下载

影响戒烟成功因素的分析--数学建模

影响戒烟成功因素的分析--数学建模

影响戒烟成功因素的分析高利(理学院11信科1班)摘要:为了分析影响戒烟成功的主要因素,原题提供了包括234人的调查数据。

涉及的影响因素包括年龄、性别、每日抽烟只数、CO浓度和调整的CO浓度。

本文就是以234人的调查数据为基础,对数据进行处理和分析,利用计算机编程和数学模型的方法,探寻影响戒烟成功的主要因素,并在最后根据文本的相关研究结果对广大烟民提出建议。

问题一主要分析了不同年龄和不同性别的累加发病率分布情况,主要利用计算机编程,对原始数据进行分组、筛选和统计,并作出分布直方图。

经过分析得知男性的累加发病率为84.55%,女性的累加发病率为87.10%,略高于男性,青年人(18---40岁)累加发病率最高,为87.72%,中年人(41---65岁)次之,为84.68%,老年人(66岁)以后很少,为77.78%。

问题二是判断年龄、性别、每日抽烟支数、调整的CO浓度等因素哪些对戒烟时间有影响,并要求给出定量的分析。

针对此问题,本文只取戒烟天数小于365天的被调查者为研究对象,并把原始数据中空缺的数据行排除,首先画出个因素与戒烟天数的散点图,直接观察数据间的关系,再通过计算两组数据的相关,比较其绝对值的大小,定量的给个影响因素对戒烟天数的影响程度初系数ρxy步排序,处理结果为影响程度有大到小排序:CO浓度,每日抽烟支数,调整CO 浓度,年龄。

问题三利用建立适当的数学模型,讨论影响戒烟成功的主要因数,并对模型进行可靠性分析。

在这里主要建立了统计回归模型。

由于原始数据散点图比较散乱,不容易直接看出两组数据间的关系,也不方便直接处理,所以首先对原始数据做了预处理,等距分组,并求出每组戒烟天数的均值,以减小数据的波动,方便观察数据之间的宏观关系,再利用处理后的数据建模分析,通过建立统计回归模型对处理后的数据做了二次函数拟合,再进行回归分析,比较回归方程的决定系数R2等,进一步量化和判断不同因素对戒烟成功影响程度的大小,得到的结论是每天抽烟支数和CO浓度是影响戒烟成功的最主要因素。

2014年学校数学建模模拟赛(戒烟)

2014年学校数学建模模拟赛(戒烟)

分析:由图表分析可得,距离抽最后一支烟的分钟数为 100-150 之间时累计发病率最高, 在 100-150 分钟段之前累积发病率逐渐升高,在其之后,累积发病率显著降低。
5.1.2 各因素交互作用影响下的累加发病率分布情况
对于之前的模型分析,我们只是考虑到单个因素对累加发病率的影响,并没有考虑到各 个因素之间可能会有交互作用,为此,我们利用 spss 的双因素相关性分析来分析每个因素 之间的相关性,并在此分析各因素之间的交互作用对累加发病率的影响,从而作出相关分 布图。 spss 的双因素相关性分析结果如下表 7 所示: 表7 x1 Pearson 相关 性 显著性 (双侧) N 1 双因素相关性分析表 相关性 x2 x4 x3 -.052 .476 193 .115 .111 193
我们参赛选择的题号是(从 A/B/C/D 中选择一项填写) : 我们的参赛报名号为(如果赛区设置报名号的话) : 所属学校(请填写完整的全名) : 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 2014 年
B
8 月
27 日
赛区评阅编号(由赛区组委会评阅前进行编号):
6
分析:通过图表可得,20-30 岁抽烟支数在 10-20 支之间累积发病率最高,30-70 岁抽 烟支数在 20-30 支之间累计发病率最高, 70-80 岁抽烟支数在 10-20 支之间累计发病率最高, 综合观察可知 30-40 岁抽烟支数在 20-30 支之间累计发病率最高。 b. 不同性别下每日抽烟支数对累加发病率的影响
分析:有图表可以看出,累加发病率在 CO 浓度为 150-300 段达到最高,并在此之后, 随着 CO 浓度段的增加,累加发病率反而逐渐降低,累加发病率在 CO 浓度超过 750 之后累 加发病率极低, 这可能是因为 CO 浓度大于 300 的人数逐渐减少, 超过 750 的人数极少导致。

关于吸烟的数学题

关于吸烟的数学题

关于吸烟的数学题
关于吸烟的数学题指的是以吸烟为背景或主题的数学题目,这类题目通常涉及到数学建模、统计分析或概率计算等方面。

以下是2道关于吸烟的数学题的示例:
1.吸烟对健康的危害程度分析:
题目:吸烟会对人体健康产生负面影响,为了评估吸烟对健康的危害程度,我们收集了以下数据:
吸烟者患肺癌的比例:10%
非吸烟者患肺癌的比例:2%
请用数学模型来评估吸烟对健康的危害程度。

解析:这个问题涉及到比较两组数据,可以建立比例或比例差模型来进行计算和比较。

我们可以根据已知的数据,计算吸烟者患肺癌的概率是不吸烟者的多少倍,以此评估吸烟对健康的危害程度。

2.戒烟的最佳时机:
题目:一个吸烟者想知道什么时候戒烟是最有利的。

他找到了一组数据,显示吸烟量与患肺癌风险之间的关系:
每天吸烟1-5支,患肺癌的风险为1%
每天吸烟6-10支,患肺癌的风险为2%
每天吸烟11-20支,患肺癌的风险为3%
每天吸烟21支以上,患肺癌的风险为4%
请用数学模型来分析何时戒烟是最有利的。

解析:这个问题涉及到逻辑回归或决策树算法的应用,可以根据给定的数据预测不同情况下患肺癌的风险,从而确定何时戒烟是最有利的。

通过建立数学模型,我们可以分析出在什么情况下戒烟可以显著降低患肺癌的风险。

总结来说,关于吸烟的数学题是指以吸烟为背景或主题的数学题目,这类题目通常涉及到数学建模、统计分析或概率计算等方面。

通过解决这类题目,学生可以更好地理解吸烟对健康的危害程度以及何时戒烟是最有利的。

吸烟者戒烟行为的影响因素分析实验报告

吸烟者戒烟行为的影响因素分析实验报告

吸烟者戒烟行为的影响因素分析实验报告一、引言吸烟对健康的危害已经被广泛认知,然而戒烟对于许多吸烟者来说并非易事。

为了深入了解影响吸烟者戒烟行为的因素,本实验进行了一系列的研究和分析。

二、实验目的本实验旨在探究影响吸烟者戒烟的各种因素,为制定更有效的戒烟干预措施提供依据。

三、实验对象与方法(一)实验对象选取了不同年龄、性别、职业、吸烟年限和吸烟量的吸烟者共 500 名作为研究对象。

(二)实验方法1、问卷调查设计了详细的问卷,内容包括个人基本信息、吸烟史、戒烟意愿、戒烟尝试经历、家庭和社会环境等方面。

2、访谈对部分吸烟者进行了面对面的访谈,深入了解他们对戒烟的看法和面临的困难。

四、实验结果与分析(一)个人因素1、年龄较年轻的吸烟者相对于年长的吸烟者,戒烟意愿更强。

可能是因为年轻人更关注自身健康,对未来的生活质量有更高的期望。

2、性别女性吸烟者的戒烟意愿普遍高于男性。

这可能与女性对美容和健康的关注度较高有关。

3、健康状况患有与吸烟相关疾病(如呼吸系统疾病、心血管疾病)的吸烟者,戒烟意愿明显增强。

(二)吸烟习惯1、吸烟年限吸烟年限越长,戒烟难度越大。

长期的吸烟习惯使得身体对尼古丁产生更强的依赖。

2、吸烟量吸烟量较大的吸烟者,戒烟过程中面临的生理和心理挑战更多,戒烟难度相应增加。

(三)心理因素1、自我效能感对自己能够成功戒烟有信心的吸烟者,更有可能采取实际的戒烟行动。

2、戒烟动机出于自身健康考虑、家人的期望或经济压力等强烈动机的吸烟者,戒烟的决心更大。

(四)家庭和社会环境1、家庭支持家庭成员的鼓励和监督,对吸烟者的戒烟行为有积极的促进作用。

2、社交圈子身边朋友和同事中有较多不吸烟者,或者社交环境对吸烟持负面态度,有助于吸烟者产生戒烟的想法并付诸实践。

(五)戒烟方法和资源1、专业帮助接受过戒烟咨询、药物治疗等专业帮助的吸烟者,戒烟成功率相对较高。

2、替代行为在戒烟过程中,能够找到有效的替代行为(如运动、咀嚼口香糖)来缓解烟瘾,有助于提高戒烟的成功率。

基于IMB模型的江苏省青少年吸烟预防行为影响因素结构方程模型分析

基于IMB模型的江苏省青少年吸烟预防行为影响因素结构方程模型分析
预 ,促使 青少年吸烟预 防行 为的发生。 【关键词l 青少年 吸烟预防行为 影响因素 结构方程模型
目前 ,烟草 危 害 已成 为 我 国重要 的公 共卫 生 问题 。 预 防控 制 中心根 据 我 国 国情 增加 了部 分 问题 形成 最终
调 查显 示 ,我 国每年 有 近 136.6万人 死 于 吸 烟 相 关疾 问卷 ,最终 问卷 通 过 了 GYTS调 查 问卷 审 查 委 员会 的
病 ,其 中超 过 10万 人 死 于 二手 烟暴 露 ¨ ,给 家 庭 和 社 批 准 。
会带来沉重的疾病和经济负担 。青少年好 奇心强 ,从
3.调查 内容 问卷 内容 包 括 :(1)性 别 、年 龄 、年
众心理 明显 ,缺乏对长期吸烟导致慢性健康危 害的认 级等 一 般人 口学 特 征 ;(2)青 少 年 的 吸 烟 及 二 手 烟 暴 知 ,并 且 由于尼古 丁 的致 瘾 性 ,一 旦 开 始 吸 烟 ,大 部 分 露情 况 ;(3)青少 年控 烟 的知识 、态 度情 况 等 。
查 ,首次 建立 青 少年 吸烟 预 防行 为结 构方 程模 型 ,阐明 信息 、动 机 以及行 为 技 巧 各 个 变 量 间 的关 系并 探 讨 青
结 果
少 年吸 烟 预防行 为 的 影 响 因 素 ,为 制 定 青 少 年 控 烟 策
1.基 本 情 况 共 发放 5702份调 查 问 卷 ,回 卷 5697份 ,有 效 回收 率 99.9l%。其 中,男 生
资料 与方 法
3083人 (54.1% ),女 生 2614人 (45.9% );城 市 学 生 2289人 (40.2% ),农 村学 生 3408人 (59.8% );初 一 学
1.资料来 源 选 取 2013年 9月 一11月 在江 苏 省 生 1896人 (33.3% ),初 二 学 生 1949人 (34.2% ),初

戒烟影响因素分析模型与实证研究

戒烟影响因素分析模型与实证研究

戒烟影响因素分析模型与实证研究戒烟影响因素分析模型与实证研究【摘要】目的:探讨影响戒烟成功的主要因素,以此引起烟民对戒烟的重视,从而成功从根本上进行戒烟。

方法:使用偏相关分析、多元线性回归、t检验、因子分析等方法,分别构建了多元线性回归、因子分析等模型,使用EXCEL、MATLAB、SPSS 等软件处理数据和编程,在此根底上建立多元回归模型而后进行评价。

结果:多元线性回归模型说明了各个影响因素与戒烟成功之间的定量的关系,因子分析模型阐述了影响戒烟成功的主要因素。

结论:通过建立的多元回归模型,找出了各个影响因素对戒烟的定量影响关系,同时因子分析得出了每日抽烟支数、CO浓度和调整的CO浓度就是影响戒烟成功的主要因素,故而降低抽烟数量可以有效地进行戒烟。

【关键词】戒烟影响因素评价因子分析吸烟有害健康,不仅仅危害自身健康,尤其是周围被迫吸收二手烟的人群,他们的身心都会被受到伤害。

目前全世界约有11亿吸烟者,其中70%以上的烟民分布在开展中国家。

而作为最大的开展中国家,中国是全球最大的卷烟生产国和消费国,中国吸烟人数占世界吸烟者总数的近30%,居首位,我国每年吸烟导致的死亡人数超过100万,如此现状不加改变,到2021年,我国归因于吸烟的死亡人数将上升至200万,占总死亡的比重将上升33%。

同时,我国每年还有10万人死于二手烟。

近年来我国虽然先后在154个地区颁发了禁止吸烟的规定,但是效果甚微。

为此,如何帮助相关人士摆脱烟瘾的困扰也就成为一个重要的研究课题。

从现有的研究结果看,国外研究显示,吸烟者戒烟与吸烟者的人口学特征、戒烟的决心、尼古丁依赖程度和既往的戒烟经历有关。

国内的研究相对较少,李恂【8】研究的吸烟者自身意愿因素,文其岭的研究中说明戒烟受人们所处的社会环境的因素的影响,导致戒烟成功率较低,有调查显示认为吸烟者的知识水平与每日抽烟支数有关。

前人的研究成果给予了研究重要的参考,但是本文运用了同前人不同的定量分析方法,并运用因子分析法使结果更加准确科学。

影响戒烟成功因素的分析

影响戒烟成功因素的分析

【摘要】目的了解门诊戒烟求助者戒烟率,分析戒烟成功的影响因素,为戒烟门诊提供有效干预的措施提供依据。

方法对门诊戒烟求助者首次求助12月后进行随访,调查求助者年龄、婚姻、受教育程度、吸烟基本情况和社会支持等在戒烟成功与否之间的差异。

结果门诊戒烟求助者总体戒烟成功率为40.85%,低年龄组、吸烟量少、烟龄短、首次戒烟者的成功率较高(P<0.05),戒烟成功组的社会支持得分明显高于戒烟未成功组,而婚姻状况、教育程度、是否采用药物干预对戒烟成功率没有影响(P>0.05)。

结论医务人员对不同的人群要提供不同的戒烟策略,提高求助者各种社会支持有助于提高戒烟成功率。

【关键词】戒烟;随访;影响因素;社会支持烟草危害是当今世界一个重要的公共卫生问题,吸烟是导致肺癌、慢性支气管炎、冠心病、脑卒中等多种可以预防性疾病发生和死亡的主要原因之一[1]。

据调查,2010年我国15岁及以上的男性总吸烟率为62.8%、现在吸烟率为52.9%,男性吸烟者总数达3.4亿人,现在吸烟者2.9亿人[2]。

同时愿意戒烟和戒烟水平近年来有所上升,但复吸比例较高,戒烟成功率极低[2]。

因此研究戒烟及戒烟成功的影响因素,对于减少健康危险因素、提高公众的健康水平具有重要的意义。

本文通过分析总结我院戒烟门诊戒烟求助者戒烟成功的影响因素,以期为更加有效开展戒烟门诊提供理论依据。

1对象与方法1.1调查对象2008年3月-2010年3月在我院戒烟门诊求助者,在首次求助后的12个月后门诊随访或者电话随访的213名求助者,全部为男性,平均年龄为43.2±10.7岁,戒烟成功的判断标准为持续4周不吸烟且电话随访时仍然没有吸烟者。

1.2调查内容调查内容包括年龄、每日吸烟量、吸烟年限、教育程度、婚姻状况、社会支持等。

社会支持采用肖水源设计的社会支持评定量表(socialscience research solutions,SSRS),量表共10个条目,分3个维度即客观支持、主观支持和对支持的利用度,得分越高者表明其得到的社会支持越多[3]。

数学建模 戒烟问题

数学建模 戒烟问题

2014高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料我赛):2014高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):摘要本文针对戒烟和各种相关因素关系,解决影响戒烟成功的因素有哪些的问题,我们利用Excel,spss,Matlab软件对相关数据进行分析,利用主成分分析法、层次分析法建立模型,并进行可靠性检验,得到影响戒烟成功的重要因素,对有志于戒烟的人士提供戒烟对策和建议。

针对问题一,首先观察数据发现数据残缺,运用spss中缺失值替换的线性插值法将缺失数据补充完整。

然后求出在不同年龄段、不同性别、不同调整CO浓度下、不同每日抽烟数的条件下的发病累加率,并运用Excel,Matlab,Spss的等软件做出图像,结合图像对发病累加率的分布进行分析,得到累加发病率的基本趋势为随着每日抽烟数和调整CO浓度的增加而提高,男性比女性的累加发病率略低。

浓yy一、问题的重述众所周知,吸烟不仅危害自身健康,而且由此引起的被动吸烟更是危害公众身心健康的主要原因。

为此,如何帮助相关人士摆脱烟瘾的困扰也就成为一个重要的研究课题。

本文研究数据涉及234人,他们都自愿表示戒烟但还未戒烟。

在他们戒烟的这一天,测量了每个人的CO(一氧化碳)水平并记下他们抽最后一支烟到CO测定时间.。

CO的水平提供了一个他们先前抽烟数量的客观指标,但其值也受到抽最后一支烟的时间的影响,因此抽最后一支烟的时间可以用来调整CO的水平。

记录下研究对象的性别、年龄及自述每日抽烟支数。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

影响戒烟成功因素的分析高利(理学院11信科1班)摘要:为了分析影响戒烟成功的主要因素,原题提供了包括234人的调查数据。

涉及的影响因素包括年龄、性别、每日抽烟只数、CO浓度和调整的CO浓度。

本文就是以234人的调查数据为基础,对数据进行处理和分析,利用计算机编程和数学模型的方法,探寻影响戒烟成功的主要因素,并在最后根据文本的相关研究结果对广大烟民提出建议。

问题一主要分析了不同年龄和不同性别的累加发病率分布情况,主要利用计算机编程,对原始数据进行分组、筛选和统计,并作出分布直方图。

经过分析得知男性的累加发病率为84.55%,女性的累加发病率为87.10%,略高于男性,青年人(18---40岁)累加发病率最高,为87.72%,中年人(41---65岁)次之,为84.68%,老年人(66岁)以后很少,为77.78%。

问题二是判断年龄、性别、每日抽烟支数、调整的CO浓度等因素哪些对戒烟时间有影响,并要求给出定量的分析。

针对此问题,本文只取戒烟天数小于365天的被调查者为研究对象,并把原始数据中空缺的数据行排除,首先画出个因素与戒烟天数的散点图,直接观察数据间的关系,再通过计算两组数据的相关,比较其绝对值的大小,定量的给个影响因素对戒烟天数的影响程度初系数ρxy步排序,处理结果为影响程度有大到小排序:CO浓度,每日抽烟支数,调整CO 浓度,年龄。

问题三利用建立适当的数学模型,讨论影响戒烟成功的主要因数,并对模型进行可靠性分析。

在这里主要建立了统计回归模型。

由于原始数据散点图比较散乱,不容易直接看出两组数据间的关系,也不方便直接处理,所以首先对原始数据做了预处理,等距分组,并求出每组戒烟天数的均值,以减小数据的波动,方便观察数据之间的宏观关系,再利用处理后的数据建模分析,通过建立统计回归模型对处理后的数据做了二次函数拟合,再进行回归分析,比较回归方程的决定系数R2等,进一步量化和判断不同因素对戒烟成功影响程度的大小,得到的结论是每天抽烟支数和CO浓度是影响戒烟成功的最主要因素。

关键词:累加发病率;相关系数;分组平均;二次函数拟合;Mathematica。

1问题的提出吸烟不仅危害自身健康,而且由此引起的被动吸烟更是危害公众身心健康的主要原因,因此为了帮助烟民尽快摆脱烟瘾的困扰,有必要深入调查分析一下影响戒烟成功的主要因素。

影响戒烟成功的因素很多,可能的因素包括年龄、性别、每日抽烟的支数、烟民体内的CO浓度等,但影响烟民戒烟成功的主要因素有哪些?各个因素的影响程度如何?对于有意愿戒烟的烟民如何更好地把握这些因素,更有效的戒烟?原题给出了涉及234人的相关调查数据,用以分析影响戒烟成功的主要因素,本文主要以这些数据为依据,进行相关的处理与分析。

2问题的分析2.1问题一由题意知,累加发病率是原吸烟者戒烟一段时间后又再次吸烟的比例。

前面假设原戒烟者在研究截止时间内没有再吸烟为戒烟成功,即在研究期限一年内如果再吸烟,戒烟失败,为再犯者。

对于问题一,把各因素的调查数据进行分组。

如把年龄分成不同的年龄段,以上述判断标准对每个年龄段分别计算相应的累加发病率,并作出分布直方图,进行比较。

2.2问题二原题定时,戒烟天数是从0到他(她)退出戒烟或研究截止时间的天数,所以数据中戒烟天数是365天的戒烟者,其戒烟天数是不确定的。

对于问题二,本文采取把戒烟天数是365天的数据排除,只对戒烟天数小于365天的数据进行处理和分析。

首先通过编程对数据进行筛选,并可视化——以各影响因素的数据值为横坐标,以纵坐标为戒烟天数,作出散点图。

再根据散点图分析影响因素与戒烟天数之间的关系。

至于定量分析,通过计算两组数据的相关系数ρ,由相关XY系数ρ来衡量影响因素与戒烟天数之间关系的大小。

XY2.3问题三对于问题三,本文主要采用了统计回归模型,在处理问题二的时候发现,各影响因素与戒烟天数之间的关系并不非常的明显,散点图不是很集中,不便于直接处理。

本文采取的方案是在建立模型之前先对原始数据做一个转化,首先利用Mathematica编制一个统一的数据处理程序,把每个可能影响因素都做等距分组,分组数在程序调用时输入,在对每一组的所有戒烟天数求平均值,得到一个统计平均的结果,这样可以有效的减小数据的波动,有利于看清数据之间的关系,对于关系比较明显的影响因素,建立统计回归模型,进行回归分析,深入探讨各影响因素对戒烟天数及戒烟成功的影响的大小。

3条件的假设(1)假设在研究截止时间(一年)内没有再吸烟(戒烟天数为365天)的原戒烟者戒烟成功。

(2)假设原烟民戒烟的可信度是很低,有些调查数据可能不真实,在数据处理的过程中给予以排除。

(3)假定全部被调查者中没有人中途退出研究。

4符号的约定:年龄;XA:性别(1表示男,2表示女);XG:每日抽烟支数;XCigX:CO浓度;CO:调整的CO浓度;XLCY:戒烟天数;ρXY:两组数据的相关系数。

5模型的建立与求解5.1问题一为了直观得了解所有234人的总体戒烟情况,作出如下散点图:由图1看出,被调查的234人中大多数经过很短时间后又再次抽烟,只有少数人戒烟天数达到365天,只占总人数的14.10%,本文假设在研究截止时间内没有再抽烟的烟民戒烟成功,所以累加发病率的具体定义为戒烟天数小于365的烟民数量占研究样本总人数的比例,据此,本文分别对不同年龄段和不同性别的累加发病率进行计算和比较。

不同性别。

经过简单的统计计算,可以得到不同性别的累加发病率的分布情况:可以发现男性的累加发病率为84.55%,女性的累加发病率为87.10%,略高于男性。

不同年龄段。

根据中国年龄分段标准,18--40岁为青年人,41--65岁为中年人,66岁以后为老年人,本文按此把所有被调查者的年龄分为三段。

经过编程统计计算,可以得到不同年龄段的累加发病率的分布情况:可以发现,青年人累加发病率最高,为87.72%,中年人次之,为84.68%,老年人最少,为77.78%。

5.2问题二首先对数据进行筛选。

原始数据中有部分空缺,把有空缺的被调查者的数据删除。

由上面分析,戒烟天数是365天的戒烟者,其戒烟天数是不确定的,也应该给予删除。

然后作出影响因素与戒烟天数的数据散点图,如图4。

数据分析。

直接观察散点图,发现每个影响因素与戒烟天数之间的关系都不是非常明显。

假设影响因素与戒烟天数之间如果存在线性关系或是其他某种单调关系,对该影响因素的深入分析,对戒烟者成功戒烟是有帮助的。

为了定量分析不同影响因素对戒烟天数影响程度的大小,本文采取相关系数ρXY 分析。

表1不同影响因素与戒烟天数的相关系数相关系数是反映两组数据线性相关性的量,其绝对值越接近1,两组数据的线性相关性越大,其符号反映的是两组数据相关性的正负。

由表1发现四中影响因素与戒烟天数都是负相关,影响程度由大到小排序为:CO 浓度,每日抽烟支数,调整CO 浓度,年龄。

对于性别因素。

因为XG 的值只有两种,所以只比较不同性别戒烟天数的平均值,经过计算可知,男性别戒烟天数平均为27天,女性戒烟天数平均为39天,高于男性。

X A X Cig X LC X CO ρXY-0.04689-0.22878-0.10792-0.277635.3问题三经过对问题二的分析发现,各影响因素与戒烟天数之间的关系并不非常明显,相关性都比较小。

观察散点图,数据比较分散,波动比较大,不方便与直接处理,所以本文的思路是先对原始数据进行预处理,采用分段区求和取平均的方案。

按影响因素的值等距分段,再计算每一段所对应戒烟天数的平均值,这样做的好处是能得到一个统计平均的结果,有利于减小数据的波动,可以更好地看清楚数据之间的关系,最后对所有得到的数据进行建模分析系。

程序:Indata=Import[“indata.xls”][[1]];daD={};Do[AppendTo[daD,{indata[[i,1]],indata[[i,8]]}],{i,2,Length[indata]}];Show[ListPlot[daD,AspectRatio->0.5,Filling->Axis,ImageSize->500],FrameLabel->{Style[“ID”,12],Style[“Y:戒烟天数”,12]},Frame->True] 生成表1下面分析一下算法。

自定义函数seperatefun[]有四个输入变量,其中data 为原始数据,i为所研究的影响因素在原始数据中对应的列,start用于调整扫描的起始位置,m是打算分的组数。

具体步骤如下:(1)提取影响因素的数据向量,计算最大值和最小值;(2)根据组数m和最大值和最小值计算组距;(3)通过一层循环,分别计算每组所对应戒烟天数的平均值,并以每组的中间点为代表点(4)每一次循环把代表点和相应的平均值存储在列表中,退出循环后,返回结果列表。

这里m取为20组,把年龄、每天抽烟支数、调整CO浓度、CO浓度四种影响因素的数据处理后,即可发现每天抽烟支数和CO浓度与戒烟天数存在者较为明显的线性关系,而年龄-戒烟天数和调整CO浓度-戒烟天数散点图仍旧比较分散,这就是可以初步得知每天抽烟支数和CO浓度对戒烟天数的影响比较大。

为了更进一步的分析这两个因素对戒烟天数的影响的成都读,本文利用统计分析回归模型,对数据进行线性拟合(二次函数拟合)和回归分析。

根据散点图的特点,两组因素都用二次函数拟合:Y=β0+β1XCig+β2X2Cig+εY=β0+β1XCO+β2X2CO+ε利用Mathematica中的LinearModelFit[]函数,即可使模型得解。

函数代码:Partfun[data_,i_,start_,m_]:=Module[{dapart={},j,tran,min,max,dat,n},dat=Table[data[[l,i]],{l,start,Length[data]}];Min=Min[dat];max=Max[dat];If[IntegerQ[m]&&0<=max-min,n=(max-min)/m,N=1];For[j=0,min+j*n<min+(j+1)*n,AppendTo[tran,data[[1,8]]]],{1,start,Length[data]}];If[Length[tran]!=0,AppendTo[dapart,min+j*n+n/2,Mean[tran]}]]];Dapart]表2.每天抽烟支数-戒烟天数回归分析参数参数估计值参数置信区间β099.0969 [61.6743,136.52]β1-5.39584 [-9.81353,-0.978157] β20.082034 [-0.0289668,0.193035] R2=0.761314 F=25.9115 P=0.000653633表3.CO浓度-戒烟天数回归分析参数参数估计值参数置信区间β089.882 [62.605,117.159]β1-0.293954 [-0.460374,-0.127535]β20.00025613 [0.0000343839,0.000477875]R2=0.695233 F=28.1568 P=0.0000879904从表2和表3的回归分析可知每天抽烟支数对应的决定系数R2比CO浓度对应的决定系数R2稍小,而且每天抽烟支数对应的参数置信区间比CO浓度对应的参数置信区间总体上要短,这说明每天抽烟支数与抽烟天数的关系比戒烟者体内CO浓度与戒烟天数的关系稍强。

相关文档
最新文档