两组数据分布的一致性分析及其应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
按 递增排 序为 W x^≤ w x1≤ … ≤ 妇 。X。,Xt,
… X 是 排 序 后 {w )编 号 0,1,… , 一 1 的 一
个 排列 。
显然 ,最 理 想 的一 致 性 分 布 (互 惠关 系 、趋 同 )
是 :Xo一 0,Xl= l,… X J— l't~ l,即 。, l,… ,
的 匹配度呢 ?
w-l
∑( — )。
先考虑 构造 DL
i= 0
。 其
∑一[ L( V,z ‘ —I— )一f ‘] J
i荨 0
分子 是排序后 两组 数 据 编号 问的 差 异平 方 和 ,分 母
是最 大差异 平方 和 。它 可以反 映 2组 数据 分布 的差
128
L}● 长 春 工程 学 院学 报 (自然 科 学 版 )
本 文将对 这 一类 问 题 (2个任 意 总体 分 布 的 一 致 性 )给 出相 应 的归 一 化 的统 计 量 ,并对 这 一 统计 量 的性 质做 了严格 的论 证 ,为其 应 用 提供 了理 论依 据 。最 后 ,给 出几个应 用模 型 。
1 问 题
对 于来 自 2个一 维 总体 X、y的样 本 ,通 过不 同 的统 计 方法 ,可 以 分 析其 不 同 的相 关性 。计算 其 相 关 系数 pxY的统计 量 rxy,可 以反映 X与 y的线性 关 系 水 平 ;计 算 其 间 距 (欧 氏 距 离 、马 氏 距 离 、 Minkowski距离 等),可 以得 到 X 与 y 在 数量 上 的 相 近程 度 ;计 算 其 夹 角 余 弦 (力 学上 用 MAC)或 指 数 相似 系 数 ,可 以度 量样 本 问的相 似度 。
谷 照 升 ,刘 志 明 (-K春 工程学 院理学 院 ,长 春 130012)
摘 要 :对 2个 样本 数据分 布 的一致 性(高低 变 化的
一 致 程度 ),给 出 归一 化 统计 量—— 分 布 一致 水 平 ,
讨论 了其分 布规 律 与数 字特 征 ,并 给 出具体 的数 学
应 用模 型
是基 于 ,z个 观 测 点 的 2组 不 同属 性 或 指 标 的 观 测
值 。将 Z0,Z ..’Z.r。按 递增 方 式 排序 ,仍 记 为 Z0,
Z ,… ,Z,r1,即 Z。≤ Z1≤ Z2≤ … ≤ Z,r1.W 。, t,
… ,W,广 的角标作 同 步调 整 ,再 将 w。,w ”,w,广
但 分 布 的 内在 联 系 具 有多 样 性 ,有 时需 要考 证 的不是 2个分 布 间 的数 量关 系 ,而是 分 布 高 低 变化 的一致 程 度 ,即 X取 值变 大时 ,y的取值相 应 变大还 是 变 小 。互 抑 关 系 应 该是 此 消 彼 长 ,互 惠 (互助 )关 系则往 往 亦步 亦趋 ,同高 同 低 。本 文称这 种关 系为分 布 一致 水 平 ,或分 布趋 势 一 致 性 。例 如 ,在 水 质 分析 时 ,对 T1个 观 测点 的两 种污染 指标 总氮 、总磷 浓度采 样 ,得 到 总 氮 浓 度 CN===(Ncl,Nc2,Nc3,… ,Nc ), 总 磷 浓 度 一 (Pc1,Pc ,R ..,Pc )2 个 样 本 [1 ]。需 要 考 查 的是 :总 氮 、总 磷浓 度 分 布 是 否呈 现 出同高 同低 ;或 相 反 ,总 氮 浓度 越 高 ,总磷 浓 度越 低 ;还 是 二者 分布 上 相互 独 立 ,没 有 显 著 的关 联 。其 结 论 对 寻找 污 染 过 程 、污 染 源 、污 染机 理 有很 大 帮 助 。这 类 问题 很多 。例 如 ,同一 批 学 生 2门不 同课程
d 歹U
逆
异
水
平
(distribution difference leve1m) (分 q
布
趋序势 互
反)。下面 研究 DL 的概 率属性 。 有
数
>
3 预 备 定 理
∑岔
∞
∑口
6
一 n 6廿1一( )) -L +apb 一 apb抖f _( Ⅲ]+ l‘
墨墨 Q !: !
CN 22-1323/N
长 春 工 程 学 院 学 报 (自然 科学 版 )2011年 第 12卷 第 3期
J.Changchun Inst.Tech.(Nat.Sci.Edi.),2011。Vo1.12,No.3
35/38 l27一l30
两组数据分布的一致性分析及其应 用
关键 Baidu Nhomakorabea :统 计 ;分 布 ;一致 性 ;相关性
中 图分 类号 :O212.2
文献标 志码 :A
文 章 编 号 :1009-8984【2011)03—0127—04
的成绩关 系 ,2种生 物数 量在不 同地 区 的分 布 情况 , 等等 。目前为止 ,尚未 有合适 的统 计方 法对这样 的考 查 目标 给 出定 量分析 或描述 。
牧 稿 日期 l2011- 08- Z3 基 金项 目t吉林省教育厅 。十一五 科研项 目(吉教科合字[2olo]41o) 作 者简 介 。谷 照 升 (1965- ),男 (汉 )。吉 林 集 安 ,教 授
主 要 研 究 应 用 数 学 .
2 思 路
设 { ,Z1,… ,Z,r。),{W。,W。,… , 。}分 别
,广 。 按递 增排序 后 为 w。≤ w,≤ … ≤ ,rt,高对 高 ,低 对低 。反 之 ,若恰 有 X。一 一 1,X。= 一2,… ,
X.- = 0,即 W ≤ Ⅳrr2≤ … ≤ W。,则说 明二 者
的对应 刚好是 高对低 ,低对 高 ,这恰 好是 最大程 度 的
互 抑关 系 。
所 以 ,解决 问题 的关 键思 路在 于排 序后 数 据 编
号间 的位置关 系 ,而不 需要 数据值 本 身参与计 算 。排
列 Xo,Xl。… ,X 。与 0,l,… , 一 1匹 配度越 大 ,则
两者 的一致水 平越 高。
如何刻 画排列 X。,X ..’X t与 0,l,… , 一1