乳腺癌基因芯片数据分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
itgae to rome e t e rdcig te rlp i aino ains Th 0 e e ( < 0 ne rtdmeh p f r db s d e wh np e it h ea s s u t fp t t, e1 2 g n P n e t o e s .
果最 佳 、 2次之 , , y1 最差 。
表 1 Y 1为指标聚 类后结 果
材 料 和 方 法
缺 失 值 的处 理 对 缺 失 少 于 13的标 化探 针数 / 据( 即至 少有 6 6个 病 人 有 该 探 针数 据 ) 745个 共 7
探 针进 行 缺失 值 处 理 。74 5个 探 针 中 44 4个 无 7 0
0 ) yu i r t C X a a s r r dw lwhete1 ee( 1 b n ai e O n yip f me e i h 5gn P<0 0 1 b nvr t C X aa s v a l s o e l l s .0 )yu i ieO l i aa n ys
00 ) 01
单 因素 C X 回 归 分 析 对 74 5个 探 针 进 行 O 7 单 因素 C OX 回 归 分 析 , 腺 癌 复 发 定 义 为 失 效 事 乳 件 , 果 有 1 探 针 的 P<00 1将 对数 风 险 函数 结 5个 .0 ,
【 关键词】 乳腺癌; 基因芯片; 聚类分析 ; C X回归模型 O 【 中国图书馆分类法分类号】 R 779 022 1 3 . , 1 ,
M ir a r y Da a An l ssf rBr a tCa c r c o r a t a y i o e s n e
Re pe l s: a
r tr2 1sP 1 l 1 1
S n ,r  ̄
No das : t r pe0
Rea s : lpe 1
4 3
5 4
1 9
6 2
2 6
3 7
4 5
9 9
任 何 缺 失 , 其 他 30 1个 则 有 不 同程 度 的缺 失 。 而 7 将30 1 探 针分 别 作 为 应 变 量 , 0 7个 444个 探 针 为 待 选 自变 量 , 用 S 利 AS软 件 用 多元 逐 步 回归 法 填 充 缺 失值 , 采用 前 进 法 , 选 标准 a=0 0 1 控 制模 型 变 人 .0 ,
【 bt c】 P ro T uy h ras ra d ee bs n pe i ol o r s c . A s at ups os d ee pe e t ns a d n ee xr s n r i f mbe ta r e t t l - le g e o g e so p f s r e a n
Ta Cls e e u t y Y l b1 u tr r s lsb i
T h p e i d st t s oft e p t e ts e r d e ct a u h a in
. . . . . . . . . . . . . . . . . . . . . . . .
ue Oe au t h e e lce ydf rn to s Reut Th 0g n ( sd t v aet e n s et b i ee t l g se d f meh , d sl s e3 e e P<0. 1 sl t yte s 0 )e ce b h e d
【 摘要】 目的 以乳腺癌病人的表达谱芯片数据为基础, 探寻乳腺癌复发的相关基因。方法 对标化芯片数据
进行缺失值 处理后 , 分别用单 因素 C X 回归模 型和综合 了聚类 及 多 因素 C X 回归 的综合 法来 筛选 兴趣 基 因 , O O 然后通过兴趣 基 因对病 人做样 品聚类 , 以灵敏 度 、 特异 度 、 约登 指数 和 K pa . i 法 评 价分类 效果 , 后 结合 a l Me r n e 最 文献 和蛋白质数据库 探寻乳腺 癌复发 的相关基因。结果
ຫໍສະໝຸດ Baidu
乳腺 癌是 西 方女 性 的 高发 肿 瘤 。在 我 国发病 率
系统 研究 乳 腺 癌 预 后 的相 关 基 因提 供 了技 术 保 证 , 从 而 成 为 乳腺 癌 研究 领 域 的一 种 常规 技 术 。
如 何 对 芯 片 产 生 的海 量 数 据 进 行 分 析 , 获 得 以
也 逐 年升 高 , 其在 京 、 、 等 沿海 发 达地 区 , 中 尤 津 沪 其 以上 海 最 高 ,9 7年 发 病 率 为 4 /0万 , 女 性 恶 19 91 居
出的 1 5个 P<0 0 1的基 因预 测效果最 差。结论 .0 为进一 步的生物学研究 提供 待选基 因。
综 合 法筛出的 3 O个 P<0 0 , 1的基 因对乳腺癌病 人复
发状况 的预测效果最佳 ; 因素 C X 回归筛 出的 1 2个 P<0 0 单 O 0 , 1的基 因的预测效 果较差 ; 因素 C X 回归筛 单 0 综合 法筛选得 到 的 3 O个基 因可用来 评 价病人 的预 后状 况 ,
c r ai t wi iee t l i l ucme . M eh d F rt , nv r t OX ges nmo e wa sd e t n s t df rn i c to s p e h f cn ao to s i l u iai eC sy a r rsi d l sue e o t n ls h co ra aa t eette p tn i e e . eo dy a ne rt to o oe f oa ayi temirary d t O sl h oe t g n S c n l , n itg ae meh c mp sd o s c l a s d d c se dmut ait O l tra li r e 0X n y iwa l ri u , e men lse to s p l dt ls u n v a a a s s s c r o tTh nK— a sc tr l s ao a e d u meh wa pi c — d a e O a
性 肿瘤 的首位 … 。 目前具 有 相 同症 状及 病 理 类 型 的患 者 经过 相 同 治疗 后 , 预后 上 存 在 极 大 差 别 。这 说 明 当前 乳 腺 在
有 效 的生物 学 信 息来 指 导后 续 研究 是 乳 腺癌 研 究 的 重点 和难 点 。 我 们 利 用 C rts hio 等 j 供 的 数 据 , s 提 综 合运 用 聚 类 和 C X 回归 模 型 两 种 方 法 来 筛 选 乳 O 腺 癌 复 发 的相 关 基 因 。为 了克 服 多重 比较导 致 假 阳 性 增 大 的危 险 , 研究 对 P 值进 行 了控 制 。 该 芯 片 本 数 据包 括 9 9个病 人 的 乳腺 癌 样 品 的 7 5 60个 探 针 ,
s y t e r l s i ain o a i t . e s i i , p cf i , u e ’ n e d Ka ln M ee n l s r i h ea e s u t fp t n s S n i vt s e i ct Yo d n Si d x a p a ・ i a ay i we e f p t o e t y i y n r s
o i o ra . f c a r y m r
【 e w r 】 be tac ; m c a a ; c s r n yi C xr r s n oe Ky o s r sc e d a n r ior y l t a s ; O ge i d l r r u e al s e so m
癌 的分类 标 准有 待 提 高 , 时 提 示 病 人 内在 的基 因 同
表达 对病 人 的 预后 具 有重 要 意 义 。 基 因芯 片能 同时
检测 数 千个 基 因 的表达 , 了解 病 人 特 异 的表 达 谱 , 为
通讯作者 E ma : qh o h d n in z a@smu e u c l
2 / 5 7 0 4 2 0 7 3 6 4 =0 5 8( 2 — 2 ) 4 / 4 9 0 6 5— 9 ) 3 5 :0 7 6( . 6 0 8 4
0 5 8+0 7 6— 1 0 7 7 9 = 3 4
No : l t eu f1 r e t og nvr t C X aa s ( < t C u e r l o 5 po s h u h u i i e O n l i P e sr st s b r aa ys
— —

. .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .



Th e l t tso t n era a u f i t s a p es
N trlpe o ea s :
rl tr1 1 P 1
维普资讯 http://www.cqvip.com
10 7
复旦学报 ( 医学版 ) 2 0 0 5年 3月 ,2 2 3 ()
其 数据 矩 阵 为 9 9×760 并 且 已知 9 5 , 9个 病 人 的 其
他 信 息如 复 发与 否 、 发 时 间 和失访 时 间等 。 复
由表 1 ~3可 见 以 3为 指标 作 分类 , 女 其预 测 效
JANG D n — n , AO J n Z AO Na qn I igf g G u , H i ig e —
( eat e tfHel ttt s n oil d c e d o u l at F d nU i ri h nh i 0 0 2 C ia D p rm n o a t S ii d Sc i n ,S m lfP bi Hel h a sca a Me i o c h, ua nv syS a g a 0 3 , kn ) e t 2
量个数。
S niv y (5 cni c i e a es i t 9 % o f e en r 1 ti d tv ) n S eic y( 5 cni c it v1 pc i t 9 % o d e ne a fi f e r ) n
Y u e ’ n e od n Sid x
维普资讯 http://www.cqvip.com
复 里亏提( 医学版)
F dn u a Unv J i Me si d c 19 6
乳 腺 癌 基 因芯 片 数 据 分 析
蒋 锋 峻 定 高 赵耐 青
( 复旦大学 公共卫生学院卫生统计 与社会医学教研 室 上海 203 ) 0 0 2
e f me wos, p r r d rt o C n lso s Th 0 g n eet y te itg ae to , s ei l h e e o cu in e 3 e e slce b h ne t meh s d r d d ep ca y te g n l s whc r s i e u yteoh rt t o s aewo tyo rh r x e me t t &e8ter ut i weea opc d o t te womeh h l k b h d ,r rh f u te p r n s oa ss h e lS f e i s
相关文档
最新文档