分子生态学课程教学难点的解析——3个种群遗传分析方法简介
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
28生物学通报2020年第55卷第10期分子生态学课程教学难点的解析
—3个种群遗传分析方法简介*
杨丽媛董恬雅冯成庸董彬赵宏波
(浙江农林大学风景园林与建筑学院浙江杭州311300)
摘要随着分子生态学的迅猛发展和广泛应用,分子生态学已成为很多大学本科和研究生的专业课程。
分子生态学教学过程中涉及复杂的种群遗传学统计分析方法,是教学的难点。
然而对于分析方法的正确理解和使用,是这门工具课程教学的关键。
本文将分子生态学课程中,种群遗传学分析方法中的3个难点进行解析和介绍,以期帮助学生理解和辅助教师教学。
关键词分子生态学哑等位基因连锁不平衡哈温平衡
中国图书分类号:Q75 文献标识码:A
分子生态学是在分子水平上研究和解释有关的生态学和环境问题的一门交叉学科[1],自20世 纪中叶诞生以来发展迅猛,已成为科学研究中非常基础的实验手段[w]。
分子生态学这门课程也逐渐进人大学本科生和研究生的教学中[4_6],已有多 所高校开设该课程。
分子生态学是分子生物学与生态学等多学科的交叉学科,涵盖的知识面极广,涉及多个学科,包括动物学、植物学、微生物学、普通地理学、生态学、种群与群落生态学、行为生态学、生物化学、遗传学等[5],由于其内容广泛,交 叉性强,学生理解和掌握往往存在一定困难。
该课 程着重介绍各种分子生态学理论与分析方法,旨在让学生理解生态学,尤其是种群遗传学的理论知识,掌握分子生态学实验方法及如何利用理论知识分析和解释实验数据。
在分子生态学课程中,分子标记的使用方法、分析方法,以及涉及的理论背景是整个课程的核心;5]。
其中对分子标记的实验结果的分析主要依靠现有的软件,教师的讲解
g e-£€C C-g C g-g g-£-g-g-£-C C G G g g-C-€C££C g C C C C C G C C C C C C C C C G C C G C C C C C C C C C C C€C C C C C C C g C C C C C C C C C C C C C C C C-g C C g C C C g£
价值通过货币在生产和消费之间流通一样,因此,A T P是细胞内时刻流通着的能量货币。
为呼应本节课的开始,教师追问:A T P犹如能直接使用的“现金”,则糖类、脂肪等有机物犹如什么?学生顿 悟:脂肪、糖类犹如定期存款或大额支票,不能直接用于现实生活的各项小额消费,需在银行经兑换、取现等手续将其变成现金后才能使用,犹如储 存在大分子有机物的能量需经过水解、分解过程转化成A T P后才能用于生命活动一样。
至此,学 生终于生成并深刻理解了本节课的重要概念:
A T P是细胞的能量货币。
5 教学反思
为了贯彻新课程标准中核心素养为宗旨,内容聚焦大概念、教学过程重实践等基本理念,本节 课的设计主要致力于2个方面。
1)创设多维度的学生活动,例如,实验探究、模型分析、活动模拟等,让学生充分参与课堂,在动手、动脑、动口实
践中提升学科核心素养。
2)本节课制作使用了 3
个视频、7个动图、10个实物教具,以及2个模拟
活动,借此创设了可观可感的多元情境,以问题为
引领,提炼生物学事实,完成概念的生成教学。
整
个教学过程中,学生变被动聆听为主动获取,知其 然,更知其所以然。
需改进的地方:本节课在课堂
的各种活动中注重了师生间、生生间的主体多元
评价,形式上也注重了动手和表达的训练,但由于
时间关系,学案上纸笔训练只能留作课后作业,概
念检测未能做到实时反馈。
主要参考文献
[1]教育部考试中心.中国高考评价体系说明.北京:人民教育
出版社,2019:36.
[2]中华人民共和国教育部.普通高中生物学课程标准(2017年
版).北京:人民教育出版社,2018:57.
(E-mail:zhenjieshu@)
*基金项目:国家自然科学基金(31700328);陕西省自然科学基金(2019JQ-369);浙江农林大学学校科研发展基金(2019FR028);
浙江省教育厅一般项目(Y201839931)
2020年第55卷第10期生物学通报29
深度也多限于对软件给出结果的简单解释,涉及 的计算原理、数学方法及种群遗传学理论很难深人讲解i4'6]。
然而分析过程中,对分析原理的深人理解决定了对结果解释的高度和准确性。
在分子生态学的课程设计中,会以1~2种经典的和当前流行的分子标记为例进行讲解,包括蛋白 质标记(等位酶标记)和D N A标记(RFLP、RAPD、AFLP、SSR、SNP、RAD、MSAP、Hiseq 等)[5]。
这些标 记虽然有差异,但其背后的种群遗传学原理都是相通的。
其中微卫星标记(SSR)作为一种廉价且广泛 应用的方法,在分子生态学课程中经常被作为代表标记进行讲解和设计实验,甚至有些课程直接以微卫星分子标记作为贯串课程的主线[74]。
微卫星标记被广泛应用于种群生态学研究中[9^]。
微卫星通常又被称为简单重复序列(SSRs)、短串联重复(STRs),是短的DN A重复片段,其中重 复单元(motif)—般为1~6个碱基,广泛存在于原核 和真核生物基因组中[11]。
个体间相同位点上可能存 在着重复次数的不同,导致基因长度的差异。
通过 P C R和毛细管电泳可检测出基因K度,区分不同等 位基因™。
微卫星标记具有高突变率™、符合孟德 尔遗传规律的共显性标记等特点[12]。
在分子生态学 和种群遗传学的工作中,微卫星标记可用于亲本分析、评估近交水平及估计种群的遗传结构、瓶颈效 应、有效种群大小和基因流等[UM4]。
然而在学习微卫星标记的分析方法过程中,有很多问题学生难以理解,使用过程中容易产生误解,甚至对分析结果的解析产生错误。
本文将分析过程中最重要的哈温平衡(Hardy-Weinberg equilibrium)检验、评估 连锁不平衡(linkage disequilibrium)及估计哑等位基因(null allele)频率的原理进行介绍和解析,以期帮助学生理解和辅助教师教学。
1哈温平衡检测
哈迪-温伯格平衡(简称为哈温平衡)法则是 种群遗传学中最重要、最基础的法则,它解释了繁 殖如何影响群体的基因和基因型频率,是由英国 数学家Hardy和德国的医生Weinberg分别于1908 年和1909年提出。
他们提出,在一个不发生突变、迁移和选择的无限大的相互交配的群体中,基因 频率和基因型频率在代际之间保持不变[15、哈温 平衡法则是检验群体有性繁殖上、下代之间基因 频率与基因型频率是否保持平衡的重要方法。
哈迪_温伯格模型在种群遗传学领域的地位和作用几乎是无可比拟的,奠定了种群遗传学的基础。
几乎所有的进化理论都是从哈温平衡条件出发,然后再考虑某个或某些进化过程。
所以在 进行种群分析中,哈温平衡检测几乎是分析的第1步。
哈迪-温伯格模型也广泛应用和出现在中学和大学教学中[1517_18]。
随着统计学的发展和软件的开发,对哈温平衡检测的检测也从最简单的卡方检验(Chi-square test),逐渐加人马尔科夫链算法,以及对卡方检验进行矫正的列联表的Fisher精确检验(Fisher’s exact test)方法。
卡方检验是检测哈温平衡最简单的方法。
通 过比较观测基因频率和哈温平衡下的期望基因频率实现。
卡方检验虽然比较容易并且易懂,但是检验效力较低。
相比之下,G uo和Thompson1%所描 述的马尔科夫链随机游走算法(Markov-chain random walk algorithm)则是更有效的检验方法。
这 种方法使用类似2x2列联表的Fisher精确检验方法,只是该方法使用了任意大小的三角列联表。
该 检验使用修饰过的G u o和Thompson所描述的马尔科夫链随机游走算法。
修改过的版本与原算法结果相一致,但计算速度更快。
该方法首先建立一个K x K的列联表。
其中,K表示等位基因的数目,列联表内的数值是等位基因的观测频率。
使用 Levene的算法™计算在零假设下观测到此表的概率,然后使用马尔科夫链算法搜索边缘计数(marginal counts)相等的替代矩阵。
其中,随机选择 2 行 f,、i2和 2 列 ,通过减少(1_,,乂)(;2,;‘2)并且增加以获得新表。
通过计算转换概率决定是否接受新表。
P值为所有访问过的表中概率比原表小或相等的比例。
在教学过程中,教师通常使用软件进行哈温平衡检验,并直接用软件给出的P值以评估种群是否处于哈温平衡。
而对检验背后得原理甚少提及。
而 在种群遗传学分析中,找到影响哈温平衡的因素往往是找到影响种群进化的关键,例如,近交、亚种群 结构等,都可能是导致种群偏离哈温平衡的原因。
所以,理解哈温平衡检测的原理,能帮助学生在进一步分析中对实验和数据进行正确的解释。
2评估连锁不平衡
在数据分析过程中每一个位点都应是从基因
30生物学通报2020年第55卷第10期
组中的独立采样,但是如果不同位点在染色体上物理位置过近,则会导致2个位点连锁,这种情况被成为连锁不平衡。
如果实验中2个位点出现连锁,则在进一步分析过程中就会导致假重复,影响 数据分析的准确性。
Raymond和Rousset'提出一■种基于列联表的 Fisher精确概率检验延伸的算法,以计算连锁不平衡。
这种算法需要先建立/^<&的列联表,再分别 估计在零假设下,得出观测表的概率。
使用马尔科 夫链的算法来估计列联表的概率。
分别表示 位点1、位点2的等位基因数目。
针对在单倍型数据未知的情况,Slatkin和Excoffier[22-提出以最 大似然估计的方法检验连锁不平衡。
先用期望最大化迭代(expectation maximization,EM)算法估计单倍型频率,再用最大似然法估计得出单倍型频率是否显著偏离随机模型,等同于等位基因间是否显著地连锁不平衡。
在Genepop软件;23]中使用 Raymond 和 Rousset 的算法,而 Arliquin 软件[24;采 用了以上2种算法。
教师在讲解时,不仅要说明连锁不平衡出现的原理、统计连锁不平衡概率的原理,还要注意,由于 检验连锁不平衡过程中对每2个位点都进行了检验,这就导致对同一数据集进行了数量较大的独立检验,对检验的P值需要进行Bonferroni校正,从 而使得结果更加严谨。
对于数据中出现连锁不平衡的情况,需要酌情考虑去除连锁的位点或在下一分析过程中,将连锁不平衡的情况考虑进去。
3估计哑等位基因频率
哑等位基因产生的主要原因是微卫星侧翼序列的变异引起P C R失败。
当微卫星侧翼序列出现突变(插人或缺失),特别是引物结合位点出现突变时,在P C R过程中,引物与D N A链的结合失败,则会导致该位点无法正常扩增而出现哑等位基因。
在P C R过程中,如果杂合子其中一个等位基因没能被成功扩增,则该杂合子就会被记成纯合子。
哑等位基因的存在损害了对种群遗传信息估计的准确性[14]。
哑等位基因频率的估计方法有很多[26^]。
1992 年,Charkraborty等[271首次提出,在RLFP分析中,可用哑等位基因来解释一些观测杂合子不足的现象(heterozygote deficiencies)。
Charkraborty 等引人哑等位基因频率r。
根据期望杂合度(迅)和观测杂合度(队)建立了计算哑等位基因频率的
公式这种方法有一个缺点就是没有考HE+ti〇
虑缺失值,因为缺失值的产生可能是哑等位基因的纯合子导致的P C R失畋,而非人为的原因。
Brookfield-2^在Charkraborty等的方法的基础上,将 缺失值当做哑等位基因纯合子,提出新的计算
方法口1。
当观测杂合度和期望杂合度的值
H e+1
都较大时,这2种方法得出的结果相差不大,但是 如果杂合度水平较低时,2种算法得出的哑等位基因频率r差别就会比较大mi。
Brookfield和 Charkraborty等的算法都是假设种群处于哈温平衡,但事实上很多种群由于近交或亚种群结构等原因偏离哈温平衡。
Oosterhout等25针对偏离哈温平衡的种群,提出了基于近交系数(inbreeding coefficients,Fig)或种群分化系数(fixation indices,F g)计算哑等位基因频率的方法。
同时,如果检验 发现纯合子出现的概率显著高于期望值,并且在各 个等位基因上均匀分布,则MICRO-CHECKER会 提示有哑等位基因存在〜。
此外,Genepop软件™中计算哑等位基因的方法是基于Broofield的算法,运用期望最大化迭代法估计哑等位基因频率的最大似然值。
CERVUS软件™使用似然迭代法1〜,哑 等位基因的纯合子在计算开始不予考虑,而是在之后的优化中才考虑。
这种方法可避免将人为造成的数据缺失认定为哑等位基因。
在具体实验中出现哑等位基因时,要进一步
分辨导致哑等位基因频率过高的原因。
近年来有 些学者认为,哑等位基因频率过高也可能是种群本身的特点引起的[9’32]。
Dabrowski等™在评估了
1 200个种群的哑等位基因检测之后发现,大约 78%的评估都存在假阳性。
评估哑等位基因的算法通常都默认种群处于哈温平衡或已知种群的近交水平(FB)和种群分化程度(F g)。
然而,在实际 实验中,很难达到这个假设。
所以很多杂合子缺失的情况,可能并不是由哑等位基因引起的,而是种 群再细分引起的瓦伦效应(Wahlund effects)和小 种群的近交导致的。
在教学过程中教师需要给学生讲解清楚哑等位基因产生的原因及哑等位基因频率与种群偏离哈温平衡之间的关系。
2020年第55卷第10期生物学通报31
随着分子生态学课程进人大学甚至中学,在 教学过程中的问题也逐渐凸显。
分子生态学课程
教学的目的在于让学生能理解相关的种群遗传学
理论并应用于科学研究的具体工作中。
对分子生 态学教学中涉及的哈温平衡模型、连锁不平衡及
哑等位基因频率等知识的理解和应用,不仅能让
学生更好地使用分子生态学手段,更能加深学生
理解种群遗传学、种群生态学问题。
主要参考文献
[1]康乐.分子生态学及其在未来生态学发展中的地位和作用.
科学通报,1996(sl):36.
[2]黄瑞林,印遇龙,侯振平,等.分子生态学的兴起与应用.基因
组学与应用生物学,2005,24(1):80.
[3]杨玉慧,李义明.分子生态学研究与动物多样性保护.生物
多样性,200丨,9(3):284.
[4]吕佳,李俊清,杜芳.高等林业院校“分子生态学”课程教学改
革的探讨:以北京林业大学为例.中国林业教育,20丨8,36(5):46. [5]孙克萍,江廷磊,林爱青,等.分子生态学课程建设与实践.高
校实验室工作研究,2017(1):7.
[6]赵小虎,刘震,胡承孝.高等农林院校分子生态学课程建设
与教学改革探索.安徽农业科学,2015,43(10):366.
[7]李毓,黄琴,寇贺玲,等.SSR分子标记技术在农林院校《种子
检验学》实验教学中的应用•教育现代化,2016(36):147.
[8]李洁,梁前进,靳溪,等.微卫星分子标记技术在遗传学实验
教学中的应用:科研转化为实验教学的实践和探索.实验技
术与管理,2016,33(1):53.
[9] Dabrowski M J, Bomelov S, Kruczyk M, et al."True" null
allele detection in microsatellite loci: A comparison of methods,
assesvsment of difficulties and survey of possible improvements.
Molecular Ecology Resources, 2015,15(3):477.
[10] Selkoe K A, Toonen, R J. Microsatellites for ecologists: A
practical guide to using and evaluating microsatellite markers.
Ecology Letters. 2006,9(5):615.
[11] Zane L, Bargelloni L, Patamello T. Strategies for microsatellite
isolation: A review. Molecular Ecology, 2002,11(1):!.
[12] Litt M, Luty J A. A hypervariable microsatellite revealed by
in vitro amplification of a dinucleotide repeat within the car
diac muscle actin gene.American Journal of Human Genetics,
1989,44(3):397.
[13] Schlotterer C. Evolutionary dynamics of microsatellite DNA.
Chromosoma, 2000.109(6):365,.
14] Jame P, Lagoda P J L. Microsatellites, from molecules to populations and back. Trends in Ecology and Evolution,
1996,11(10):424.
[15]游隆信.用哈迪-温伯格定律计算基因频率和基因型频率.
生物学教学,2004,29(11):52.
[16] Hardy G H. Mendelian proportions in a mixed population.
Science, 1908 (15) :427.
[17]管宇,张香云,徐群芳,等.哈迪-温伯格平衡检验及其基因
频率的估计.浙江农林大学学报.2009, 26(1):丨22.
[18]张辉.“哈迪-温伯格定律”应用例析.中学生物教学,2017
(9):69.
[19] Guo S W, Thompson E A. Performing the exact test of
Hardy-Weinberg proportion for multiple alleles. Biometrics,
1992,48(2):361.
[20 ] Levene H. On a matching problem arising in genetics. The
Annals of Mathematical Statistics, 1949.20(1):91.
[21 ] Raymond M, Rousset F. An exact test for population diffe
rentiation. Evolution. 1995,49(6): 1280.
[22] Slatkin M, Excoffier L. Testing for linkage disequilibrium in
genotypic data using the expectation-maximization algorithm.
Heredity, 1996,76(4>:377.
[23」Raymond M, Rousset F. GENEPOP (version 1.2): Population genetics software for exact tests and ecumenicism. Journal of
Heredity, 1995,86(3):248.
[24] Excoffier L, Laval G, Schneider S. Arlequin (version 3.0):
An integrated software package for population genetics data
analysis. Evolutionary Bioinformatics, 2005(1 ):47.
[25] Van Oosterhout C, Weetman D, Hutchinson W F. Estimation
and adjustment of microsatellite null alleles in nonequilihrium
populations. Molecular Ecology Notes, 2006,6( 1 ):255.
[26]文亚峰,Uchiyama K,韩文军,等.微卫星标记中的无效等位
基因.生物多样性,2013,1(21): 117.
[27] Chakraborty R, Deandrade M, Daiger S P, et al.Apparent
heterozygote deficiencies observed in DNA typing data and
their implications in forensic applications. Annals of Human
Genetics, 1992 (56) :45.
[28] Brookfield J F Y. A simple new method for estimating null
allele frequency from heterozygote deficiency. Molecular Eco
logy, 1996,5(3):453.
[29] Van Oosterhout C, Hutchinson W F, Wills D P M, ef al.
MICRO-CHECKER: Software for identifying and correcting
genotyping errors in microsatellite data. Molecular Ecology
Notes, 2004,4(3):535.
[30] Slate J, Marshall T, Pemberton J. A retrospective assessment
of the accuracy of the paternity inference program CERVUS.
Molecular Ecology, 2000,9(6):801.
[31 ] Marshall T C, Slate J, Kruuk L E B, et al.Statistical
confidence for likelihood-based paternity inference in natural
populations. Molecular Ecology, 1998,7(5):639.
[32] Yang L Y, Wang A Y, Huang Z Z, et al.Development of
polymorphic microsatellite loci for Ceratosolen gravelyi(Hvme-
noptera:Agaonidae), the pollinating wasp of Ficus semicordata
(L'rticales: Moraceae). Applied Entomology and Zoology,2019,
54(1):129.
[33] Dabrowski M J, Pilot M, Kruczyk M, et al.Reliability asse
ssment of null allele detection: Inconsistencies between and
within different methods. Molecular Ecology Resources, 2014,
14(2):361.
(E-mail:lyyang@ )。