您的当前位置:首页SSR相关基础知识

SSR相关基础知识

2023-03-13 来源:爱问旅游网
共显性:很多已图谱类分子标记都是共显性,简单说就是基因型AA,Aa,aa都能在图谱中区分开来,A和a是两条不同大小的带。复杂点说就自己查阅下文献吧。

高度重复性:高度重复是,说重复单元的重复次数是多变的,因此多态性较强,可以用来进行多样性分析,群体遗传分析等 (应该是指重复单元次数较多,所以为高度重

复,卫星DNA都是这个特点,当然要说实验结果为高度重复也是有道理,但措辞不适应,实验结果只有重复性好或者重复性不好,基本不上实验结果高度重复,所以高度重复指前者的意思可能性更大。当然,像这种成熟的分子标记技术实验结果肯定都是重复性好的。)

可靠性:说试验的重复比较好,比较稳定。不想RAPD那样,今天出来了,明天就可能不行了

期望杂合度He是理论计算得出的杂合度。观测杂合度是随机抽取的两个样本的等位基因不相同的概率。计算公式如下:观测杂合度(Ho)=观察得到杂和个体数/样本个体数

杂合度编辑

本词条缺少概述、信息栏、名片图,补充相关内容使词条更完整,还能快速升级,赶紧来编辑吧!

1.一般杂合度是指由所有标记检测到的两亲本间的差异程度,而特殊杂合度是指根据单因子方差分析所确定的对某一性状有显著效应的标记(阳性标记)计算的亲本间差异程度

2.杂合度是指随机抽取的样本中其两个等位基因不相同的可能性(Nei,1975)。期望杂合度主要是根据种群内当前优势等位基因的分布频率来推算的,稀有基因的贡献极其微弱

3.遗传学上的杂合度,用H表示:杂合性的一种状态程度,反映一个位点具有两个以上等位基因的状态:H = 1-Σpi

期望杂合度是理论计算得出的杂合度。

观测杂合度是随机抽取的两个样本的等位基因不相同的概率。计算公式如下:观测杂合度(Ho)=观察得到杂和个体数/样本个体数总数。预期杂合度值(He)根据Nei(1978)提供的公式计算: nHe =1-∑ pi 2 i=1其中pi是第i个等位形式的频率,所有位点的等位形式频率由软件POPGENE32计算得出,n是等位形式的数目。He值的范围从0(说明无多态性)到1(说明无限多个等位形式具有相同的频率,是个极限值

多态信息含量是指DNA的多态性指标

等位基因数是反映群体遗传变异大小的一 个指标,其数值越接近所检测到的等位基因的绝对数,表明等位基因在群体中分布越均匀。 (最后一个是同源染色体上的)

有效等位基因数是反映群体遗传变异大小的一 个指标,其数值越接近所检测到的等位基因的绝对数,表明等位基因在群体中分布越均匀。

等位基因(allele):位于一对同源染色体的相同位置上控制某一性状的不同形态的基因。不同的等位基因产生例如发色或血型等遗传特征的变化。等位基因控制相对性状的显隐性关系及遗传效应,可将等位基因区分为不同的类别。在个体中,等位基因的某个形式(显性的)可以比其他形式(隐性的)表达得多。

有效等位基因数编辑

本词条缺少信息栏、名片图,补充相关内容使词条更完整,还能快速升级,赶紧来编辑吧!

中文名称 有效等位基因数 英文名称 effective number of allele 定 义 理想群体中(所有等位基因频率相等),一个基因座上产生与实际群体中相同的纯合度所需的等位基因数。它等于实际群体的纯合度的倒数。

等位基因频率编辑

本词条缺少信息栏、名片图,补充相关内容使词条更完整,还能快速升级,赶紧来编辑吧!

等位基因频率是群体遗传学的术语,用来显示一个种群中基因的多样性,或者说是基因库的丰富程度。

目录

1概念 2概念比较

▪ 相关计算

▪ 摘要 ▪ 理想状态 ▪ 自然状态

3遗传平衡 4高考信息 5特殊情况

1概念编辑

等位基因频率是群体遗传学的术语,用来显示一个种群中基因的多样性,或者说是基因库的丰富程度。等位基因频率的定义如下:

如果 1)一个染色体中存在某特定基因座,2)该基因座上有一个基因,3)一个种群中的每一个个体的体细胞都有n个该特定基因座(例如二倍体生物的细胞中有两个该特定基因座),4)该基因有等

位基因或变种;那么等位基因频率为-------等位基因在这个种群中 所有该等位基因在特定基因座中 所占的百分比。

举例来说,如果在某种群中一个等位基因的基因频率为20%,那么在种群的所有成员中,1/5的染色体带有那个等位基因,而其他4/5的染色体带有该等位基因的其他对应变种--可以是一种也可以是很多种。

如人们熟悉的人的MN血型,它是由一对共显性等位基因M和N所决定,产生3种基因型M/M、M/N和N/N,而相应的表型是M、MN和N,而且比例是1/4M、1/2MN和1/4N。这个原理可以推广到一般群体内婚配,如以群体中MN表型(基因型)的具体样本数被所观察到总数相除即可得到(转换)相对频率数。

2概念比较编辑

基因频率是某种基因在某个种群中出现的比例。基因型频率是某种特定基因型的个体占群体内全部个体的比例。前者是某基因个体数占全部基因数的比例,后者是某基因型个体数占群体总数的比例。

相关计算

⑴设二倍体生物个体的某一基因座上有两个等位基因A和a,假设种群中共有N个个体,而AA、Aa、aa三种基因型的个体数分别为n1、n2、n3,那么种群中A基因的频率和AA基因型的频率分别是:

①A基因的频率=A基因的总数/(A基因的总数+a基因的总数)=(2n1+n2)/2N 或

n1/N+n2/2N ②AA基因型的频率=AA基因型的个体数/该二倍体群体总数=n1/N。 ⑵基因频率与基因型频率的计算关系,由上述①②推得:A基因的频率=n1/N+1/2·n2/N=AA基因型的频率+1/2Aa基因型的频率。 基因频率计算类型及其公式推导 摘要 生物进化的实质是种群基因库基因频率在环境选择作用下的定向改变。运用数学方法计算种群基因频率有利于理解种群进化情况,本文结合实例探讨种群在不同情况下种群基因频率计算类型和计算公式的推导过程。 关键词: 遗传平衡 基因频率 基因频率是指在一个种群基因库中,某个基因占全部等位基因数的比例。种群中某一基因位点上各种不同的基因频率之和以及各种基因型频率之和都等于1。对于一个种群来说,理想状态下种群基因频率在世代相传中保持稳定,然而在自然条件下却受基因突变、基因重组、自然选择、迁移和遗传漂变的影响,种群基因频率处于不断变化之中,使生物不断向前发展进化。因此,通过计算某种群的基因频率有利于理解该种群的进化情况。为了进一步加深对这部分知识的理解和掌握,现将基因频率计算类型和计算公式推导归纳如下: 理想状态 理想状态下的种群就是处于遗传平衡状况下的种群,遵循“哈迪──温伯格平衡定律”。遗传平衡指在一个极大的随机自由交配的种群中,在没有突变发生,没有自然选择和迁移的条件下,种群的基因频率和基因型频率在代代相传中稳定不变,保持平衡。 一个具有Aa基因型的大群体(处于遗传平衡状态的零世代或某一世代),A基因的频率P(A)=p,a基因的频率P(a)=q,显性基因A的基因频率与隐性基因a的基因频率之和p+q=1,其雌雄个体向后代传递基因A型配子的频率为p,与其相对应的传递隐性基因a型配子的频率为q,则可用下表1来表示各类配子的组合类型、子代基因型及其出现的概率: 表1 雄配子 雌配子 A(p) a(q) A(p) AA(p) Aa(pq) a(q) Aa(pq) aa(q) 由上表可知该种群后代中出现三种基因型AA、Aa、aa,并且三种基因型出现的频率分别为P(AA)= p×p= p=D;P(Aa)=2p×q=2pq=H; P(aa)= q×q = q=R。且它们的频率之和为p+2pq+q=(p+q)=1。其基因频率为A基因的频率P(A)=D+1/2H= p+ pq=p(p+q)=p;a基因的频率P(a)= R+1/2H=q+ pq=q(p+q)=q。可见子代基因频率与亲代基因频率一样。所以,在以后所有世代中,如果没有突变、迁移和选择等因素干扰,这个群体的遗传成分将永远处于p+ 2pq+q平衡状态。伴性基因和多等位基因遗传平衡的计算仍遵循上述规律。运用此规律,已知基因型频率可求基因频率;反之,已知基因频率可求基因型频率。 例题:已知苯丙酮尿症是位于常染色体上的隐性遗传病。据调查,该病的发病率大约为1/10000,请问在人群中该苯丙酮尿症隐性致病基因(a)的基因频率以及携带此隐性基因的携带者(Aa)基因型频率分别是 ( ) A.1% 和0.99% B.1% 和1.98% C.1% 和3.96% D.1% 和0.198% 解析:苯丙酮尿症是一种常染色体隐性遗传病。由于该病则发病基因型为aa,即aa=0.0001,a=0.01,A= 1-a=1-0.01=0.99,携带者基因型为Aa的频率 = 2×0.01×0.99=0.0198。

答案:B

变式1.在某个海岛上,每一万个人中有500名男子患红绿色盲,则该岛上的人群中,女性携带者的数量为每万人中有多少?( 假设男女比为1:1)( B )

A.1000人 B.900人 C.800人 D.700人

变式2:人的ABO血型决定于3个等位基因I、I、i。通过抽样调查发现血型频率:A型=0.45,B型=0.13,AB型=0.06,O型=0.36。试计算I、I、i这3个等位基因的频率。

答案:I频率为0.3 ,I频率为0.1,i频率为0.6。

自然状态

对于生活在自然界中的种群来说,理想状态下的条件是不可能同时存在,种群基因频率不可能保持平衡,而是处于不断变动和发展的。这种非平衡群体常采用抽样调查的方法获得的数据来计算其基因频率,根据基因所在位置可分为两种类型。

2.1关于常染色体遗传基因频率的计算由定义可知,某基因频率=某基因的数目/该基因的等位基因总数×100%。若某二倍体生物的常染色体的某一基因位点上有一对等位基因A、a,他们的基因频率分别为p、q,可组成三种基因型AA、Aa、aa,基因型频率分别为D、H、R,个体总数为N,AA个体数为n1 ,Aa个体数为n2 ,aa个体数为n3 ,n1+n2+n3=N。那么:

基因型AA的频率=D=n1/N,n1=ND; 基因型Aa的频率=H=n2/N。n2=NH 基因型aa的频率=R=n3/N,n3=NR;

基因A的频率P(A)=(2n1+n2)/2N=(2ND+NH)/2N=D+1/2H=p 基因a的频率P(a)=(2n3+n2)/2N=(2NR+NH)/2N=R+1/2H=q 因为p+q=1所以D+1/2H+R+1/2H= D+R+H=1 由以上推导可知,

①常染色体基因频率的基本计算式: 某基因频率=(2×该基因纯合子个数+1×杂合子个数)/2×种群调查个体总数 ②常染色体基因频率的推导计算式:

某基因频率=某种基因的纯合子频率+1/2杂合子频率

例题:从某个种群中随机抽出100个个体,测知基因型为AA、Aa和aa的个体分别是30、60和10个。求这对等位基因的基因频率。

解法一:

先求出该种群等位基因的总数和A或a的个数。100个个体共有200个基因;其中,A基因有2×30+60=120个,a基因有2×10+60=80个。然后由常染色体基因频率的基本式计算求得:

A基因的频率为:120÷200=60% a基因的频率为:80÷200=40% 解法二:

由题意可知,AA、Aa和aa的基因型频率分别是30%、60%和10%,由常染色体基因频率的推导式计算求得:

A基因的频率为:30%+1/2×60%=60% a基因的频率为:10%+1/2×60%=40%

变式1:已知人眼的褐色(A)对蓝色(a)是显性,属常染色体上基因控制的遗传。在一个30000人的人群中,蓝眼的有3600人,褐眼的有26400人,其中纯合子有12000人,那么,这一人群中A和a基因的基因频率分别为( A )

A.64%和36% B.36%和64% C.50%和50% D.82%和18%

变式2:在一个种群中随机抽出一定数量的个体,其中,基因型为BB的个体占40%,基因型为Bb的个体占50%,基因型为bb的个体占10%,则基因B和b的频率分别是( B )

A. 90%,10% B. 65%,35% C. 50%,50% D. 35%,65% 2.2关于X或Y染色体遗传基因频率的计算

对于伴性遗传来说,位于X、Y同源区段上的基因,其基因频率计算与常染色体计算相同;而位于X、Y非同源区段上的基因,伴X染色体遗传,在Y染色体上没有该基因及其等位基因。同理伴Y染色体遗传,在X染色体上也没有其对等的基因。所以在计算基因总数时,应只考虑X染色体(或Y染色体)上的基因总数。若某二倍体生物的X染色体的某一基因位点上有一对等位基因B、b,他们的基因频率分别为p、q,可组成五种基因型XX、XX、XX 、XY和XY,基因型频率分别为E、F、G 、H和I,个体总数为N,XX个体数为n1 ,XX个体数为n2 ,XX个体数为n3 ,XY个体数为n4、XY个体数为n5。且n1+n2+n3=n4+n5那么:

E=n1 /N、 F=n2 /N、G=n3 /N、H=n4 /N、 I=n5 /N;

p(X)=(2n1 +n2 +n4)/[2(n1+n2+n3)+(n4+n5)]=(2n1 +n2 +n4)/1.5N=2/3(2E+F+H) q(X)=(2n3 +n2 +n5)/ [2(n1+n2+n3)+(n4+n5)]=(2n3 +n2 +n5)/ 1.5N=2/3(2G+F+I) 由以上推导可知,

①X染色体基因频率的基本计算式: 某基因频率=(2×该基因雌性纯合子个数+雌性杂合子个数+雄性含该基因个数)/(2×雌性个体总数+雄性个体数)

②X染色体基因频率的推导计算式: 某种基因的基因频率=2/3(2×某种基因雌性纯合体频率+雌性杂合体频率+雄性该基因型频率)(雌、雄个体数相等的情况下)

例题:从某个种群中随机抽出100个个体,测知基因型为XX、XX、XX和XY、XY的个体分别是44、5、1和43、7。求X和X的基因频率。

解法一:

就这对等位基因而言,每个雌性个体含有2个基因,每个雄性个体含有1个基因(Y染色体上没有其等位基因)。那么,这100个个体共有150个基因,其中雌性个体的基因有2×(44+5+1)=100个,雄性个体的基因有43+7=50个。而X基因有44×2+5+43=136个,基因X有5+1×2+7=14个。于是,根据X染色体基因频率的基本式计算求得:

X的基因频率为:136÷150≈90.7% X的基因频率为:14÷150≈9.3% 解法二:

由题意可知,XX、XX、XX和XY、XY的基因型频率分别 44%、5%、1%和43%、7%,因为雌性、雄性个体的基因型频率各占50%,于是,由X染色体基因频率的推导式计算求得:

X基因的基因频率=2/3×(2×44%+5%+43%)≈90.7% X基因的基因频率=2/3×(2×1%+5%+7%)≈9.3%

变式1:某工厂有男女职工各200名,调查发现,女性色盲基因的携带者为15人,患

者5人,男性患者11人。那么这个群体中色盲基因的频率是( B )

A. 4.5% B. 6% C. 9% D. 7.8%

变式2:对欧洲某学校的学生进行遗传调查时发现,血友病患者占0.7%(男∶女=2∶1);血友病携带者占5%,那么,这个种群的X的频率是( C )

A.2.97% B.0.7% C.3.96% D.3.2% 解析:

方法一:这里首先要明确2:1为患者中男女的比例,人群中男女比例为1:1。假设总人数为3000人。则男患者为3000×0.7%×2/3=14,女患者为3000×0.7%×1/3=7。携带者为3000×5%=150。则X的频率=(14+7×2+150)/(1500×2+1500)=3.96%。

方法二:人群中男女比例为1:1,根据X染色体基因频率的推导式计算求得: X的频率=2/3(0.7%×1/3×2+0.7%×2/3+5%)=3.96%。 答案:选C。

总之,尽管基因频率的计算类型复杂多样,其思维方法又迥然各异,但是我们只要把握住基因频率计算的条件和方法规律,弄清原委并灵活运用,就能准确地计算出正确的答案。

主要参考文献

1.李 难.进化论教程.北京:高等教育出版社,1990.9:244—276.

2.朱正威,赵占良.普通高中课程标准实验教科书生物必修2遗传与进化.北京:人民教育出版社,2007:115

3遗传平衡编辑

也称“定律”,1908年,英国数学家戈弗雷·哈罗德·哈代(Godfrey Harold Hardy)最早发现并证明这一定律;1909年,德国医生威廉·温伯格(Wilhelm Weinberg)也独立证明此定律,故得名哈代-温伯格定律。

主要用于描述群体中等位基因频率以及基因型频率之间的关系。内容为:

①一个无穷大的群体在理想情况下进行随机交配,经过多代,仍可保持基因频率与基因型频率处于稳定的平衡状态[1]。

②在一对等位基因的情况下,基因p(显性)与基因q(隐形)的基因频率的关系为: (p+q)^2=1

二项展开得:p^2+2pq+q^2=1

可见,式中“p^2”为显性纯合子的比例,2pq为杂合子的比例,“q^2”为隐形纯合子的比例。

哈代-温伯格定律在多倍体等更加复杂的情况下也可应用。

例1一个种群中AA个体占30%,Aa的个体占60%,aa的个体占10%。计算A、a基因的频率。

剖析A基因的频率为30%+1/2×60%=60% a基因的频率为10%+1/2×60%=40% 答案60% 40%

4高考信息编辑

例2(2006河北高考) 在豚鼠中,黑色对白色是显性。如果基因库中90%是显性基因B,10%是隐性基因b,则种群中基因BB、Bb、bb的频率分别是 ( )

A81% 18% 1% B45% 40% 15% C18% 81% 1%

D45% 45% 10%

解题思路BB频率为(90%)^2=81%,bb频率为(10%)^2=1%,Bb频率为2×90%×10%=18%,故选A

答案A

某小岛上原有果蝇20 000只,其中基因型VV、Vv、vv的果蝇分别占15%、55%和30%。若此时从岛外上入侵了2 000只基因型为VV的果蝇,且所有果蝇均随机交配,则F1中V的基因频率约是多少?

V基因频率=(20000*15%*2+20000*55%+2000*2)/44000=47.7%

5特殊情况编辑

值得注意的是在二倍体基因中,带有该等位基因的个体最多可能有2/5。如果等位基因随机分布的话,那么可以用二项式定理来计算:种群中32%的个体会是该等位基因的杂合体(带有一个该等位基因和另一个变种), 4%的个体为该等位基因的纯合体(带有两个该等位基因)。所以加起来就有36%的个体带有该等位基因。然而,等位基因的随机分布是在选择不参与和其他前提下成立的。当这些前提成立时,一个种群的状态被称为哈蒂-温伯格平衡(en:Hardy-Weinberg principle) 。

一个基因中所有等位基因的频率可以被绘制为等位基因分布柱状图。群体遗传学研究的内容包括影响等位基因频率的因素-换句话说,进化。除了自然和人工选择外,这些因素还包括遗传漂变、突变和迁移。

多态信息量用于连锁分析时对标志基因(或标志序列)的多态性估计,杂合度则用于群体遗传学上对群体多态性的描述;前者主要服务于基因定位和产前诊断,而后者则可对进化因子的效应予以分析,两者不仅含义不同,而且往往值也不同。本文对上述问题进行了分析提出了自己的一些看法。

多态信息含量(PIC polymorphism information content):在连锁分析中一个遗传标记多态性可提供的信息量的度量。它是一个亲本为杂合子,另一亲本为不同基因型的概率。现常用来衡量座位多态性高低的程度。

32

香农-威纳指数编辑

本词条缺少概述、名片图,补充相关内容使词条更完整,还能快速升级,赶紧来编辑吧! 中文名 香农-威纳指数 外文名

Shannon Wiener index 是用方法 信息论方法 提出者

费歇尔和普雷斯顿

目录

1香农-威纳指数的公式及其含义 2均匀性指数

1香农-威纳指数的公式及其含义编辑

费歇尔和普雷斯顿的方法所表示的多样性指数仅包括种的多寡一方面。香农-威纳指数和辛普森指数则包括了测量群落的异质性。香农-威纳指数借用了信息论方法。信息论的主要测量对象是系统的序( order)或无序(disorder)的含量。在通讯工程中,人们要进行预测,预测信息中下一个是什么字母,其不定性的程度有多大。例如,b b b b b b b这样的信息流,都属于同一个字母,要预测下一个字母是什么,没有任何不定性,其信息的不定性含量等于零。如果是a,b,c,d,e,f,g,每个字母都不相同。那么其信息的不定性含量就大。在群落多样性的测度上,就借用了这个信息论中不定性测量方法,就是预测下一个采集的个体属于什么种,如果群落的多样性程度越高,其不定性也就越大。

其中,H=样品的信息含量(彼得/个体)=群落的多样性指数,S=种数,Pi=样品中属于第i种的个体的比例,如样品总个体数为N,第i种个体数为ni,则Pi=ni/N

下面用一个假设的简单数字为例,说明香农一威纳指数的含义,设有 A,B,C三个群落,各有两个种所组成,其中各种个体数组成如下:

物种甲 物种乙

群落A 100(1.0) 0(0) 群落B 50(0.5) 50(0.5) 群落C 99(0.99) 1(0.01)

括号内数字即 Pi因为群落A的所有个体均属于物种甲,没有任何多样性,从理论上说H应该等于零,其香农一威纳指数是:

H=-〔(1.0 log21.0)+ 0)〕=0

由于在群落B中两个物种各有50个体,其分布是均匀的。它的香农指数是: H=-〔0.50(log20.50)+0.50(log20.50)〕=l 群落C的两个物种分别具有99和1个个体,则: H=一〔0.99(log20.99)+ 0.01(log20.01)〕=0.081

显然,H值的大小与我们的直觉是相符的:群落B的多样性较群落C大,而群落A的多样性等于零。

2均匀性指数编辑

在香农-威纳指数中,包含着两个成分:①种数;②各种间个体分配的均匀性(equiability或evenness)。各种之间,个体分配越均匀,H值就越大。如果每一个体都属于不同的种,多样性指数就最大;如果每一个体都属于同一种,则其多样性指数就最小。那么,均匀性指数如何来测定呢?可以通过估计群落的理论上的最大多样性指数(Hmax),然后以实际的多样性指数对Hmax的比率,从而获得均匀性指数,具体步骤如下:

Hmax=-S(1/S log21/S)=log2S,其中 Hmax=在最大均匀性条件下的种多样性值,S=群落中种数

如果有S个种,在最大均匀性条件下,即每个种有1/S个体比例,所以在此条件下Pi=1/S,举例说,群落中只有两个种时,则:Hmax=log22=1

这与前面的计算是一致的,因此,我们可以把均匀性指数定义为:E=H/ Hmax,其中 E=均匀性指数,H=实测多样性值,Hmax =最大多样性值= log2S

SSR标记编辑

SSR(Simple Sequence Repeats)标记是近年来发展起来的一种以特异引物PCR为基础的分子标记技术,也称为微卫星DNA(MicrosatelliteDNA),是一类由几个核苷酸(一般为1~6个)为重复单位组成的长达几十个核苷酸的串联重复序列.由于每个SSR两侧的序列一般是相对保守的单拷贝序列

中文名 SSR标记 外文名

Si mple Sequence Repeats 特 征

相关重复单位首尾相连、成串排列 释 义

以PCR为基础的分子标记技术 分 类 两大类 优 点 四大优点 应 用

遗传图谱的构建、指纹图的绘制等

目录

1SSR标记

▪ 简介 ▪ 特征 ▪ 分类

2特点

▪ 优点 ▪ 应用

1SSR标记编辑

简介

生物的基因组中,特别是高等生物的基因组中含有大量的重复序列〔14〕,根据重复序列在基因组中的分布形式可将其分为串联重复序列和散布重复序列。

特征

其中,串联重复序列是由相关的重复单位首尾相连、成串排列而成的。

分类

目前发现的串联重复序列主要有两类:

一类是由功能基因组成的(如rRNA和组蛋白基因);

另一类是由无功能的序列组成的。根据重复序列的重复单位的长度,可将串联重复序列分为卫星DNA、微卫星DNA、小卫星DNA等〔3〕。微卫星DNA又叫简单重复序列,指的是基因组中由1~6个核苷酸组成的基本单位重复多次构成的一段DNA,广泛分布于基因组的不同位置,长度一般在200bp以下。研究表明,微卫星在真核生物的基因组中的含量非常丰富,而且常常是随机分布于核DNA中〔15,38〕。在植物中通过对拟南芥〔7〕、玉米〔35〕、水稻〔11〕、小麦〔28,32,33〕等的研究表明微卫星在植物中也很丰富,均匀分布于整个植物基因组中,但不同植物中微卫星出现的频率变化是非常大的,如在主要的农作物中两种最普遍的二核苷酸重复单位(AC)n和(GA)n在水稻、小麦、玉米、烟草中的数量分布频率是不同的。在小麦中估计有3000个(AC)n序列重复和约6000个(GA)n序列重复,两个重复之间的距离平均分别为704kb、440kb〔32,33〕,而在水稻中,(AC)n序列重复约有1000个左右,(GA)n重复约有2000个,重复之间的平均距离分别为450kb、225kb〔41〕。另外在植物中也发现一些三核苷酸和四核苷酸的重复,其中最常见的是(AAG)n、(AAT)n〔15〕。在单子叶和双子叶植物中SSR数量和分布也有差异,平均分别为64.6kb和21.2kb中有一个SSR。研究还发现,单核苷酸及二核苷酸重复类型的SSR主要位于非编码区,而有部分三核苷酸类型位于编码区。另外在叶绿体基因组中,目前也报道了一些微卫星,以A/T序列重复为主〔3〕。

2特点编辑

研究发现,微卫星中重复单位的数目存在高度变异,这些变异表现为微卫星数目的整倍性变异或重复单位序列中的序列有可能不完全相同,因而造成多个位点的多态性。如果能够将这些变异揭示出来,就能发现不同的SSR在不同的种甚至不同个体间的多态性,基于这一想法,人们发展起了SSR标记。SSR标记又称为sequence tagged microsatellite site,简写为STMS,是目前最常用的微卫星标记之一。由于基因组中某一特定的微卫星的侧翼序列通常都是保守性较强的单一序列,因而可以将微卫星侧翼的DNA片段克隆、测序,然后根据微卫星的侧翼序列就可以人工合成引物进行PCR扩增,从而将单个微卫星位点扩增出来。由于单个微卫星位点重复单元在数量上的变异,个体的扩增产物在长度上的变化就产生长度的多态性,这一多态性称为简单序列重复长度多态性(SSLP),每一扩增位点就代表了这一位点的一对等位基因。由于SSR重复数目变化很大,所以SSR标记能揭示比RFLP高得多的

多态性,这就是SSR标记的原理。

优点

与其它分子标记相比,SSR标记具有以下优点:(1)数量丰富,覆盖整个基因组,揭示的多态性高;(2)具有多等位基因的特性,提供的信息量高;(3)以孟德尔方式遗传,呈共显性;(4)每个位点由设计的引物顺序决定,便于不同的实验室相互交流合作开发引物。

应用

因而目前该技术已广泛用于遗传图谱的构建、目标基因的标定、指纹图的绘制等研究中。但应看到,SSR标记的建立首先要对微卫星侧翼序列进行克隆、测序、人工设计合成引物以及标记的定位、作图等基础性研究,因而其开发费用相当高,各个实验室必须进行合作才能开发更多的标记。由于SSR标记具有较大的应用价值,且种属特异性较强,目前在一些主要的农作物中SSR标记研究都进行了合作,共同进行STMS引物的开发。

因篇幅问题不能全部显示,请点此查看更多更全内容