莫惠栋
A Genetic Analysis for Generation Variances (Continued)
三、方差估值的利用
方差是群体的重要特征之一。在遗传理论和育种实践上,都可由之得到一些重要的科学信息。以下列述几个重要方面:
(一)显性势估计
在《世代平均数的遗传分析》一文中,我们曾论及,hd是度
量显性程度的;但推广于多基因系统时,势能比[h][d]并不能说明任一位点基因的显性性质。但是
d和h都可因有正有负而相消,除非两个亲本分别集中了所有增效和减效等
d2位基因。但是,和
h2都是加性效应和显性效应的“积累”,不会产生正、负相消。
设有k对等位基因,d1d2dkd和h1h2hkh,则:
HDhd2i2ih d (18)
所以,HD是可以直接度量多基因系统的显性程度的。要是did,hih,则HD亦将是多基因平均显性程度的度量。
一般称HD为显性度(degree of average dominance)或显性势(dominant potential)。对HD取算术根,当HD0为无显性(只有加性),0HD1为部分显性或
HD1为完全显性,HD1为超显性。如表3的茄红素例,可得
不完全显性,ˆDˆ1.63723.00680.7379,为部分显性。同时从平均数可看出是显性方向是朝H小值亲本的,为负向部分显性。
(二)最小基因数估计
设:(1)两纯合亲本P1和P2分别为联合态,即分别集中了
决定某一性状的全部增效和减效等位基因;(2)各等位基因具相等效应。即
d1d2dkd;(3)无连锁和上位性作用。则P1P2kd(kd)2kd,
1222(P1P2)kd[d],Ddkd(这是将两亲本看成是一个异质纯合群体,取两
亲本的平均数作为该群体的平均数;勿与前述单一亲本相混淆),并有:
11P2)2(PD2d(kd)2k 2Dkd2 (19)
(19)的k为最小基因数(minimum number of genes)或有效因子数(number of effective
factors),即被研究的性状至少受k对等位基因控制。
ˆ3.0068,1(PP)1(8.7115.466)13.2451.6225,以茄红素含量为例,D12222(1.6225)2故,k0.8755
3.0068(19)的k之所以为最小,是由于前述三个假定的任何一个,如未能满足,估计的k值降低;(1)若两纯合亲本的有关等位基因为某种程度的分散态,则(19)分子的[d]变小,
从而低估了k。例如,若两亲本为
AABBCC3,3,3(联合态),则[d]9,
aabbcc3,3,392AABBcc3,3,3(分散态),则3,估计正确;若两亲本为D3327,kaabbCC3,3,3272[d]3,D27,k32270.33,大大低估了k;若有关增效、减效等位基因在两亲本中
均匀分散,如出来。
(2)若各基因效应不相等,即did,则
22,从而使(19)的分母D变大而低dkdi1kAABBccdd3,3,3,3,则k0,真实基因数根本不能由(19)估计
aabbCCDD3,3,3,3估了k。例如,若两纯合亲本为
2,2,22222,则[d]6,Ddi32114,
2,2,2k62/142.57,低估了k。(3)若两个或更多个基因完全连锁,则在估计k时,只能分
辨为一个分离单位(因此缘故,k又称为有效因子数),即k1;若有部分交换,则所得k值也不会比1大多少。一般由(19)而得的k值都不会超过该物种的染色体对数,尽管在精密控制的细胞学实验中,可证明某些数量性状的实际基因数比染色体对数还多得多。所以连锁显然也是影响(19)应用的一个原因。至于上位性效应,因其存在影响对于D的无偏估计,故进而使k得估计有偏。
有效因子数的估计,对于预期分离世代的群体特征(如纯合体和杂合体的比率等)和确定分离世代的群体大小,都是有参考意义的。实际应用时的最关键问题,是要使两个纯合亲本在被研究性状上尽可能是最极端的,即满足上述的第一个假定。由此而得的最小基因数,虽仍然未能排除基因效应不等、连锁等的干扰,但可能是最渐进于实际基因数的。
较早期文献对于k的估计常应用公式:
22(P(P1P2)1P2)k 2228(F2pF2e)8F2g (20)
(20)的依据为:k对杂合等位基因在F2代的分布为(pq),共2k1组,具方差:
F221g2kpq2k(122)k2
2k假定以无量纲1为一个基因替代效应单位,则(P1P2)为2个单位时(一对等位基因)有3组,4个单位时,4个单位时(两对等位基因)有5组,„„,k个单位时有2k1组。于是有:
F22g2(P1P2)k2 2(2k)2F22)g,
(上式移项即得到(20)。而(19)式,当由F2估计时,我们知道F2d1即D22D,
故亦可写成:
222[1(P1(P1P2)]2(P1P2)1P2)k 22D42(F2d)8(F2d)将之与(20)相比较,可见其差异仅是以F2d代F2g。当显性存在时,(20)显然是更加低估了k。
(三)实施选择的合适世代估计 选择是品种改良的基本手段之一。但对自交作物的世代群体而言,只有加性变异才能产生选择响应,并为选择所固定(在无性系,则任何遗传变异都能为选择固定)。因此,要提高对数量性状的选择效率,一是要采取有效措施减少环境误差(非遗传变异);二是要在一个性状上的加性方差已在遗传变异中起作用时,才进行该性状的选择,以避免在陆续消失的显性变异上消耗无益的劳动。
设性状的遗传力为加性—显性模型,则由(12)可知,要求加性方差占遗传方差的比率达到和超过某一定值的世代Ft应满足不等式:
22
2t11t1D2 t1212t11t1Dt1H24lgHD(1)lg21
(21)
解上式可得:t因此,将H和D的估值和要求的值代入(21),即可估计t。(21)中的值,作者建议可用0.90或0.95(即加性方差占遗传方差的90%和95%)。因为,值太小,不能固定的显性变异干扰较大;值太大,则进行选择的世代太迟,群体容量变大。0.90和0.95可
ˆ1.6372,Dˆ3.0063,若以能是互有兼顾而比较折中的值。如表3的茄红素例,已得H0.90和0.95代入(21)即得:
lg1.63720.93.0068(10.9)ˆt13.293lg2lg1.63720.953.0068(10.95)ˆt14.371lg2
这是说,在F4和F3代,茄红素的加性方差占遗传方差的比率已分别超过90%和95%,已是对之进行选择的时机。
(四)遗传力估计
2遗传方差占表型方差的比率定义为广义遗传力(broad sense or
broad heritability),记作hB:
222hBgp
2 (22)
加性方差占表型方差的比率则定义为狭义遗传力( narrow heritability ),记作hN:
222hNdp
2 (23)
1ˆ1ˆ1如表3茄红素例,可得F2g12D2H2(3.0068)2(1.6372)1.9127, 2221ˆˆˆˆD1.5034,FdFpFgEF2.2037。因而有: 22222
2hB1.91272.20370.8679h1.50342.20370.68222N
这说明在F2代,茄红素含量的遗传方差占表型方差的86.79%,加性方差占表型方差的68.22%。
遗传力的直接意义是反映一个育种群体的选择潜力。h0,表明群体不存在遗传变
2异(同质群体),选择无效;h1,则表明一切可见变异都是由遗传原因造成(e0),
22选择达全效。所以,选择的效率将与遗传力值成正比。所谓“遗传力即一个性状的遗传传递力:,乃是一种想当然的误解。
另一个与遗传力意义有些类似的统计数成为遗传变异系数(GCV),但它不是方差之比,而是标准差与平均数之比:
ˆgmˆGCV100或
ˆdmˆ 100 (24)
它表示了一个群体的遗传部分或加性遗传部分的相对变异。GCV愈大,则选择潜力愈大,
愈可能从该群体中选出偏离平均数大的单株或类型。例如,设一群体某一性状的GCV20,则表明如对该性状进行选择,可期望获得比群体平均数大40%或小40%的单株或类型(如果群体有足够大的话),其概率约0.025。若GCV5,则极端单株或类型仅可能比平均数
ˆg和ˆd的选用,则应大10%或小10%。这种期望是以正态分布为基础的。至于(24)中ˆg;视群体性质而定。当群体的一切遗传变异皆为可固定时(如无性系和异质纯合群体)应用当显性变异不能固定时(如自交作物杂交后的分离世
表4 选择系数f和uf、(uf)、k
的对应关系(据正态分布)
ˆd。 代)应用遗传力的一个引申应用,是预期育种群体的选择响应,即遗传进度。设一群体的某性状为N(m,),则在其中选择最大值单株时,当选群体平均数m与原群体平均数m的离差,称为选择差(selection differential),记作i(mm)。i的标准化值称为标准选择差,记作
'2pf
0.50 0.40 0.30 0.20 0.10 0.05 0.04 0.03 0.02 0.01
uf
0.0000 0.2533 0.5244 0.8416 1.2815 1.6448 1.7507 1.8808 2.0537 2.3263
(uf)
0.3989 0.3864 0.3477 0.2799 0.1754 0.1032 0.0862 0.0680 0.0484 0.0267
k
0.80 .97 1.16 1.40 1.75 2.06 2.15 2.27 2.42 2.64
'k(ip)。根据正态分布特性,此k值是选择分数或
选择强度(selection fraction or intensity)f的函数,即:
k(uf)Puuf(uf)f
(25)
(25)中的u是正态标准离差,uf是右尾面积为f的临界值,(uf)为uf点上的概率密度函数,fPuuf。因此,育种家确定f,即可由(25)得k。例如,若准备选择10%的极端大值个体(f0.1),因为正态累积函数F(u1.2815)0.1,故uf1.2815
2)中选择10%大值(1.2815)0.1754,k0.17540.11.75。其意义是,若在N(m,p个体,则必m大1.2815p的个体全部当选;这些当选个体的平均数m将比m大1.75p。如选择小值个体,则只要将上述的“大”改为“小”即可。表4列出了与各种f相对应的uf,
'(uf)和k,可供查用。据之,育种家确定选择选择强度f,即可得到选择差:(确定f可
得k,乘以p得i(实际选择差)或选择响应(response of selection)
ikp
'
' (26)
当选群体的后裔平均数记为mo,它与原群体平均数m的离差(mom)称为选择进度,记作
G或GS。它是对原群体以强度为f施加一次选择的相应。由于遗传力是能对选择起反映
的遗传变异对表型变异的比例,故显然有:
Gih2kph2
(27)
2(27)中的h一般用hN,这时GihkdhN;但在自交作物的高世代或无性系,宜2用hB,这时GihkghB。
222(27)是一个很有用的基本公式。它说明,为获得大的G,首先要有较大的h值,若h0,则选择无效,而h则是可以通过扩大遗传变异和减少环境方差来改进的。其次要有较大的群体容量,以增大i或k(使用较小的f)。当选择响应不理想时,也可用(27)来检查原因:是群体太小限制了k或p的提高呢?还是h太低?
2222ˆ3.0068,Hˆ1.6372;在F代的以表3茄红素含量资料为例,前已得到D2F222ˆd12D1.5034,hN0.6822。因此,若在F2代选择5%(f0.05)高含量单株,则
预期其后裔(F3)的遗传进度为:
G2.061.50340.68222.086(mg/100g)
即比F2群体平均数提高2.086(mg/100g)。若在F4代选择5%高含量单株,则因
F42227ˆ7ˆˆ2.6310,ˆˆd7DDH2.63100.17910.25433.0644,FpFe8864442hN2.63103.06440.8586,故:
G2.062.63100.85863.096(mg/100g)
22ˆ皆提高了。所以,在ˆd和h这里为涉及群体大小。在F4代的选择效果优于F2代,是由于N选择强度一定时,若h和p皆大,G将大大提高。而群体若趋于同质,则G也趋于0。
遗传进度也常以相对数表示,它是遗传进度对原群体平均数的比率,记作RGS:
2RGS100Gm
(28)
在实践上有时还应用实现遗传力(realized heritability),它是从实际结果反推的遗传力。
'因已知(mom)(实际的G)和mm(实际的i)。故据(27)可有:
'h2Gi(m0m)(m'm)
' (29)
(29)是不通过方差分解而得的,在动物方面用得多一些。
遗传力的概念在数量遗传和育种实践上已有广泛应用。但有一些问题是值得特别注意的:
(1)遗传力的组成元素p、g和d都是会随群体、世代和实验设计而变化的。同一
222性状在不同世代、不同杂交组合有不同的遗传力,同一世代的不同性状当然也有不同的遗传力。所以,任一种遗传力都是特定群体的遗传力。不能将一群体的遗传力估计搬用于另一群体,除非有根据说明它们的遗传力确是近似的。如果为了研究某一性状的一般遗传力,则试验材料必须是被研究总体的随机样本,其效应应为随机型。固定型材料是不易获得一般遗传力的正确估计,它们适于作配合力或育种分析。
(2)遗传力是和育种上的选择直接相联系的概念。因此,遗传力的计算,必须和选择单位以及可能对选择发生响应的那一部份遗传变异相应。例如,在单株选择时,遗传力的分
22母应为pge;若以容量为n进行集团(小区、品系等)选择,则pg222212e;n在自交作物的分离世代,遗传力的分子应为d,在无性系和异质纯合群体时则为g等。
(3)由遗传力预期遗传进度(公式27),一般仅对一次(一代)选择有效。如对选择群体再选择,则必须重新估计该选择群体的p和h。一般的说,g和h都将随选择次数(代数)的增多而减少。直至g0,h0,选择无效,即所谓达到了“育种高原”(breeding plateau)。
(五)分离极限估计 分离极限是一个群体育种潜力的重要标志之一。自交作物的纯系杂交后,从F2代开始(这时F2g2222222211,加性方差随世代的递增而增加,显性方DH)
24差则不断减少。根据(12),可导得Ft比Ft1的加性方差增加量D为:
2t112t21DDt1Dt2Dt1
222Ft代比Ft1代的显性方差减小量H为
2t212t112t13Ht2Ht1Ht1H
444所以,最终的结果必然是产生一系列纯合的重组系(异质纯合群体),趋于以m为中心,以
D为方差的正态分布,即N(m,D)。于是,该群体的分离极限可近似地估计为:
L1m2D,L2m2D (30)
而大于或小于某一指定值Xi的重组系的出现概率则可估计为:
P(u)du和P(u)du
uiui (31)
(31)中的ui(Xim)统计表上查得。
D,为Xi的正态标准离差;P为正态累积函数,可从现成的
ˆ3.0068,Dˆ1.73;应用《世代平均的遗传分析》以表3的茄红素含量为例,已知Dˆ6.68。因而,我们可估计该杂交组合茄红素含量的分离极限为: 一文中的方法可得m
L1L26.68(21.73)3.2210.14(mg/100g)
茄红素含量高于大值亲本(加613)的重组系得出现概率为:
u(8.7116.68)1.731.17
P1.17(u)du11.17(u)du0.1210
茄红素含量低于小值亲本(佛强秘911)的重组系的出现概率为:
u(5.4666.68)1.730.70
P0.70(u)du0.2420
一般的说,出现概率P0.1的重组系是不容易因漂变(drift)而丧失的。因而,在加
613×佛强秘911的分离世代中,选得茄红素含量高于加613的重组系有着现实可能性;但选得低于佛强秘911的可能性要更大。
因篇幅问题不能全部显示,请点此查看更多更全内容