棉花品种资源群体结构与连锁不平衡分析
2021-03-21
来源:年旅网
棉花学报 CoRon Science 2011,23(6):500-506 棉花品种资源群体结构与连锁不平衡分析 张友昌 ,别 墅 ,易先达 ,张成 ,李成奇 ,秦鸿德 (1.湖北省农业科学科院经济作物研究所.武汉430064;2.河南科技学院生命科技学院,新乡453003) 摘要:用基因组扫描的方法,利用棉花9个连锁群上的79个微卫星标- ̄6(Simple sequence repeat,SSR),对收集 的204份陆地棉品种(系)组成的品种资源群体进行群体结构和连锁不平衡(Linkage disequilibrium,LD)分析。 结果表明:本研究群体可划分为3个群体,其中两个群体分别由3个亚群体组成。群体中,47%的标记位点之 间可以观察到显著的LD(P≤0.05)。LD在遗传距离小于120 cM范围内普遍存在。在决定系数I2≤0.05时,LD 在0.01单位的平均衰减距离为29.7 cM.在,≥0.05的条件下能观察到的LD最大遗传距离为31.4 cM,在 ,≥0.1时能观察到LD的最大遗传距离缩小到3.4 cM。群体的连锁不平衡状况表明本研究群体可用于重要育 种性状的关联分析。 关键词:陆地棉;数量性状位点;分子标记;连锁不平衡;群体结构 中图分类号:¥562.024 文献标志码:A 文章编号:1002—7807(201 1)06—0500—07 Population Structure and Linkage Disequilibrium Analysis of Germplasm Resources in U pland Cotton ZHANG You-chang ,BIE Shu ,YI Xian—da ,ZHANG Cheng ,LI Cheng—qi ,QIN Hong—de (1.Cash Crop Institute,Hubei Academy ofAgricultural Sciences,Wuhan 430064,China;2.Henan Instiutte of Technology, Xinxiang,Henan453003,China) Abstract:Population stuctrure and LD(Likagen disequilibrium)of 204 upland coRon accessions were analyzed with 79 SSR (Simple sequence repeat)markers located on nine chromosomes.Analysis of population genetic structure based on SSR data re- vealed that this population could be divided into three groups,two out of which were composed of three subgroups,respectively. 47%ofthe SSR loci pairs showed LD at signiifcant level ofP ̄<O.05.The maximum genetic distance ofLD could be observed extended to 120 cM.The LD average decay distance was 29.7 cM at ≤0.05.Genome wide LD reduced to 3.4 cM at,≥0.1. providing evidence of the potential for association mapping of important traits in coaon breeding program. Key words:upland cotton;quantitative trait locus;molecular marker;linkage disequilibrium;population structure 目前对作物数量性状位点fQuantitative trait locus,QTL)的定位主要用连锁分析的方法.即以 盖率,有利于QTL检测,但定位QTL的结果往往 难以直接用于标记辅助选择。连锁分析方法在棉 花重要农艺性状基因的发掘上仍然存在较大的 局限性 标记基因型为依据,对由两自交亲本杂交形成的 分离群体进行分组,通过比较不同基因型问目标 性状的差异显著性,来推断影响该性状的基因与 标记位点的连锁关系。由于陆地棉的遗传基础狭 窄,品种之间DNA水平上的遗传多态性低.现有 近年发展起来的以连锁不平衡分析为基础, 通过分析标记/性状之间关系的关联分析方法为 重要农艺性状的QTL定位提供了新的手段 连锁不平衡(Linkage disequilibrium,LD)是指不 同分子遗传标记间存在的非随机组合现象_5_。连 锁不平衡作图以自然群体为研究对象,以长期重 陆地棉种内遗传图谱的覆盖率普遍偏低,棉花基 因组的大部分是搜索的盲区l ;选用遗传差异大 的亲本构建图谱可以在一定程度上提高图谱覆 收稿日期:2010—09—25 作者简介:张友昌(1984一),男,硕士研究生; 通讯作者,qinhongde2002@yahootom..ca 基金项目:国家自然科学基金(30971823) 6期 张友昌等:棉花品种资源群体结构与连锁不平衡分析 501 组后保留下来的基因(位点)间连锁不平衡为基 有特殊性状的种质资源材料构建成连锁不平衡 础,将目标性状表型的多样性与基因(或标记位 作图群体,通过SSR(Simple sequence repeat)分子 点)的多态性结合起来分析,可直接鉴定出具有特 标记对群体的亲缘关系、群体结构、连锁不平衡 定功能的基因位点或与表型变异密切相关的标 水平进行研究和评价,以进一步利用关联分析发 记位点。与QTL连锁分析作图策略相比,关联分 掘与重要农艺性状相关的数量性状基因位点同。 析具有不需构建作图群体、作图定位更精确、可 同时考察一个基因座的多个等位基因、可以全基 1 材料与方法 因组进行QTL搜索以及结果可直接用于标记辅 1.1 材料 助选择等优点_6J 本研究用到204个陆地棉品种。其中65个 关联分析能否成功应用以及其定位精度的 为本单位的常用育种中间材料。其余为重要的历 高低与群体的结构、连锁不平衡水平强弱、连锁 史品种或具有特殊性状的种质资源 所用的种质 不平衡延伸范围和衰减距离等密切相关。Abdu. 资源材料从国家棉花中期种质库引进。 rakhmonov等l5_6J的研究显示由不同地域的品种组 1.2 引物来源 成的陆地棉群体的标记连锁不平衡水平符合关 从棉花微卫星标记框架图谱圈的A1,D1,A3, 联分析要求,可以用于关联分析。我国的陆地棉 A5,D5,A6,A8,D8,A9等9条染色体上选取79 最早从美国引进种植,经过长期系统选育和杂交 个具有多态性的SSR标记。这些标记在连锁群上 选育,棉花品种和育种亲本材料逐渐形成了自己 的分布如图1。SSR序列来自CMD(Cotton 的特点,同时也创造出一批我国特有的种质资 Marker Database,CMD)。 源。然而,利用关联分析发掘我国现有品种资源 1.3 方法 材料的重要农艺性状的基因位点则鲜见报道。本 PCR反应体系为10 L,包括1.0 L 10 ̄ 研究利用我国部分陆地棉重要的历史品种、目前 PCR buffer,0.12 L正向引物与反向引物(25 本单位育种中常用的育种中间材料以及部分具 tzmol・L ),Taq DNA聚合酶0.25 U,dNTP 0.8 L A1 D1 BNL3259 (0) SNL3452(2 9NAU2419 (40.1)3薹.9 -.- ̄ NAU5235(598).2)NAU301l2f19 5’ NAU2894(27) 。 NAU2816(31) NAU5255(67 2) — 廿 uNAU3931 2 :;;;i; { 日MUSS162(54) №226 5 2。,——#一 U332铽9。 喾 NAU3497(73 61 J ̄SPR204019' NAU5∞ (108)20 乇卜:NAU2274(133.MAu5,刚54 7)6)2 4 JESPR21 8('44') A6 A8 D8 A 9 33BNL334 '46 5) 7 NAU311 0(148 2) ^ ^++一酬、lL68 O AU3095(伯’9) 连锁群左侧为两标记间遗传距离(cM),右侧为标记名称。A1、A3、A5、A6、A8、A9为A染色体组;D1.D5、D8为D染 色体组。 The left side of linkage group is the genetic distance between wto markers(cM),the right side of the tag is the name of markers.A1,A3,A5,A6,A8,A9 for A chromosome set;D1,D5,D8 for D chromosome set. 图1 79对SSR标记在染色体上的分布图 Fig.1 Distribution of 79 SSRs in chromosomes Cotton Ncience 502 棉 花学报 23卷 (10 mmol・L。1,模板DNA 20 ng。反应体系经95℃ 2结果与分析 预变性3 min.94℃变性1 min、55 ̄57℃退火55 2.1遗传多样性 s、72℃延伸1 min,共34个循环;72 延伸7 利用从130对引物中筛选出的分布于棉花 arin。银染参考张军等[91的程序并略作更改。实验 A1、D1、A3、A5、D5、A6、A8、D8、A9九个连锁群 采用的48孑L的电泳槽盒非变性小板胶,读带采 上79对在群体中具有多态性的SSR引物对204 用0、l格式进行。 份材料进行扫描。在204份材料中共扩增 84 为研究群体材料的遗传组成,并将遗传相似 个基因位点、181个等位基因,平均每个位点2.32 性高的材料划分在一个类群,应用Structure软 个等位基因:各材料间不同位点的等位基因数目 件[m],对群体进行基于数学模型的类群划分…],最 从2个到7个。平均为2.23个:SSR分子水平的 后用Distruct软件包ll2】对Structure软件运行结果 基因多样性指数平均为0.35,变化范围为 进行处理。依据群体划分结果,在个体材料水平 0.017 ̄0.73;等位基因位点多态性水平平均为 和亚群体水平进行基于Nei’s_ l3_的遗传距离分析, 0-29。变化范围为0.017 ̄0.68。 采用Powermark 3.2软件构建聚类图,然后使用 2.2群体结构 Mega 4.0软件观察聚类图。群体内部每个材料与 应用STRUCTRE软件将204个材料群体划 其它材料之间的亲缘关系系数采用SpaGeDi一1-3 分为POP1、POP2和P.MIXED等3个群体,P1.1、 软件进行计算。LD矩阵图和衰减散点图用Tassel P 1—2、P2—1、P2-2、P 1一MIXED、P2.MIXED、P.MIXED 软件绘制,并用 和D’两个参数来评价LD。 等7个亚群体。具体划分结果如表1。 表1 204份品种资源材料群体划分的结果 Table 1 Results of population division of 204 cotton accessions 群体Groups亚群Subgroups 品种资源及其序号Name and orderNo.ofgermplasm resources POP1(89)P1.1(31)86-1/2,U6321/41,V4074/79,V4094/96,GK99-1/7,U6602—1/48,V4076/81,V4097/99,U1037/16。 U6602.2/49,V4077/82,V4101/103,U4031/3l,V4070/75,V4087/89,V4105/107.U4032—2/33, V4072/77,V4093/95,Ejing92/122 Esha28/124,Sumian2/156.Lumian1/135,Sumian3/157.Lu— mian2/140,Wanmian2/163,CCRI3/201,CCRI17/177,Simian3/150,Sumianl3/155.CCRI5/186 Pl一9,’0、 601 Changrmian/4,U6707/61,Ji91—32/127,U4028—1/26,Lumian5/142,CCRI49/185 U6727/63, CCRI23/180 Jifengl97/128 Yumian21/17l CCRI50/187 ZhongR773 309/198 ZhongR773— 3 10/197,U4028—2/27 U6735/64,Jing55 168/129,CCRI7/188。U6562—2/47,ZhongR773—72/199。 ZhongR773.75/200,U6562—1/46,CCRI34/1 82,Zhong932906/1 89,Suyuan04.129/1 62,Keyi2/ 132,V4108/1 10,CCRI35/l83,Eiing55173/121.Lumian21/136 P1.MIxFnf,9、U6651/51,U6475/45,V4069/74,U4032—1/32,U1163—2/24,v4O67/72,V4103/105,V4091/93, Huamian101/126,Yumian9/174,V4095/97,V4107/1O9,CCRI15/176,Kang2/131 V4084/86 V4109/1 l1, CCRI19,Lumian4/141, V4098/1O0, v4085/87, Emianl4/123, v4l00/102。 Han109/125,Sumianl6/154,U6703/60,Zhong31.204/181,V4089/91,V4102/104,Sumian5/158 POP2(104)P2-1(15) Arcot.1/5,U1012—2/15,Simian4/151,ZhongArc一105/191,CCCP8908/152,Am28114—313/144, M一8124一l159/10, U1012—1/14, ZhongARR40683/195, U4029—2/29, ZhongARNuXu/194, Zhongzi04184/202,ZhongArc一185/192,Yumian2067/170,ZhongArc一308/193 U6766.1/67,V4088/90,V4083/85,U6715/62,U4030/30,V4082/84,V4075/80,U4005/25, P2—2(61) U6691/59。U6687/58,Ul163.1/23,U5712/1,U6109/35,J02—508/9,ZC.2/1 13,V4090/92, V4092/94,V4106/108,V41 10/1 12,U6766.2/68,U6224/38。U6235/39。U64l8/43.U6444/44, U6767.1/69,U6767—2/70,V4066/71,V4068/73,KucheT94.6/133,V4073/77,U6636/50, U6675/56,MSCO-12/12,S一050031/13,U1 l61/22,Ul156.2/21,Ul 156—1/20,Ul1 18—2/19。 Ul1 18.1/18,U1087/17。Zhongzi9196/201,Lu6/143,ZhongAR683—77/190.AuL23/757/1 15 Lu— mian29/139,Lu28mian/138,Liaomian4/134,CCRI45/184,Zhong2220/179,Yumianl9/168.Xi— angmian10/165,Xiangl6/164,Ejingl/120,BELLSIRO/1 l6.Deltapine cotton 15/1 17.Deltapine coRon 16/1 l8,Dongting 1/1 19,Shishuang 321/147,Sumian12/153.Sumian6/159,Sumian9/160 P2一MIXED(281 DP410B/6,J02—247/8,U4029—1/28,U6659/52,U6663/53,U6743/66,V4099/101,U6407/42, U6739/65,V4096/98,AmD#1/145,Yumian21/172,V4071/76,V4104/106,Simian2/149, CCRI12/175 U6671/55,AuC/1 14 V4081/84,Yul7.202/167 Zhongzi4480/203 Su08B2— 177/166,Yumian1/169,Jing55263/13,V4086/88。U6265/40。U6679/57。Lumian22/137 P—MIXED MM一2/1 1,86.6/3,U6006/34,U6l10/36,U6132/37,Shandon26/146,Yumian5/173,ZhongR773一 (11) 314/198,U6667/54,Shiyuan321/148 Suxul37/161 Cotton Science 6期 张友昌等:棉花品种资源群体结构与连锁不平衡分析 503 用方差分析对亚群体的基因多样性和等位 它亚群体有显著性差异外,各亚群的基因多样性 基因位点多态性水平(PIC值)进行比较,结果表 和等位基因位点多态性水平在P≤0.05的显著性 明,除了P2-1的等位基因位点多态性水平与其 水平下没有差异(表2)。 表2不同亚群体的多样性统计 Table 2 Diversity statistics of diferent sub—groups PPPPPPP 注: 亚群体间比较,差异达到0.05显著性水平。Note: Signiifcant at P≤0.05 一bet一ween ¨ —subgr oups 2.3聚类分析 U1163-1/23、V4075/80、V4088/90、库车T94—6/133、 亚群问基于Nei’S【l3'遗传距离的UPGMA聚 中棉所45/184与STRUCTRE软件划分结果不 类分析结果(图2)与STRUCTURE分析的结果 一致。 一致,在距离0.04的位置把204个材料划分为2 2.4亲缘关系分析和评价 个群体,4个亚群体。 成对材料亲缘关系系数统计的频数分布如 图4。两两材料间亲缘关系系数为0的有53.1%. 0~0.15的占32%,0.15~0-3的占11.2%,大于 0_3的占2.3%,大于0.4仅占1.2%。随着亲缘关 系系数的增大,对应所占的频率逐渐减小。从亲缘 o.03 o.02 o.o1 o.oo 图2 亚群间基于遗传距离的UPGMA聚类图 关系系数分布来看。204个材料之间的亲缘关系 Fig.2 UPGMA dendrogram based on genetic 系数普遍很小,亲缘关系系数大的只占很小部分。 distance among the subgroups 2.5成对标记的连锁不平衡和LD衰减 基于Nei’S[131遗传距离的材料个体水平聚类 整个群体中连锁的和非连锁位点的组合共 分析结果(图3)。图中短线标记将群体材料划分 有6241种,其中94%的位点组合之间存在LD, 为2个群体,分别为POP1、POP2,与STRUC— 同一连锁群上的连锁不平衡位点占11.9%。在显 TURE划分的结果基本一致。其中,POP1中材料 著性水平P≤0.05的条件下,有47%的SSR位点 GK99—1/7、U4032—2/33、V4101/103与STRUCTRE 之间可以观察到LD。图5为利用Dt和J2两个不 软件划分结果不一致;POP2中材料J02—508/9、 同参数描述LD矩阵的结果。从图6中可以看出, 60 50 孽4O 岛 毫30 2 20 10 0 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 Re]ative kinship 图4 204个材料的亲缘关系图(SPAGeDi的分析结果) Fig.4 Kinships among 204 co ̄on accessions(the analysis results of SPAGeDi) Cotton Science 6期 张友昌等:棉花品种资源群体结构与连锁不平衡分析 505 两个不同参数描述LD矩阵的颜色都较浅,LD不 的遗传距离;Y为两标记问的LD值。 强,但D’值描述的LD要比 描述的LD明显。 由图6可以看出,在遗传距离小于120 cM的 D’描述群体的重组史,而 反应群体的突变史和 情况下普遍存在LD。由回归方程结合LD值可以 重组史。鉴于群体的材料基本上是近几十年来通 得到在 ≥0.05的条件下能观察到的LD最大遗 过杂交选育而成(除少数材料外),因此在关联分 传距离为31.4 cM;在I2为≥0.1时的衰减距离为 析的时候也可以考虑应用D’参数,分析更多的标 3.4 cM;在≥0.2的条件下所能得到的遗传距离小 记与育种目标性状之问的关联状况 于1 cM。在 为0.05~0.1条件下。LD的衰减距 对于本研究群体,非连锁SSR标记问,的值 离为27 cM;在,为O.04~0.05时.LD的衰减距 范围为0.o0~0.32,r2值随遗传距离而衰减(图 离为l7.8 cM;在 为0.03~0.04条件下。LD的 6)。对于连锁的SSR标记对,通过对 值与连锁 衰减距离为27.9 cM;在 为0.02~0.03条件下. 的标记间遗传距离的回归分析得到以下方程: LD的衰减距离为43.5 cM; 在≤0.05时,0.01 Y=.0.0223Ln(x)+0.1269,其中X为标记问 大小的区间里LD平均衰减速度为29.7 cM。 0.9 O.8 0.7 0.6 O.5 0.4 O.3 0.2 O.1 0 0 20 40 60 80 100 120 140 160 180 200 Genetic distance/cM 以200 cM表示来自不同染色体的非连锁位点的遗传距离。 200 cM indicated genetic distance ofnon—linked loci from different chromosomes. 图6 LD(,2)值随遗传距离衰减散点图 Fig.6 Scatter plot of the LD(F)of marker pairs of the inter marker distance 平均为0.35,平均每个位点等位基因数为2.32, 3 讨论 比较亚群体之间的遗传多样性与总群体的差异, 在植物基因组学研究中,连锁不平衡作图利 它们之间的差异不显著。这与Kantartzi等【15]的研 用的是自然群体。自然群体在长期人工选育和进 究结果较为一致(分别为0.40和2.23),这表明不 化中所积累的重组信息,使得连锁不平衡作图具 同来源的陆地棉品种(系)组成的群体具有相似 有较高的解析率㈣;连锁不平衡作图还可实现对 的遗传多样性水平。 作图群体一个基因座上所有等位基因的考察。对 群体的LD水平对连锁不平衡作图的可行性 于遗传基础狭窄、品种间多态性低的陆地棉而 和作图精度有重要影响.了解群体连锁不平衡状 言,利用种质资源群体进行关联分析可以对全基 况是关联分析的基础。Abdurakhmonov等[ 分别 因组进行QTL搜索.结果可直接用于指导育种 用了群体大小为335和285的陆地棉品种材料 过程中的标记辅助选择。 做了与纤维品质相关的关联分析,采用的SSR标 本群体的SSR分子水平的基因多样性指数 记分别为202和95个,在 ≥0.1的条件下,LD Cotton Science 506 棉 花学报 23卷 衰减的遗传距离覆盖了25 cM、10 cM和30 cM, 在I2≥0.2的条件下衰减到5~6 cM、1~2 cM和 diversity and association mapping of ifber quality traits in exotic G.hirsutum L.germplasm[J].Genomics,2008,92:478—487 [6]ABDuRAKHMONOV I Y,Saha S,Jenkins J N,et a1.Linkage disequilibrium based association mapping offiber quality traits in 6~8 cM。在本研究群体中, ≥0.1的条件下的衰 减距离仅为3.4 cM左右,在 ≥0.2的条件下衰减 到l cM以内。比较而言,本研究群体具有更快的 G.hirsutum L.variety germplasm[J].Genetica,2008,136(3): 401—417. 衰减速度,可以更精确定位控制表型性状的QTL。 亲缘关系是影响关联作图的重要因素。本群 体的亲缘关系分布百分比呈现出随亲缘关系的 [7]FLINT—GARCIA S A,Thomsberry J M,Buckler E S Structure oflikage ndisequilibrium in plants[J]Annu Rev Plnta Biol,2003, 54:357.374 增大迅速下降的趋势。绝大多数材料间的亲缘关 系系数小,群体结构比较简单,在做进一步的关 联分析时,可以忽略亲缘关系的影响,采用简单 线性模型进行。对于亲缘关系系数大于0.4的材 料,虽然其系谱关系不明确,但很可能有着共同 的亲本来源,在进一步的关联分析中可以剔除。 参考文献 【1]BRESEGHELLO F,Son'ells M E.Association analysis as a strat— egy for improvement ofquantitative traits in plants[J].Crop Sci, 2006,46(3):1323—1330. [2]张学勇,童依平,游光霞,等.选择牵连效应分析一发掘重要 基因的新思路[J].中国农业科学,2006,39(8):1 526—1535. ZHANG Xue—yong,Tong Yi—ping,You Guang—xia,et a1.Hitch— hiking effect mapping:a new approach for discovering agronom— ic important genes[J].Scientia Agricultura Sinica,2006,39(8): 1526一l535. [3]GUPTA P K,Rustgi S,Kulwal P L.Linkage disequilibrium and association studies in higher plants:Present status and future prospectsⅢ.Plant Molecular Biology,2005,57(4):461—485. 【4]ORAGUZIE N C,Wilcox P L,Rikkerink E H A,et a1.Associa- tion mapping in plants[M].New York:Springer.2007:11—39. 【5]ABDURAKHMONOVIY,KohelR J,Yu J z,et a1.Molecular [8]GUO Wang—zhen,Cai Cai-ping,Wang Chang—biao,et a1.A mi- crosatellite—based,gene—rich linkage map reveals genome struc ture,function,and evolution in Gossypium[J].Genetics,2007, 107:332—335. [9]张军,张天真.棉花微卫星标记的PAGE/银染快速检测[J]. 棉花学报,2000,12(5):267—269. ZHANG Jun,Zhang Tian—zhen.Fast screening of microsatellite markers in cotton with PAGE/silver staining[J].Cotton Science, 2000,1 2(5):267—269. [10]EVANNO G,Regnant S,Goudet J.Detecting the number of clusters of individuals using the software STRUCTURE:a sim— ulation study[J].Molecular Ecology,2005,14(8):261 l-2620. [1 1]ROSENBERG N A.Distruct:a program for the graphical dis— play ofpopulation structure[J].Molecular Ecology Notes,2004, 4:137.138. [12]CALDWELL K S,Russell J,Langridge P,et a1.Extreme popu— lation--dependent linkage disequilibrium detected in an inbreed・- ing plant species,Hordeum vulgate[J].Genetics,2006,172(1): 557.567. 【13]NEI M.Evolution of genes and proteins[M】.Sinauer:Sunder— land.1983:165-190. 【14】JORDE L B.Linkage disequilibrium and the search ofr complex disease gene[J].Genome Research.2000 1O:1435-1444. [1 5]KANTARTZI S K,Stewart J M.Association analysis of fiber traits in Gossypium arboreum accessions[J】.Plant Breeding, 2008.127(2):173—179. ●