种质资源遗传多样性分析
首页 > 学习园地 > 知识共享 > 种质资源遗传多样性分析

种质资源遗传多样性分析

简要介绍

遗传多样性评价、分子身份证和新基因挖掘是种质资源利用的3大内容。遗传多样性指的是群体的复杂程度,遗传多样性评价方法主要包括形态学标记、同工酶标记和DNA分子标记。目前最流行的方法是DNA分子标记的方法,分子标记的发展从最初的AFLP、RFLP、RAPD和SSR标记,过渡到更高通量、二等位和共显性的SNP标记。

这里,小编不免要傲娇地说:我们专注基因分型十余年,为大家提供多个平台,各种通量的SNP分型服务。

标记选择

分子标记方法对种质资源进行基因分型,选取标记的方式一般是全基因组选择互不连锁的标记,可以随机选择也可以根据遗传连锁图谱每隔一定的遗传距离(一般是5-10cM)选择一个标记。这样选择的目的是尽可能全面客观的评价,对种质资源的遗传构成有一个较为全面的评估。另外一种选择标记的策略是针对某一类基因开发的基因标记,使用这样的基因标记则是可以体现关注的这些基因位点在群体的分布特征,带有明显的目的性,可以针对这些基因在种质资源中的多态性、地理位置分布、单倍型分化和选择作用等。

评价指标

获得基因分型之后,我们可以借助一系列的数据分析软件对标记基因型进行分析。遗传多样性分析软件主要有:POWERMARKER3.0、Genalex6.2、NTSYSPC2.10e、POPGene32,STRUCUTRE V2.0和CLUMPP2.0等(后续会介绍软件的使用方法)。通过这些软件,我们可以得到分子标记每个位点的多样性信息,如多态性百分比、最小等位基因频率/位点、等位基因数/位点、有效等位基因数/位点、等位基因型数/位点、杂合度/位点、基因多样性/位点、多态性信息含量/位点和多样性指数/位点等,在位点平均水平评估群体的遗传多样性。

1.多态性百分比(Polymorphic Percentage)

是指多态性标记占检测所使用的标记数目的百分比。

2.最小等位基因频率(Minor allele frequency)

是指标记多态性位点的基因座位上,出现次数最少的等位基因的频率。这个名词缩写为MAF,但是非常容易与主等位基因频率(Major allele frequency, MAF)混淆,并且在有参考基因组的时候,通常指的是变异类型的等位基因频率。

3.等位基因数(Number of observed alleles)

多态性位点上实际的等位基因数目。

4.有效等位基因数(Number of effective alleles)

理想群体中(所有等位基因频率相等),一个基因座上产生与实际群体中相同的纯合度所需的等位基因数。它等于实际群体的纯合度的倒数。等位基因数和有效等位基因数差距越大,表明群体是一个偏斜群体,可能在某些少数个体中特有的等位基因(Private alleles)。

5.基因多样性(Gene Diversity)

通常是指期望杂合度,从群体中随机选择两个等位基因是不同的等位基因的概率。

6.杂合度(Heterozygosity)

每个位点上杂合个体占总体数目的比例。

7.多态性信息含量(Polymorphic Information content, PIC)

一个标记用于在群体检测多态性的价值。PIC取决于检测的等位基因的数目和它们的频率分布。其值等于1减去所有等位基因频率的平方的总和。等位基因数越大,PIC就越大;等位基因是一个特定数目,等位基因频率越平等,PIC的就越高。

8.Shannon多样性指数(I)

又叫香农-威纳指数(Shannon-Wiener Index),是反映丰富度和均匀度的综合指标。应用多样性指数时,具低丰富度和高均匀度的群落与具高丰富度与低均匀度的群落,可能得到相同的多样性指数。

群体分层结构分析

除了上述这些对多态性位点的评估,遗传多样性分析还包括了材料两两间遗传相似系数和遗传距离、群体分层结构等。遗传相似系数可以通过NTSYSPC2.10e软件计算得到,并且可以通过非加权类平均法进行聚类分析;遗传距离矩阵可以通过POWEMARKERV3.0软件计算基于等位基因频率的遗传距离,并可以进行UPGMA法和邻位相连(Neighbor-Joining, NJ)法进行聚类分析。这两个聚类分析都可以输出聚类树,对种质资源材料两两间的亲缘关系和种质资源群体分层结构是很好的参考数据。

群体分层结构分析目前主要是3种方法:前面提到的两种聚类方法(UPGMA聚类和NJ聚类),Genalex6.2软件和NTSYSPC2.10e软件的二维主坐标分析(PCA)以及STRUCTUREV2.0软件的群体结构分析。在数据分析过程中,可结合3者以及种质资源的材料来源地、品种育成时期等特征对种质资源的遗传结构进行剖析。

群体结构分析之后,一般还是要对划分的各个亚群进行遗传多样性比较,对不同地域来源划分的亚群也可以进行比较分析,以了解某个地域或者某个育种阶段的品种具有的特征。对亚群的遗传多样性分析、分子遗传变异方差分析、群体分化系数、亚群间基因流、群体间多样性比较、群体间遗传距离等分析在Genalex6.2软件中分析比较容易实现。

分析意义

种质资源遗传多样性评价是非常有意义的基础工作。通过分析这么多的让人眼花缭乱又抽象的指标能说明什么问题呢?小编总结了一下,主要可以有以下5个方面的意义:

·        遗传多样性越高,变异来源广泛,从种质资源中能够筛选出优良种质的几率越高。

·        为划分杂种优势群作参考。根据材料间的亲缘关系远近划分杂种优势群,亲缘关系越远,杂种优势越明显。

·        通过各个指标可以观测各位点的遗传复杂水平、各等位基因是否在群体中是均匀分布,对种质资源的整体遗传结构有较为深入的了解。对群体结构的评估还可以作为利用种质资源进行等位基因挖掘消除假阳性的协方差。

·        对具有生物学意义的亚群,如野生种、不同地域来源、不同育种时期、不同亚种、不同育种来源获得的种质在DNA水平上遗传差异,对这些具有生物学意义的亚群具有哪些特有等位基因、与其他亚群的关系,结合表型上的特征,对作物种质资源有更深入和全面的认知。

·        指导构建核心种质和微核心种质。作物的种质资源通常包括了非常庞大数目的种质,对育种单位来说,对所有种质的收集、评价和保存都是非常细致繁琐的工作,也需要花费大量的人力和物力。核心种质和微核心种质尽可能保留了更多的遗传变异,又节约了成本,所以对种质资源的表型多样性和遗传多样性进行评价可以结合地域来源、育种来源、亚种划分等信息指导构建核心种质与微核心种质。

本期小编和大家一起学习了遗传多样性分析中标记选择、数据分析及意义,欢迎大家留言补充交流,下期跟大家一起学习相关软件的使用方法,欢迎继续关注我们的公众号哦。

翼和部分服务一览

·    低中高各通量SNP分型平台

·    STR分型平台

·    二代高通量目标基因/区段测序

·    二代高通量目标基因甲基化测序

·    全外显子组测序

·    转录组测序

·    细胞系遗传背景STR鉴定

·      基因表达定量检测