公司简介
首页 > 关于翼和 > 公司动态 > 【技术】群体遗传结构分析软件系列(4)

【技术】群体遗传结构分析软件系列(4)

原创: 深山老妖 上海翼和生物 9月25日

 

往期相关文章:
群体遗传结构分析软件系列(1)
群体遗传结构分析软件系列(2)
群体遗传结构分析软件系列(3)

群体遗传结构:是指群体中存在分层的现象,即在群体中存在多个亚群。亚群的混合会增加群体的复杂程度,使得对遗传连锁不平衡的评估偏高。因此,在基于连锁不平衡进行定位的关联分析中,需要对群体结构进行分析,将其作为协方差,校正群体分层造成的假阳性关联结果。

翼和生物往期文章介绍了群体遗传结构分析软件,在Q-plot绘制过程中,应用最为广泛的软件是Distruct1.1。该软件对图中亚群标注非常方便。一起来看一下这款软件的使用方法。

 

所需文件列表

序号

文件名

文件描述

是否必需

1

***.indivq

Clumpp整合后的Q矩阵及预设群体信息

2

***.languages

预设群体标注,显示在图片上方

3

***.names

预设群体标注,显示在图片下方

4

***.perm

定义分组颜色,排序

5

***.popq

预设群体平均Q值及个体数

6

***_f

Structure运行结果文件,可不用准备

7

drawparams

运行参数文件

 

 

文件格式转换技巧

有些老师看到这一个个奇怪的文件后缀就眼晕,其实很简单,将数据保存在txt文件中,然后将文件扩展名修改为需要的后缀就可以了。需要注意的是,文件夹选项(文件查看文件扩展名)是否选择了显示文件后缀。有的老师修改了文件后缀也无法运行,这是因为文件夹选项未选择显示文件后缀,实际上只是修改了文件名,文件仍然是txt文件,所以软件仍然无法运行。 

 

 

个体Q矩阵:***.indivq文件

***.indivq文件是Clumpp2.0软件合并后的Q矩阵,可以直接将outfile文件的后缀修改为indivq即可。第1列数字编号,第2列样本编号,第3列基因型数据中缺失标记数,第4列亚群编号(例图中62950等),第5列为:”(注意冒号的格式为英文输入法下的:),第6列以后为样本对应各亚群的Q值矩阵。平时查看文件内容可以用写字板打开。

个体根据种群(预设群体、品种/品系)的代码自动分组归类,图中个体从左到右的顺序与输入文件中个体的从上到下的顺序相同。

 

 

群体Q值文件:***.popq文件

Popq文件每行代表一个预设群体的信息,第一列数字编号为预设群体的数字代码,其后是一列冒号。请注意冒号格式,需要英文输入法的冒号,请不要在中文状态下输入冒号!最后一列为预设群体的个体数目。冒号和最后一列之间为cluster1clusterK的群体Q值,为对应cluster的群体内个体Q值的均值。可excel进行格式整理,另存为txt格式文件,然后再将文件后缀改为.popq

 

预设群体标注文件:***.languages和***.names

这两个文件可以对Q plot进行预设群体(population)的标注。***.languages中的标注信息会显示在图片上方;***.names中的标注会显示在图片下方。通常预设群体的编号名称显示在图片下方,对预设群体的注释信息显示在图片上方。例图中的505157等均为预设群体数字编号。如果没有预设群体,这两个文件可以省略。

Drawparams文件中,如果将print label below/atop设置为1,程序将搜索infile label below/atop指定的文件(***.names/***.languages)。默认值是将群体代码(编号)打印为标签。如果找到该文件(***.names/***.languages),文件行上的群体的输入顺序将用于群体图形的左右顺序。如果图形上下都需要标注,请将两个文件的群体输入顺序保持一致。

 

 

定义分组颜色***.perm文件

最佳K值的数值有多大,颜色种类就要有多少。当颜色不够用时,可以在文件夹ColorBrewer中选用。

这个文件还决定了垂直集群的展示顺序和颜色,简单讲就是每个line的几个cluster展示顺序及代表颜色。Drawparams中指定的infile cluster perm文件,程序会自动查找***.perm文件,并根据文件中cluster+颜色的排列顺序展示在图片中。颜色英文单词不区分大小写。 

 

Drawparams设置

参数文件也是必需文件之一,需要根据实际的文件名以及个体数和预设群体数进行修改参数。其中还可以设置图片的一些参数,一般采用默认值即可。

软件运行

将整理好的文件放在软件存储文件夹下,选择合适系统的exe文件,双击,即可获得结果文件***.ps,该文件可以在作图软件Adobe_IllustratorAI)中打开,并且进行编辑,另存为PDF、jpgtif等格式的图形文件。

 

最后生成的Q plot效果

 

关于翼和

上海翼和应用生物技术有限公司是上海市遗传学会理事单位,是一家具有十多年历史、提供各类分子遗传学技术服务和分子诊断临床试剂盒开发的创新型企业。目前翼和最具代表性的服务包括:基于高通量测序平台的目标区域重测序(Hi-Reseq)、二代SNP分型(Hi-SNP)、目标区域甲基化测序(Hi-MethylSeq)、多倍体扩增子测序SNP分型、肿瘤样本靶向深度测序、小鼠品系鉴定等;基于一代测序平台的中低通量的PCR-LDR SNP分型、个性化STR/SSR分型、细胞STR鉴定等;基于ABI7500/7900平台的荧光定量PCR检测服务、拷贝数变异多样性(CNV)检测等。

十五年遗传学服务经验,技术更专业!数据更可靠!服务态度更端正!

期待与您的合作!

上海翼和应用生物技术有限公司

地址:上海市松江区龙腾路1015弄中星创意园2502

实验基地:江苏省无锡市滨湖区马山镇梅梁西路138号7号楼1

公司官网:http://www.biowing.com.cn

服务热线:021-33559491、021-33559492

邮箱:market@biowing.com.cn

微信公众号:上海翼和生物