公司简介
首页 > 关于翼和 > 公司动态 > SPAGeDi软件----家系效应(kinship)矩阵

SPAGeDi软件----家系效应(kinship)矩阵

群体结构矩阵(Q矩阵)/PCA矩阵、家系效应(K)矩阵经常作为协方差,被用于混合线性模型的关联分析中。亲缘关系是群体遗传学中的一个重要参数,在基因组预测和全基因组关联研究中都起着重要作用。根据系谱,亲缘关系系数最初来源于赖特的近亲繁殖系数,定义为个体的两个等位基因通过血统相同的概率(IBD)。两个个体之间的亲缘关系系数是从每个个体中随机抽取两个等位基因的概率。基于覆盖整个基因组的遗传标记推算家系效应,可以揭示不同家系间的真实关系。基于性状关联标记推算一种特定性状的亲缘关系,对基因组预测更为有效。然而,它必须与测试标记互补才能在gwas中获得统计能力。此外,两组个体之间的亲缘关系显示了基因组预测和GWAS在平衡表型错误和个体间可区分的遗传差异方面的优势。(Kinship Evolution for Genome Prediction and Association Study. Zhiwu Zhang 2013

前面用四个系列的文章介绍了群体结构分析的一系列软件使用方法,本期与大家一起分享一下家系效应Kinship矩阵的计算软件SPAGeDi软件。

1. 软件下载

下载网址http://ebe.ulb.ac.be/ebe/SPAGeDi.html,可下载最新windows版本,免安装 version1.5

 

2. 输入文件格式

这里借鉴张学海博士的一张图说明SPAGeDi软件的数据输入格式。

 

值得注意的是,在数据结束后,最后一行需要有个“结束语”,软件需要输入END,请注意,是大写的END!!!否则软件无法运行!

3. 软件运行

软件直接双击,会被windows自动防御系统屏蔽,所以需要在dos命令行运行。打开dos操作界面的步骤:运行à输入CMDà点击确定即可弹出命令行界面。

 

DOS切换盘符:直接输入软件所在盘符+冒号。如:D:,按Enter回车即可切换成功;

切换工作目录:需要命令cd+路径。如切换到软件文件夹:cd SPAGeDI,按Enter回车即可进入软件所在文件夹。

运行软件:直接输入SPAGeDi软件的exe文件全名,如果嫌麻烦可以给软件重新命名一个简单的文件名,我将软件exe文件命名为SPAGeDi.exe,运行软件时直接输入SPAGeDi.exe即可。

 

4. 参数设置

输入文件名称:上面运行SPAGeDi.exe后,点击Enter弹出如下界面,需要输入数据文件,如果没有自己重命名一个文件,数据输入文件默认的文件为in.txt,软件会自动读取该文件中的数据。

 

结果存储文件,上一步数据输入文件in.txt后,点击Enter,会弹出下面的界面,输入分析结果存储文件,默认文件名为out.txt,也可根据自己喜好设置输出结果存储文件名。

 

输入结果存储文件名如out.txt,点击Enter,弹出如下界面:

 

继续点击Enter,进入下一步。选择需要计算的内容及方法,kinship一般是选择1-KINSHIP coefficient<loiselle et al., 1995>,这一步直接输入1,点击回车即可。

 

回车之后会弹出以下界面,继续选择参数4-Jackknife over loci,同理输入4,点击Enter回车。

 

回车后的界面如下,继续点击回车。

 

上一步的回车之后弹出的界面如下所示,这一步需要注意,根据SPAGeDi版本的不同,编号对应的方法不同。如网上流传的版本这一步需要输入3,但是会运行出错。1.5版本需要选择的output option4- Report matrices with pairwise spatial distances and genetic coefficients。输入4,点击Enter回车,进入下一步。

 

上一步回车之后的界面如下,这一步输入3,点击Enter回车。软件即开始运行,生成结果文件。

 

5. 结果矩阵

结果存储在前面设定的结果存储文件中,如果没有设置,则默认存储于out.txt中。将txt文件直接拖动到excel中打开,找到Pairwise KINSHIP coefficients (Loiselle et al., 1995),此处的矩阵即为Kinship矩阵。

 

6. 应用与协方差矩阵前的处理

SPAGeDi软件计算的Kinship矩阵不能直接用于混合线性模型的协方差矩阵。将矩阵复制到excel中后,做3步转换:1.将小于0的数据用0代替;2.对角线上空的单元格输入13.整体矩阵乘以2,最后生成的矩阵可用于TASSEL软件混合线性模型校正家系混合造成的假阳性关系结果。

本期内容到此结束,如果数据分析相关问题欢迎给我们留言,或者拨打公司服务热线021-33559491 021-33559492联系我们!翼和15年基因分型服务经验,更专业!