K值确定
首页 > 学习园地 > 知识共享 > K值确定

K值确定

计算每个K值STRUCUTURE计算3次重复的LnP(D)和Var[LnP(D)]的平均值。

ΔK的分子=(K+1的LnP(D)平均值+K-1的LnP(D)平均值)-2*K的LnP(D)平均值。如下图K=2时,ΔK的分子=(E4+E10)-2*E7

Var[LnP(D)]是LnP(D)的方差,标准差等于Var[LnP(D)]/群体样本数

ΔK=SQRT(ABS(ΔK的分子/标准差))

 

计算完成后,对数据进行整理。如下图所示。插入带曲线的散点图,生成LnP(D)和ΔK随着K值变化的曲线图。K值在两个曲线的拐点处。

 

注:官网上有命令行控制的软件版本,在百度文库中有较为详细的使用说明,可在服务器上用命令行控制,计算数据量较大的群体结构分析。百度文库链接https://wenku.baidu.com/view/a6e057d9d1f34693daef3e87.html###

 

 

 

STRUCTURE软件运行的结果result文件夹用zip格式压缩后打包上传至STRUCTURE HARVESTER 网站,自动进行,并且会提供最佳K值和整理好的的Clummp输入格式文件文件后缀名.indfile。网站网址为http://taylor0.biology.ucla.edu/structureHarvester/

 

网站页面如下

在将Structure运行的Results打包为zip压缩文件后,点击选择文件,

打开成功后,如下图

直接点击Harves!就可以得到分析结果。

这个图与上面excel计算的ΔK随K值变化曲线是同一个图。并且,网站会显示出最佳K值。


我们可以根据最佳K值去上面的CLUMPP input file去选择对应的indfile,用于clumpp合并3次运行的reslut结果。

在结果展示一开始的地方,我们还可以打包下载所有的分析结果。如下图所示。

这个网站非常方便,可以比手动计算节约非常多的时间。接下来就是要将确定的K值对应的3次重重计算结果合并为1个Q值矩阵,做出Q值百分比堆积柱形图和将Q矩阵作为协方差矫正GWAS的结果了。