来自 电脑知识 2019-09-20 23:05 的文章
当前位置: 威尼斯国际官方网站 > 电脑知识 > 正文

扩增子分析解读7物种分类统计

剖析前筹划

# 进入工作目录
cd example_PE250

上一节回想:大家赢得了OTU类别的腾飞分析、同一时候计算Alpha和Beta各类性值。

 

本节是终极一节,我们对物种实行分类计算,筛选高丰度结果用于进化树展现,和别的用于PRADO总计深入分析的结果生成

  1. 按物种分类品级分类集中

OTU表中最要紧的疏解音讯是物种注释音信。经常的物种注释新闻分为7个等第:界、门、纲、目、科、属、种。种是一丁点儿的等第,和OTU类似但有差别等。

我们除了能够相比样品和组间OTU水平差别外,还能商量差异类似等第上的出入,它们是或不是留存那个同台的变化规律。

 

遵守注释的等第举办分拣集中,无论是Excel还PAJERO操作起来,都以很麻烦的进度。这里我们选取QIIME自带的脚本summarize_taxa.py。

# 结果按门、纲、目、科、属五个级别进行分类汇总,对应结果的L2-L6
summarize_taxa.py -i result/otu_table4.biom -o result/sum_taxa # summary each level percentage
# 修改一下文本表头,适合R读取的表格格式
sed -i '/# Const/d;s/#OTU ID.//g' result/sum_taxa/* # format for R read
# 以门为例查看结果
less -S result/sum_taxa/otu_table4_L2.tx

以门为例,大家来看样品的OTU分布在十多少个门,及各类门在各个品中的相相比较例。其余的各等级,客商自身看吗。

 

那步的结果将用来早先时期总括和制图。

威尼斯国际官方网站 , 

  1. 筛选可展现的进化树

大家在小说中见到二种理想的进化树,不过OTU常常成都百货上千,假若直白突显是常有看不清也是比非常难看的。

下边教我们有个别司空见惯的办法来筛选数据,用于转移美貌的进化树。

# 选择OTU表中丰度大于0.1%的OTU
filter_otus_from_otu_table.py --min_count_fraction 0.001 -i result/otu_table4.biom -o temp/otu_table_k1.biom
# 获得对应的fasta序列
filter_fasta.py -f result/rep_seqs.fa -o temp/tax_rep_seqs.fa -b temp/otu_table_k1.biom 
# 统计序列数量,104条,一般100条左右即有大数据的B格,又能读懂和更清规律和细节
grep -c '>' temp/tax_rep_seqs.fa # 104
# 多序列比对
clustalo -i temp/tax_rep_seqs.fa -o temp/tax_rep_seqs_clus.fa --seqtype=DNA --full --force --threads=30
# 建树
make_phylogeny.py -i temp/tax_rep_seqs_clus.fa -o temp/tax_rep_seqs.tree
# 格式转换为R ggtree可用的树
sed "s/'//g" temp/tax_rep_seqs.tree > result/tax_rep_seqs.tree # remove '
# 获得序列ID
grep '>' temp/tax_rep_seqs_clus.fa|sed 's/>//g' > temp/tax_rep_seqs_clus.id
# 获得这些序列的物种注释,用于树上着色显示不同分类信息
awk 'BEGIN{OFS="t";FS="t"} NR==FNR {a[$1]=$0} NR>FNR {print a[$1]}' result/rep_seqs_tax_assignments.txt temp/tax_rep_seqs_clus.id|sed 's/; /t/g'|cut -f 1-5 |sed 's/p__//g;s/c__//g;s/o__//g' > result/tax_rep_seqs.tax
  1. 其它

别的都以一对轻易的格式调换,为前面总括深入分析而绸缪文件。

# 将mappingfile转换为R可读的实验设计
sed 's/#//' mappingfile.txt > result/design.txt
# 转换文本otu_table格式为R可读
sed '/# Const/d;s/#OTU //g;s/ID.//g' result/otu_table4.txt > result/otu_table.txt
# 转换物种注释信息为制表符分隔,方便R读取
sed 's/;/t/g;s/ //g' result/rep_seqs_tax_assignments.txt > result/rep_seqs_tax.txt

本文由威尼斯国际官方网站发布于电脑知识,转载请注明出处:扩增子分析解读7物种分类统计

关键词: