ggtree:一款强大的R语言绘制生物进化树工具

ggtree:一款强大的R语言绘制生物进化树工具

在生物信息学和进化生物学领域,树状图(phylogenetic trees)是用来表示物种之间进化关系的重要工具。ggtree是一个基于ggplot2的R包,专门用于可视化进化树,支持多种树状图的格式,如Newick、Nexus、PhyloXML等,它不仅能绘制基础的进化树,还能结合数据在树上进行注释和高级自定义,是进化分析中不可或缺的工具之一。

安装ggtree

要安装ggtree,你需要先确保已经安装了R和Bioconductor。ggtree作为Bioconductor的一部分,可以通过以下命令安装:

if (!requireNamespace("BiocManager", quietly = TRUE))

install.packages("BiocManager")

BiocManager::install("ggtree")

ggtree使用示例

接下来,我们将通过几个不同的例子来展示ggtree的强大功能。

示例1:基础进化树绘制

首先,我们需要一个进化树的数据。这里,我们使用ggtree自带的一个示例数据集。

library(ggtree)

tree <- rtree(10) # 生成一个包含10个物种的随机进化树

ggtree(tree) + geom_tiplab() # 绘制进化树,并在末端添加物种标签

[图片上传中...(image.png-1a95f8-1712712160088-0)]

这段代码会生成一个基础的进化树,每个物种在树的末端都有标签。

示例2:进化树上添加注释

ggtree支持在进化树上添加多种注释,比如高亮某些分支、添加图形标记等。

ggtree(tree) +

geom_tiplab() +

geom_highlight(node=5, fill="lightblue") + # 高亮显示编号为5的节点

geom_nodelab(aes(label=node), nudge_x=0.5) # 在节点旁添加节点编号

这段代码在基础进化树的基础上,高亮了编号为5的节点,并在每个节点旁边添加了节点编号。

示例3:绘制圈状图

library("ggplot2")

library("ggtree")

library("colorspace")

treFile="input.tre" #进化树文件

groupFile="group.txt" #树枝分类

outFile="tree.pdf" #输出

#读取属性文件,把属性信息保存到list

cls=list()

rt=read.table(groupFile,sep="\t",header=T)

for(i in 1:nrow(rt)){

otu=as.character(rt[i,1])

phylum=as.character(rt[i,2])

cls[[phylum]]=c(cls[[phylum]], otu)

}

phylumNames=names(cls)

phylumNum=length(phylumNames)

#读取进化树文件,和属性文件合并

tree=read.tree(treFile)

tree=groupOTU(tree, cls)

#绘制

pdf(file=outFile, width=8, height=8)

ggtree(tree,

layout="circular",

ladderize = F,

branch.length="none",

aes(color=group)) +

scale_color_manual(values=c(rainbow_hcl(phylumNum+1)),breaks=phylumNames, labels=phylumNames ) +

theme(legend.position="right") +

geom_text(aes(label=paste(" ",label,sep=""),

angle=angle+45),

size=2)

dev.off()

加载所需的包:ggplot2、ggtree和colorspace。

定义变量:

treFile:进化树文件的路径。

groupFile:树枝分类的属性文件路径。

outFile:输出文件的路径。

读取属性文件,并将属性信息保存到cls列表中。

cls:一个列表,以属性值(例如“phylum”)作为键,对应的样本编号列表作为值。

读取进化树文件,并根据属性文件合并属性信息到树中。

tree:从进化树文件中读取的进化树对象。

groupOTU:自定义函数,用于将属性信息合并到进化树中的叶节点(OTU)。

绘制进化树:

使用ggtree函数绘制树,设置布局为圆形(layout="circular")。

ladderize = F:不对树进行阶梯化处理。

branch.length="none":不显示分支长度。

使用aes(color=group)对树的分支进行着色,着色的属性为group。

设置颜色:

使用scale_color_manual手动设置颜色映射,使用rainbow_hcl函数生成不同类别的颜色,类别数为phylumNum+1(属性值的数量加一,为了保证颜色不重复)。

breaks=phylumNames, labels=phylumNames:设置颜色映射的标签,即属性值的名称。

设置图例位置为右侧(theme(legend.position="right"))。

使用geom_text添加文本标签,标签内容为label,并根据angle+45设置标签的角度偏移,size=2设置标签的大小。

最后,将绘制的图保存为PDF文件(pdf(file=outFile, width=8, height=8)),并关闭绘图设备(dev.off())。

相关推荐

三星港版和国行区别
365bet线上娱乐

三星港版和国行区别

⌛ 10-21 👁️ 6177
蛙蛙养殖场中文版v1.0免安装版
365bet规则

蛙蛙养殖场中文版v1.0免安装版

⌛ 09-15 👁️ 8794
根据规定涉毒罪会判多少年?
365bet规则

根据规定涉毒罪会判多少年?

⌛ 11-08 👁️ 2957