系统进化树的构建及编辑
技术支持系统发育树的构建及其后期编辑
又到了研究生写毕业论文的时候了,这几天两个师妹相继让我教他们构建系统发育树。索性就做一个图文的帖子,方便大家。纯技术贴,不涉及建树序列的选择、系统发育树如何看等理论性问题。要问的话,送一句话,自己多找几篇文章看看人家怎么分析系统发育树的。
1) FASTA 格式序列文本
FASTA是Zui为常用的序列格式,几乎所有序列分析软件都能识别这种格式的序列。构树之前先将所选的序列都粘贴在一个txt文本文件中,然后每条序列以 >开头,后面可以接序列描述性语言,比如属名,种名等。然后换行粘贴序列,序列的Zui后用空格结束,这就是一个FASTA格式的序列了。需要注意的一点是每条序列的名字的前10个字符不要完全相同。为了方便起见,Zui好将此文件放在桌面上。编辑后的序列见下图:
2) Clustal X进行多序列比对
下载此软件,解压之后直接用。解压图如下:
点击第一行Zui后一个图标,然后点击file,load sequence,选择正确路径。加载进来的序列如下图:
点击比对,进行完全比对。这时会弹出一个对话框,如下:
这时将路径改为桌面,点击对齐进行全序列比对,序列较多的话可能需要点时间。比对后的结果如下图 (注意区别):
然后注意桌面上多了两个文件,一个是dnd格式的,一个是aln格式的。Aln格式的文件将用来进行后续工作。关掉clustalX窗口即可。
3) aln 格式转化为MEG格式
打开MEGA4.0,点击file,convert to MEGA format,出现如下对话框:
选择路径,将aln格式文档加载进来,点击OK,出现下图:
点击保存,会发现在桌面上又多了一个文档,看其属性会发现是MEG格式的,OK。
4) MEG文档的激活
关掉这些窗口,回到MEGA刚打开时的样子,将刚生成的那个MEG文档用拖拽的方式拖进MEGA4.0,这时会出现如下对话框:
废话一句:核酸序列比对选核酸序列,氨基酸序列比对选氨基酸序列。点击OK,出现如下:
关掉这个界面,此时该MEG文档已被激活,处于待用状态,如下 (可以和MEGA初始界面做下对比):
5) 开始建树(NJ tree)
原理不讲了,此处以构建NJ树为例。点击工具栏上的phylogeny,construct phylogeny,neighbor joining (NJ).出现如下界面(注意几个绿颜色的小方块):
点击第一个小绿方块,选择,小绿方块会变成四个点的省略号,再点击出现如下页面:
选择Bootstrap,后面的replication改为1000,点击对勾。然后点击第三个小绿方块,这个时候对于蛋白质序列以及DNA序列,两者模型的选择是不同的。对于蛋白质的序列,多选择Poisson Correction (泊松修正)这一模型。而对于核酸序列,多选择Kimura 2-parameter (Kimura-2参数) 模型。所有设置完毕之后,点击compute,雏形的树就出来了:
可以对此树做出一些修改,比如线条粗细,树的形状等等,此处自己多试试。
6)树的修饰
建好树之后,往往需要对树做一些美化。这个工作完全可以在word中完成,达到发表文章的要求。点击image,copy to clipboard。新建一个word文档,选择粘贴。见下图:
在图上点击右键,就可以对文字的字体大小,倾斜等做出修饰。见下图:
这个时候可以通过Adobe professional 对其进行图像导出:先将此word文档打印成PDF,见下图:
将打印出来的PDF保存在桌面上,打开,如下图:
此时,点击 工具,高级编辑工具,裁剪工具,如下图所示:
选择需要的区域以删除周围的空白区,双击发育树,会出现下图:
点击确定,出现下图 (把空边切掉了):
点击文件,另存为,在保存类型一栏中选择 TIFF格式,点击确定后会生成下面这个图片,所生成图片绝对可以满足文章的发表:
OK,结束了,自己玩一把吧。
好像有点小遗漏,对齐后的序列要把两端截成一样齐的,你的那个对齐的aln文件,前面有的长有的短,你好像没有写要把首尾截成一样长……
建成的树,MEGA里面也可以修改,还可以改变枝的颜色,调整两个枝的上下顺序等……:D:D
没有一定要把首尾截成一样长这样一说的,呵呵。MEGA里面是可以做一些修改,但是我一直都不知道怎么在里面添加 alpha、beta等希腊字母:D
NJ树是采用距离罚分的吧,如果没有一样长的话,不是无形之中就加大了两个树之间的距离了吗?我觉得还是应该截一下吧。。
我刚才测试了一下,好像是可以加入一些希腊字母的,不过好像是字体的差异,字体改行不好,呵呵,不过,我一般是用MEGA来改一些Line的Width和颜色,再在画图板里面改,个人爱好呵呵!
道理是这样的,NJ树多用于相似性较大的序列构建进化树。相似性较差的用NJ法不是很好,会增加长枝吸引。
这个并非本贴所要讨论的,要讨论估计又可以码一个帖子了。
线条粗细我也是在MEGA中调的,线条颜色没改动过,字体我都是在word中完成的。一篇文章中还画了椭圆,也是在word中实现的。
这个并非本贴所要讨论的,要讨论估计又可以码一个帖子了。
线条粗细我也是在MEGA中调的,线条颜 ...
我们建系统树都是截断首尾的,呵呵
正在画树,很实用!!
楼主会做对应分析不(correspondence analysis)
建成的树,MEGA里面也可以修改,还可以改变枝的颜色,调整两个枝的上下顺序 ...
这才像做个进化树的人,做进化树,选择的序列也需模式菌种,才有说服力
恩,是这样的。
此贴纯技术贴,不讨论其他。。
谢谢分享,我一直想总结,就是没动手。
感谢楼主这么多的分享啊,正要用呢
讲解的很清楚,谢谢,不用发愁了,呵呵,真是感谢
我也会,就是不能很好的应用 这我上课还给大家讲过呢
那个序列比对也可以在emga中进行的,这样就可以不用那个clustal X。
我还没有用过mega做过序列比对呢,试试看。
很好,很强大,有天我也能发这么个帖子帮人就美好了
太感谢你了,所有想要学习的东东都有了。。。
弱弱出个声儿,mega4.0中不是嵌合了Clustal了么,为什么我们还要下载一个ClustalX呢?
我没有用过mega中的clustal 哦,呵呵。
怎么网页上面的图全挂了呀?一直都想学怎么建树,在网上也找了很多资料看,Zui终还是以失败告终,今天看到lz的帖子很是不错,顶了,可美中不足的是图挂了,所以可否请lz把上面的发给我。。。不胜感激
虽然自己会这样做,但还是谢谢你的清晰讲解!
太麻烦了。
有更简单的方法出现?介绍下啊
直接采用mega 5来做就好了。
导入序列,比对,通过选择NJ算法就直接出结果了。
这个要顶。可以自力更生了
这个图文并茂的教程早点出现就好了,摸瞎了很久。有几个问题想请教,师兄用的是mega4.0对吧?mega4.0已然嵌有aglin by clustalW,为什么您还要用ClustalX呢?二者有clustal的结果什么区别吗?
另外,如果序列长短不一,可能存在长枝吸引,是不是应该处理下序列(把它们首尾截齐)?师兄可否对这方面进行下补充呢?
嘶。。。继续小白,您这个教程里clustaiX的作用是什么呢?
呵呵,做序列比对的。我没有用过MEGA中的内嵌clustal,因为大多时候我需要导出序列比对的图来说明保守域。
首尾截断我在前面已经提过了,不是必须的。
有一点不明白的,希望楼主能解答:第5步构建NJ树中第三个图里面有original tree和bootstrap consensus tree,到底选哪个比较好呢?谢谢