系统发育树构建分析
..
实习报告3:系统发育树构建与分析
——Phylip方法,MEGA方法,MrBayes方法
学号 20090**** 姓名 ****** 专业年级 生命生技******
实验时间 2012.6.15 时间 2012.6.17
实验目的:
1. 学会使用Phylip,MEGA和MrBayes构建进化树;
2. 学会分析建树结果,体会各种方法差异
实验
:
1. 利用系统发育分析软件PHYLIP、MEGA、MrBayes分别对同源核酸序列和同
源蛋白质序列构建系统发育树,分析比较建树结果。
2. 完成作业。
作业:
1. 利用实习1搜索到的五个以上物种的直系同源核酸和蛋白质序列(给出fasta格式第一行
信息),用Phylip软件,分别选择最大简约法,最大似然法和距离法(NJ, UPGMA, FM)构
建进化树,
bootstrap产生500个伪样本,分析核酸和蛋白质序列采用不同建树方法得
到的进化树是否存在差异,试分析原因。
答:
直系同源核酸序列(calcium binding protein):
>Homo_sapiens gi|315221156|ref|NM_002964.4| Homo sapiens S100 calcium binding protein A8 (S100A8), mRNA
>Pan_troglodytes gi|114559691|ref|XM_001137986.1| PREDICTED: Pan troglodytes S100 calcium binding protein A8, transcript variant 3 (S100A8), mRNA >Macaca_mulatta gi|388453998|ref|NM_001266907.1| Macaca mulatta S100 calcium binding protein A8 (S100A8), mRNA
>Canis_lupus_familiarisgi|225784824|ref|NM_001146144.1| Canis lupus familiaris S100 calcium binding protein A8 (S100A8), mRNA
>Mus_musculus gi|113930764|ref|NM_013650.2| Mus musculus S100 calcium binding protein A8 (calgranulin A) (S100a8), mRNA
>attus_norvegicus gi|281485599|ref|NM_053822.2| Rattus norvegicus S100 calcium binding protein A8 (S100a8), mRNA
直系同源蛋白质序列(calcium binding protein):
>Homo_sapiens gi|21614544|ref|NP_002955.2| protein S100-A8 [Homo sapiens] >Pan_troglodytes gi|114559692|ref|XP_001137986.1| PREDICTED: protein S100-A8 isoform 3 [Pan troglodytes]
>Macaca_mulatta gi|109016347|ref|XP_001110530.1| PREDICTED: protein S100-A8 isoform 3 [Macaca mulatta]
>Canis_lupus_familiaris gi|225784825|ref|NP_001139616.1| protein S100-A8 [Canis lupus familiaris]
>Bos_taurus gi|165973998|ref|NP_001107197.1| protein S100-A8 [Bos taurus] .
..
>Mus_musculus gi|7305453|ref|NP_038678.1| protein S100-A8 [Mus musculus]
>Rattus_norvegicus gi|16758672|ref|NP_446274.1| S100 calcium binding protein A8 [Rattus
norvegicus]
(1)最大简约法同源核酸序列建树结果如图所示:
由系统发育树可以看出,Homo sapiens,Pan troglodytes的具有较近的亲缘关系,Pan troglodytes与Macaca mulatta的亲缘关系较远,Canis lupus familiaris和Bos taurus亲缘关系较近,Mus musculus和Rattus norvegicus的亲缘关系较近。且其中,Rattus norvegicus和Pan troglodytes的亲缘关系最远。
(2)最大似然法同源核酸建序列建树结果如图所示:
由系统发育树可以看出,最大似然法同源核酸建序列建树与最大简约法同源核酸序列建树的结果相似,Rattus norvegicus和Pan troglodytes同样具有最远亲缘关系。Homo sapiens,Pan troglodytes的具有较近的亲缘关系,Pan troglodytes与Macaca mulatta的亲缘关系较远,Canis lupus familiaris和Bos taurus亲缘关系较近,Mus musculus和Rattus norvegicus的 的亲缘关系较近。
距离法(距离计算模型为默认):
(3)NJ法同源核酸建序列建树结果如图所示:
.
..
由上示系统发育树可以看出,NJ法同源核酸建序列建树结果与上述两种建树结果具有差异,Homo sapiens,Macaca mulatta的 具有较近的亲缘关系,Pan troglodytes与Homo sapiens的亲缘关系较近,Canis lupus familiaris和Bos taurus亲缘关系较近,Mus musculus和Rattus norvegicus的 的亲缘关系较近,而Mus musculus和Macaca mulatta的亲缘关系最远。
(4)UPGMA法同源核酸建序列建树结果如图7所示:
由系统发育树可以看出,Macaca mulatta,Pan troglodytes的 的亲缘关系较近,Homo sapiens与Macaca mulatta的亲缘关系较近,Canis lupus familiaris和Bos taurus亲缘关系较近,Mus musculus和Rattus norvegicus的 的亲缘关系较近,Rattus norvegicus和Pan troglodytes的亲缘关系较近。
(5)FM法同源核酸建序列建树结果如图9所示:
由系统发育树可以看出,Homo sapiens与Macaca mulatta,Pan troglodytes的 具有较近的亲缘关系, Pan troglodytes与Macaca mulatta的亲缘关系则较远,Pan troglodytes与.
..
Macaca mulatta的亲缘关系较远,Canis lupus familiaris和Bos taurus亲缘关系较近,Mus musculus和Rattus norvegicus的 的亲缘关系较近。
(6)最大简约法同源蛋白质建序列建树结果如图所示:
由系统发育树可以看出,Homo sapiens,Pan troglodytes的 具有较近的亲缘关系,Pan troglodytes与Macaca mulatta的亲缘关系较远,Canis lupus familiaris和Bos taurus亲缘关系较近,Mus musculus和Rattus norvegicus的 的亲缘关系较近,Rattus norvegicus与其他物种的亲缘关系相对较远远。
(7)最大似然法同源蛋白质序列建树结果如图所示:
由系统发育树可以看出,Homo sapiens,Pan troglodytes的 具有较近的亲缘关系,Pan troglodytes与Macaca mulatta的亲缘关系较远,Canis lupus familiaris和Bos taurus亲缘关系较近,Mus musculus和Rattus norvegicus的 的亲缘关系较近,Macaca mulatta与其他物种的亲缘关系相对最远。
距离法(距离计算模型为默认)
(8)NJ法同源蛋白质序列建树结果如图所示:
.
..
由系统发育树可以看出,Homo sapiens,Pan troglodytes的 具有较近的亲缘关系,Pan troglodytes与Macaca mulatta的亲缘关系较远,Canis lupus familiaris和Bos taurus亲缘关系较近,Mus musculus和Rattus norvegicus的 的亲缘关系较近,Pan troglodytes与其他的物种的亲缘关系相对较远。
(9)UPGMA法同源蛋白质序列建树结果如图所示:
由系统发育树可以看出,Macaca mulatta与其他的物种的 的亲缘关系相对较远,Homo sapiens与Pan troglodytes的亲缘关系较近,Canis lupus familiaris和Bos taurus亲缘关系较近,Mus musculus和Rattus norvegicus的 的亲缘关系较近。
(10)FM法同源蛋白质序列建树结果如图所示:
由系统发育树可以看出,Homo sapiens,Pan troglodytes的 具有较近的亲缘关系,Macaca mulatta与其他物种的亲缘关系相对较远,Canis lupus familiaris和Bos taurus亲缘关.
..
系较近,Mus musculus和Rattus norvegicus的 的亲缘关系较近。
2. 将上题的同源核酸和蛋白质序列利用MEGA软件提供的五种建树方法分别构建进化树,分析核酸和蛋白质序列采用不同建树方法得到的进化树有何异同,与Phylip使用对应算法得到的树是否存在差异。
答:
同源核酸序列建树:
(1)ML方法建树如图所示:
Pan troglodytesMus musculus
Canis lupus familiaris
Macaca mulatta
Homo sapiens
attus norvegicus 0.2
由系统发育树可以看出,Homo sapiens,Rattus norvegicus的 具有较近的亲缘关系,Mus musculus,Macaca mulatta,Canis lupus familiaris的亲缘关系较近,Pan troglodytes和Bos taurus亲缘关系较近,Rattus norvegicus的 除了Homo sapiens外,与其他物种的亲缘关系均较远。其中,Macaca mulatta,Canis lupus familiaris的亲缘关系最近。
(2)NJ方法建树如图所示:
Mus musculus
Canis lupus familiaris
Macaca mulatta Bos taurus•
attus norvegicus Homo sapiens0.2
由系统发育树可以看出,NJ方法建树与ML方法结果基本类似,只是Rattus norvegicus,Homo sapien亲缘关系比ML方法较远外,其他基本一致:Homo sapiens,Rattus norvegicus的 具有较近的亲缘关系,Mus musculus,Macaca mulatta,Canis lupus familiaris的亲缘关系较近,Pan troglodytes和Bos taurus亲缘关系较近,Rattus norvegicus的 除了Homo sapiens外,与其他物种的亲缘关系均较远。其中,Macaca mulatta,Canis lupus familiaris的亲缘关系最近。
(3)ME方法建树如图所示:
.
..
Mus musculus
Canis lupus familiaris
Macaca mulatta Bos taurus
attus norvegicus Homo sapiens0.2
由系统发育树可以看出ME方法建树与NJ方法建树结果一致:Macaca mulatta,Canis lupus familiaris的亲缘关系最近,Homo sapiens,Rattus norvegicus的 具有较近的亲缘关系,Mus musculus,Macaca mulatta,Canis lupus familiaris的亲缘关系较近,Pan troglodytes
和Bos taurus亲缘关系较近,Homo sapiens,Rattus norvegicus的钙结合蛋白与其他物种的亲缘关系较远。
(4)UPGMA方法建树如图所示:
Macaca mulatta
Mus musculus
Pan troglodytes
Bos taurus
Homo sapiens
attus norvegicus
1.00.80.60.40.20.0
由系统发育树可以看出UPGMA方法建树结果与其他方法建树结果差异较大:Macaca mulatta,Mus musculus,Canis lupus familiaris的亲缘关系较近,Homo sapiens,Rattus norvegicus的 具有较近的亲缘关系, Pan troglodytes和Bos taurus亲缘关系较近。
(5)MP方法建树如图所示:
Pan troglodytesattus norvegicus
Bos taurusHomo sapiens
Mus musculusCanis lupus familiaris
Macaca mulatta20
由系统发育树可以看出MP方法建树与其他方法建树结果一致:Macaca mulatta,Canis lupus familiaris的亲缘关系最近,与Mus musculus的亲缘关系较近,Homo sapiens,Rattus norvegicus的S100-A8具有较近的亲缘关系,Mus musculus,Macaca mulatta,.
..
Canis lupus familiaris与其他物种的亲缘关系均较远,Pan troglodytes和Bos taurus亲缘关系较近,Homo sapiens,Rattus norvegicus的钙结合蛋白亲缘关系较近。
同源蛋白质建树:
(6)ML方法建树如图所示:
Macaca mulatta
Pan troglodytesHomo sapiens Canis lupus familiaris
Bos taurus
Rattus norvegicus
Mus musculus0.05
由系统发育树可以看出,Homo sapiens,Pan troglodytes的 的亲缘关系最近,他们与Macaca mulatta的亲缘关系较近,Canis lupus familiaris和Bos taurus亲缘关系较近,Mus musculus和Rattus norvegicus的 的亲缘关系较近。Mus musculus除了与Pan troglodytes
的亲缘关系较近外,与其他物种亲缘关系均较远。
(7)NJ方法建树如图所示:
Macaca mulatta
Pan troglodytesHomo sapiens
Bos taurus
Rattus norvegicus
Mus musculus0.05
由NJ构建的系统发育树可以看出,NJ方法建树结果与ML方法建树结果基本一致如:Homo sapiens,Pan troglodytes的 的亲缘关系最近,他们与Macaca mulatta的亲缘关系较近,Canis lupus familiaris和Bos taurus亲缘关系较近,Mus musculus和Rattus norvegicus的 的亲缘关系较近。Mus musculus除了与Pan troglodytes的亲缘关系较近外,与其他物种亲缘关系均较远。
(8)ME方法建树如图所示:
.
..
Macaca mulatta
Pan troglodytes Canis lupus familiarisHomo sapiens
Bos taurus
Rattus norvegicus•
Mus musculus0.05
由ME方法构建的系统发育树可以看出,ME方法建树结果与ML,NJ方法建树结果基本一致,同为:Homo sapiens,Pan troglodytes的 的亲缘关系最近,他们与Macaca mulatta的亲缘关系较近,Canis lupus familiaris和Bos taurus亲缘关系较近,Mus musculus和Rattus norvegicus的 的亲缘关系较近。Mus musculus除了与Pan troglodytes的亲缘关系较近外,与其他物种亲缘关系均较远。
(9)UPGMA方法建树如图所示:
Homo sapiens
Macaca mulatta
Canis lupus familiaris
Bos taurus
Mus musculus
Rattus norvegicus0.250.200.150.100.050.00
由蛋白序列UPGMA方法构建的系统发育树可以看出,蛋白质序列UPGMA方法构建的系统发育树与核酸序列UPGMA方法构建的系统发育树树形类似,但是也有较多差异:Macaca mulatta,Homo sapiens的亲缘关系较近,Canis lupus familiaris和Bos taurus亲缘关系较近,Mus musculus,Rattus norvegicus的钙结合蛋白具有较近的亲缘关系。
(10)MP方法建树如图所示:
Macaca mulatta•
Pan troglodytes Canis lupus familiaris•Homo sapiens
Bos taurus
Rattus norvegicus Mus musculus5
由蛋白质序列MP方法构建的系统发育树可以看出蛋白质序列MP方法建树与核酸序列MP.
..
方法建树结果类似:Pan troglodytes和Homo sapiens 的亲缘关系最近,Bos taurus,Canis lupus familiaris的亲缘关系较近,Mus musculus与Rattus norvegicus的S100-A8具有较近的亲缘关系但是与其他物种的亲缘关系均较远。
3. 将上题的同源核酸和蛋白质序列利用MrBayes软件构建进化树,说明简要的操作步骤,分析核酸和蛋白质序列得到的进化树是否存在差异,与 Phylip和MEGA建树方法有何异同。 MP
答:
核酸同源序列建树:
利用同源核酸序列MrBayes软件构建进化树如下图所示:
蛋白质同源序列建树:
利用MrBayes软件构建进化树如下:
由同源蛋白质序列利用MrBayes软件构建进化树结果看出,其结果和MEGA利用蛋白质序列构建的进化树结果类似,如,Homo sapiens,Pan troglodyte的亲缘关系最近,他们与Macaca mulatta的亲缘关系较近,Canis lupus familiaris和Bos taurus亲缘关系较近,Mus musculus和Rattus norvegicus的S100-A8的亲缘关系较近。Mus musculus除了与Pan troglodytes的亲缘关系较近外,与其他物种亲缘关系均较远。
分析:核酸序列构建系统发育树差异较大,而蛋白质序列构建的系统发育树差异较小。而各种建树方法中,MP方法和ML方法构建的系统发育树较为类似,距离法中UPGMA方法建.
..
树结果与其他NJ方法和FM方法建树结果差异较大。原因在于MP法是通过序列中产生可观测变异所需的步骤数构建进化树,而ML法是通过概率计算来找到最能反映一组序列中变异的系统树,它采用
的概率模型分析序列中的各种变异;距离法是首先需要获得一组序列中两两间的差异,然后根据差异数值构建进化树。
在上述三种软件中,Phylip的建树结果差异较大,MEGA的蛋白质序列建树结果差异却较小,五种建树方法结果基本类似,MrBayes蛋白质序列建树结果和MEGA蛋白质序列建树结果基本类似,因贝叶斯方法是利用给定数据寻找概率最大的树型,得出的建树结果较为准确。
.