birmaga.ru
добавить свой файл

1
Филогенетическое дерево и его реконструкция.

1. Изображение дерева
На основе имеющейся скобочной формулы
(((А:35,В:35):5,(С:35,D:35):15):50,(Е:40,F:40):60);
посредством программы было построено изображение дерева.


2. Описание дерева как разбиения множества листьев.
Предложенное в задании дерево (см. рис.) имеет 9 ветвей, шесть из которых являются внешними, а три внутренними. Внешними ветвями называются те «линии», которые отходят от какого-либо листа, т.е. попросту соединяют его с другими элементами дерева. А внутренние ветви образуют более сложную организацию листьев, формируют так называемые кластеры (множества листьев, расположенные с одного или другого конца этой ветви).
На рисунке все три внутренние ветви выделены разными цветами. Например, красная ветвь делит множество всех листьев на кластеры A,B и C,D,E,F (все остальные), а синяя – на E,F и A,B,C,D.
Таким образом, топологию дерева можно представить в виде таблицы, где столбцы есть ничто иное, как листья, а строки – это ветви. Причем в нем можно оставить лишь те строки, которые соответствуют внутренним ветвям, поскольку внешние ветви – информации не несут.

ABCDEF

..****

**..**

****..

3. Получение искуственных мутантных последовательностей.
Мы можем создать искусственные последовательности, которые будут соответствовать листьям и узлам дерева, считая, что в корне находится последовательность гена белка alf_ecoli.
Длина последовательности этого гена составляет 1080bp.
Поскольку в качестве расстояний между элементами даны количества мутаций на 100 оснований, то для перехода к абсолютным значениям мутаций (имеются в виду исключительно замены) нужно воспользоваться следующей формулой:
X=(1080N)/100,

где X – абсолютное значение числа мутаций, N – расстояние, приведенное в скобочной формуле, 1080 – длина последовательности гена.

Воспользовавшись данной формулой, мы можем пересчитать все расстояния.
Далее для получения «мутантов» обратимся к программе msbar пакета EMBOSS. Запущенный скрипт имел следующий вид:
msbar alf_ecoli_gene.fasta junc_EF.fasta -point 4 -count 648 -auto

msbar junc_EF.fasta E.fasta -point 4 -count 432 -auto

msbar junc_EF.fasta F.fasta -point 4 -count 432 -auto

msbar alf_ecoli_gene.fasta junc_ABCD.fasta -point 4 -count 540 -auto

msbar junc_ABCD.fasta junc_AB.fasta -point 4 -count 54 -auto

msbar junc_ABCD.fasta junc_CD.fasta -point 4 -count 162 -auto

msbar junc_AB.fasta A.fasta -point 4 -count 378 -auto

msbar junc_AB.fasta B.fasta -point 4 -count 378 -auto

msbar junc_CD.fasta C.fasta -point 4 -count 378 -auto

msbar junc_CD.fasta D.fasta -point 4 -count 378 -auto

4. Реконструкция дерева алгоритмами UPGMA, Neighbor-joining и максимального правдоподобия. Сравнение деревьев.
Полученные последовательности были записаны в один файл. При этом «мутанты» были вручную переименованы.
Алгоритм максимального правдоподобия (неукорененное дерево).
fdnaml mutants.fasta -ttratio 1 -auto
Полученное изображение:
+--------F

+------------------------------4

+--1 +---------E

| |

| +-------B

|

| +------D

3----2

| +-------C

|

+-------A
Предварительно посчитаем попарные расстояния между последовательностями программой fdnadist:
fdnadist mutants.fasta -ttratio 1 -auto
Полученный файл в формате *.fdnalist используется далее.
Алгоритм Neighbor-joining (неукорененное).
fneighbor mutants.fdnadist -auto
+-------C

+---2

! +-------D

!

! +-------B

3-4

! ! +----------E

! +--------------------------------1


! +--------F

!

+--------A

Реконструкция алгоритмом
UPGMA (укорененное дерево!)
fneighbor mutants.fdnadist -treetype u -outfile mutants_upgma -auto
+----------------A

+---2

! +----------------B

+-------------------------------4

! ! +--------------C

! +-----1

--5 +--------------D

!

! +------------------E

+---------------------------------3

+------------------F


ABCDEF

Исходное дерево модели

Максимальное правдоподобие

Neighbor-joining

UPGMA

. . ****

+

-

-

+

** . . **

+

+

+

+

**** . .

+

+

+

+

. * . . **

-

+

+

-


Единственный метод, построивший верное дерево в данной ситуации, - это метод, основанный на алгоритме UPGMA.

5. Бутстреп-анализ множественного выравнивания и построение консенсусного дерева.
Последовательно использовались следующие команды:
fseqboot
mutants.fasta -auto [создается 100 бутстреп-реплик выравнивания]
fdnaml mutants.fseqboot -ttratio 1 -auto [полученные 100 выравниваний подаются на вход программе fdnaml. В выходном файле (.treefile) получаем 100 скобочных формул, соответствующих реконструкциям, сделанным по каждому из выравниваний]
fconsense mutants.treefile
Косенсусное дерево выглядит следующим образом:
+------F

+100.0-|

| +------E

+-99.0-|

| | +------A

+------| +-58.0-|

| | +------B

| |

| +--------------------D

|

+---------------------------C

Топология полученного консенсусного дерева описывается следующим образом:
..**.. 100.00

..**** 99.00

....** 58.00
Топология реального дерева (см. пункт 1):
ABCDEF

..****

**..**

****..
Эти цифры справа (бустреп-значения) показывают, в скольки деревьях из ста «случайных» встретилась эта ветвь, таким образом характеризуя статистическую надежность, биологическую достоверность соответствующих ветвей.
Несмотря на невысокое значение у одной из ветвей, она есть и в реальном дереве.
Т.е. топология реального и консенсусного деревьев полностью совпадает.

6. Создание изображения дерева программой fdrawtree.
Использовалась команда:
fdrawtree mutanty.treefile