Сценарий реконструкции филогенетического дерева

Вернуться к программе

MAKE_TREE:
c
ценарий "Реконструкция филогенетического дерева"

Назначение

Сценарий "MAKE_TREE" позволяет реализовать построение филогенетического дерева последовательностей белкового семейства.

Схема сценария:

Сценарий позволяет последовательно проводить следующие этапы филогенетического анализа белкового семейства:
1. Трансляция нуклеотидных последовательностей в аминокислотные последовательности [M1: SEQTRANS_COMP];
2. Выравнивание аминокислотных последовательностей, редактирование (удаление столбцов с делециями аминокислот) [M2: ALN_COMP];
3. Построение матрицы попарных эволюционных расстояний для набора последовательностей [M3: EVOLDIST_COMP];
4. Построение филогенетического дерева последовательностей [M5: TREE_COMP];
Блок-схема анализа представлена на рисунке. Индексом Mn обозначены счетные модули, последовательное выполнение которых определяется сценарием. Все промежуточные данные, полученные в результате работы счетных модулей доступны пользователю после выполнения сценария.

Full analysis

Схема потока данных и порядка выполнения программных компонент подсистемы "Филогенетический анализ» при выполнении сценария "Построение филогенетического дерева".

Входные данные для сценария:

Невыравненные нуклеотидные последовательности, которые кодируют белки, в формате FASTA.

Выходные данные для сценария:

В ходе выполнения сценария все результаты работы сценария на промежуточных этапах доступны пользователю для контроля и анализа:
Выровненные нуклеотидные последовательности в формате FASTA с делециями и отсутствием столбцов с делециями.
Выровненные аминокислотные последовательности в формате FASTA с делециями и отсутствием столбцов с делециями.
Матрица попарных расстояний в формате matrix.
Филогенетическое дерево, построенное по входным последовательностям в формате Newick.

Описания используемых программных компонент:

M1: SEQTRANS_COMP
Решаемая задача:Трансляция нуклеотидных последовательностей в аминокислотные последовательности.
Входные данные: Набор нуклеотидных последовательностей в формате FASTA.
Выходные данные: Набор аминокислотных последовательностей в формате FASTA.

M2: ALN_COMP
Решаемая задача: Выравнивание аминокислотных последовательностей, удаление столбцов выравнивания, содержащих делеции в аминокислотных последовательностях.
Входные данные: Невыровненные аминокислотные последовательности в формате FASTA.
Выходные данные: Выровненные аминокислотные последовательности в формате FASTA с делециями и отсутствием столбцов с делециями.

M3: ALIGNTRANS_COMP
Решаемая задача: Построение выравнивания кодирующих нуклеотидных последовательностей по выровненным аминокислотным последовательностям, удаление делеций в нуклеотидных последовательностях.
Входные данные: Невыровненные нуклеотидные последовательности в формате FASTA, выровненные аминокислотные последовательности, которые кодируются нуклеотидными, в формате FASTA в одинаковом порядке.
Выходные данные: Выровненные нуклеотидные последовательности в формате FASTA, выровненные нуклеотидные последовательности в формате FASTA с делециями и отсутствием столбцов с делециями.

M4: EVOLDIST_COMP
Решаемая задача: Построение матрицы попарных эволюционных расстояний для набора выравненных аминокислотных последовательностей.
Входные данные: Выровненные аминокислотные последовательности в формате FASTA.
Выходные данные: Матрица попарных расстояний в формате matrix.

M5: TREE_COMP
Решаемая задача: Построение филогенетического дерева по матрице парных расстояний между последовательностями.
Входные данные: Матрица парных расстояний в формате matrix.
Выходные данные: Филогенетическое дерево в формате Newick.

M6: ADAPTSEQ_COMP
Решаемая задача: Поиск пар последовательностей с адаптивной фиксацией замен.
Входные данные: Выровненные нуклеотидные последовательности в формате FASTA без делеций.
Выходные данные: Результаты анализа участков адаптивной эволюции.

M7: ADAPTSITE_COMP
Решаемая задача: Поиск участков адаптивной эволюции в последовательностях, кодирующих белки.
Входные данные: Выровненные нуклеотидные последовательности, которые кодируют белки, без делеций, в формате FASTA, филогенетическое дерево для этого набора последовательностей.
Выходные данные: оценка скоростей замен в позициях белка, оценка числа позиций, в которых замены проходили адаптивным образом.

 

 

 
 

 

Институт Цитологии и Генетики
Сибирское Отделение Российской Академии Наук

Адрес:630090, Новосибирск, Россия,
пр.ак.Лаврентьева,10, ИЦиГ СО РАН
Для телеграмм: Новосибирск 90, ЦИТОЛОГИЯ
Телефон: +7(383) 333·35·26
Факс: +7(383) 333·12·78
E·mail:   icg-adm@bionet.nsc.ru