birmaga.ru
добавить свой файл

1

Семестр 4. Элементы методики работы с последовательностями



Задание 1: Семейства белков в биоинформатике

30 янв 2004

Семейства белков



Семейство – у нас – объединение любого уровня иерархии, т.к. пока нет универсальной системы классификации белков.
Семейство – белки, объединяемые общностью происхождения, которую можно обосновать рационально, общностью пространственной структуры и функции.

Необходимые элементы рационального обоснование общности происхождения - сходство последовательностей и/или пространственных структур.
Сходство последовательностей не имеет однозначного определения, это понятие эмпирическое ­– зависит от конкретного семейства и опыта исследователя. Поэтому в неочевидных случаях биологическая обоснованность сходства последовательностей должна обосновываться!
То же верно по отношению к сходству структур.
Белки с общей функцией, но несходными последовательностями и несходными пространственными структурами в данном контексте не могут входить в одно семейство.
Из-за явления перетасовки доменов (domain shuffling, domain fusion) общность происхождения может быть иногда определена только для отдельных участков полипептидной цепи - доменов.
Биоинформатическое описание семейства (в типичной ситуации) состоит из перечисленных ниже разделов.


  1. Определение семейства - какие белки ­– если знать о них все! – относятся к семейству, а какие – нет.
    Примеры

  2. Встречаемость по таксонам (species distribution) – в каких таксонах представлены белки семейства
    Примеры

  3. Функции белков семейства
    Примеры

  4. Последовательности

    1. Выборка последовательностей ­­– какие источники (БД, релиз), метод нахождения, критерии включения, число и список находок.
      Примеры
    2. Выравнивание последовательностей (или представителей? кого представителей?).


    3. Доменная структура белков семейства.

    4. Описание выравнивания "по вертикали" – выделение участков достоверного выравнивания; консервативных участков; консервативных позиций.

    5. Создание профиля, HMM и/или паттерна для отлова последовательностей семейства ("детекторы семейства")

    6. Описание "контраста" семейства - насколько его представители отличаются по последовательности от всех других белков.

  5. Пространственные структуры

    1. Выборка пространственных структур

    2. Определение доменной структуры

    3. Аннотация консервативных участков, консервативных а.о. по структуре

    4. Аннотация а.о. по структуре – гидрофобное ядро, активные центры, области взаимодействия с лигандами, др. белковыми молекулами, РНК, ДНК

    5. Выделение консервативных особенностей 3D структуры на основе сравнения нескольких структур

  6. Подсемейства

    1. Выделение подсемейств по доменной структуре

    2. Выделение подсемейств по специфичности (особенностям функции)

    3. Выделение подсемейств по выравниванию отдельных доменов - деление выравнивания "по горизонтали"

  7. Реконструкция эволюции

    1. Построение филогенетического дерева (деревьев).


Суперсемейство - у нас - наиболее широкое семейство (которое не представляется возможным расширить)

Замечания по составлению биоинформатического описания семейства





  1. Обычно невозможно руководствоваться списком, приведенным выше, как планом действий, т.к. пункты взаимозависимы.
    Например,
    - выравнивание может корректироваться по пространственной структуре представителей или по доменному составу;
    - определение семейства может быть уточнено на основании выборки

    Т.о. составление подобного описания – итог технической работы, анализа результатов и литературы, размышлений.

  2. Часто по каким-то из разделов не удается ничего толкового написать.
    Например,
    - если не решена пространственная структуры ни одного из представителей семейства или др. достоверного родственника
    - если ничего не известно о функциях белков (такое бывает)