Семейство белков

Семейство белков — это группа эволюционно связанных белков, обладающих гомологичной аминокислотной последовательностью. Этот термин почти синонимичен термину «семейство генов», поскольку, если белки имеют гомологичные аминокислотные последовательности, то и кодирующие их гены также должны проявлять значительную степень гомологии в нуклеотидных последовательностях ДНК. Этот термин не следует путать с термином «семейство» в таксономии видов живых организмов.

Использование терминологии

Также как и для многих других биологических терминов, использование понятия семейство белков сильно зависит от контекста: оно может обозначать большую группу белков с едва заметной гомологией первичных последовательностей, или очень узкую группу белков с почти одинаковой первичной структурой, функцией, и трёхмерной организацией, или любой другой промежуточный случай. Чтобы различить две эти крайние ситуации, Дайхофф ввёл понятие белкового суперсемейства^[1]^[2]^[3]. С течением времени были придуманы такие понятия как класс, группа, клан и подсемейство, но всех их постигла судьба такого же двусмысленного употребления. В общепринятом употреблении подразумевается, что суперсемейство (структурная гомология) содержит семейства (гомология первичной последовательности), которые содержат подсемейства. Следовательно, суперсемейства такие как клан PA протеаз имеют более низкий уровень консервативных последовательностей, чем одно из семейств входящих в него, например семейство C04. Представляется маловероятным, что в ближайшее время появится точное определение с чёткими критериями, а следовательно читателю предстоит самому решить, как именно понимать эти термины в каждом конкретном контексте.

Сверху представлены консервативные последовательности 250 белков из клана PA протеаз (суперсемейство). Ниже, консервативные последовательности 70 белков из протеазного семейства C04. Стрелочки указывают на остатки каталитической триады. Выравнивание выполнено при помощи алгоритма DALI

.

Белковые домены и мотивы

Концепция белкового семейства зародилась во времена, когда было ещё очень мало белков с известной первичной и третичной структурой; в основном были исследованы небольшие, однодоменные белки такие как миоглобин, гемоглобин, и цитохром c. С тех пор обнаружилось, что многие белки содержат множество структурно и функционально независимых единиц или доменов. Из-за происходившей в ходе эволюции рекомбинации генов разные домены развивались независимо. По этой причине в последние годы всё больше внимания уделяют семействам белковых доменов. Целый ряд онлайн ресурсов посвящён определению и каталогизированию таких доменов (см. список в конце статьи).

Части каждого белка имеют разные структурные ограничения (то есть особенности строения необходимые для сохранения структуры и функции протеина). Например, для функционирования активного центра фермента необходимо, что бы определённые аминокислотные остатки были очень точно расположены относительно друг друга в трёхмерном пространстве. С другой стороны, белок-белковое взаимодействие может происходить по большой поверхности и иметь ограничения по гидрофобности или гидрофильности аминокислот. Функционально значимые части белков эволюционируют медленнее, чем неконсервативные регионы такие как поверхностные петли, и дают начало блокам консервативных последовательностей. Такие блоки принято называть мотивами. Как и в предыдущем случае, их определению и каталогизации посвящён целый ряд онлайн ресурсов.

Эволюция семейств белков

В соответствии с существующими на данный момент представлениями, семейства белков могут образовываться двумя путями. В первом случае, происходит разделение родительского вида на два генетически изолированных вида-потомка, что позволяет гену/белку независимо накапливать вариации (мутации) в этих двух линиях. В результате, образуется семейство ортологичных белков, обычно имеющих общий консервативный мотив. Второй путь — это дупликация гена и появления паралога. Поскольку первая копия гена всё ещё способна выполнять свою функцию, то дубликат может свободно изменяться и приобретать новые функции (путём случайных мутаций). Некоторые семейства генов/белков, особенно у эукариот, входе эволюции подвергаются значительному копированию или редукции, иногда вместе с удвоением всего генома.

Филогенетическое дерево суперсемейства Ras-белков

Важность семейств белков

Поскольку общее число белков с известной структурой растёт, а интерес к протеомному анализу увеличивается, то осуществляются попытки организовать белки в семейства и описать их домены и мотивы. Достоверное выделение белковых семейств жизненно необходимо для филогенетического анализа, определения функции белка, исследования множественности функции белка в данной филогенетической группе. Enzyme Function Initiative (EFI) использует семейства и суперсемейства белков как базис для создания стратегии широкомасштабного таксономического распределения энзимов с неизвестной функцией^[4].

Алгоритмические средства для установления семейства белка, основаны на понятии подобия. Большую часть времени единственное сходство к которому у нас есть доступ, это гомология первичной структуры.

Ресурсы, посвящённые семействам белков

Существует немало биологических баз данных, посвящённых семействам белков и позволяющих быстро установить, является ли вновь открытый и идентифицированный белок членом уже известного семейства белков. В частности:

Pfam
PROSITE
InterPro
PASS2^[5]
SUPERFAMILY
SCOP и CATH-классификация белков по семействам, суперсемействам и доменам

Существуют также специализированные поисковые механизмы:

BLAST— поиск по последовательностям ДНК
BLASTp— поиск по последовательностям белков

См. также

Примечания

↑ Dayhoff M. O. Computer analysis of protein sequences. (англ.) // Federation proceedings. — 1974. — Vol. 33, no. 12. — P. 2314—2316. — PMID 4435228. [исправить]
↑ Dayhoff M. O., McLaughlin P. J., Barker W. C., Hunt L. T. Evolution of sequences within protein superfamilies // Die Naturwissenschaften. — 1975. — Апрель (т. 62, № 4). — С. 154—161. — ISSN 0028-1042. — doi:10.1007/BF00608697. [исправить]
↑ Dayhoff M. O. The origin and evolution of protein superfamilies. (англ.) // Federation proceedings. — 1976. — Vol. 35, no. 10. — P. 2132—2138. — PMID 181273. [исправить]
↑ Gerlt John A., Allen Karen N., Almo Steven C., Armstrong Richard N., Babbitt Patricia C., Cronan John E., Dunaway-Mariano Debra, Imker Heidi J., Jacobson Matthew P., Minor Wladek, Poulter C. Dale, Raushel Frank M., Sali Andrej, Shoichet Brian K., Sweedler Jonathan V. The Enzyme Function Initiative // Biochemistry. — 2011. — 22 ноября (т. 50, № 46). — С. 9950—9962. — ISSN 0006-2960. — doi:10.1021/bi201312u. [исправить]
↑ Gandhimathi A., Nair A. G., Sowdhamini R. PASS2 version 4: an update to the database of structure-based sequence alignments of structural domain superfamilies. (англ.) // Nucleic acids research. — 2012. — Vol. 40. — P. D531–534. — doi:10.1093/nar/gkr1096. — PMID 22123743. [исправить]

[1] Dayhoff M. O. Computer analysis of protein sequences. (англ.) // Federation proceedings. — 1974. — Vol. 33, no. 12. — P. 2314—2316. — PMID 4435228. [исправить]

[2] Dayhoff M. O., McLaughlin P. J., Barker W. C., Hunt L. T. Evolution of sequences within protein superfamilies // Die Naturwissenschaften. — 1975. — Апрель (т. 62, № 4). — С. 154—161. — ISSN 0028-1042. — doi:10.1007/BF00608697. [исправить]

[3] Dayhoff M. O. The origin and evolution of protein superfamilies. (англ.) // Federation proceedings. — 1976. — Vol. 35, no. 10. — P. 2132—2138. — PMID 181273. [исправить]

[4] Gerlt John A., Allen Karen N., Almo Steven C., Armstrong Richard N., Babbitt Patricia C., Cronan John E., Dunaway-Mariano Debra, Imker Heidi J., Jacobson Matthew P., Minor Wladek, Poulter C. Dale, Raushel Frank M., Sali Andrej, Shoichet Brian K., Sweedler Jonathan V. The Enzyme Function Initiative // Biochemistry. — 2011. — 22 ноября (т. 50, № 46). — С. 9950—9962. — ISSN 0006-2960. — doi:10.1021/bi201312u. [исправить]

[5] Gandhimathi A., Nair A. G., Sowdhamini R. PASS2 version 4: an update to the database of structure-based sequence alignments of structural domain superfamilies. (англ.) // Nucleic acids research. — 2012. — Vol. 40. — P. D531–534. — doi:10.1093/nar/gkr1096. — PMID 22123743. [исправить]

[1]

[2]

[3]

[4]

[5]