Альтернативный сплайсинг глазами художника. Фермент РНК-полимераза (зеленые комки) ползет в нашу сторону по молекуле ДНК (скрученный тяж) и «считывает» ее, синтезируя молекулу РНК (разноцветная лента). В молекуле РНК интроны показаны серым, экзоны — яркими цветами. Сплайсосома (желтые комки) вырезает из молекулы РНК интроны и сшивает экзоны друг с другом. Первая (ближняя к нам) сплайсосома включила зеленый экзон в состав зрелой мРНК, а вторая (дальняя) собралась его вырезать вместе с двумя прилегающими интронами (в этом и состоитальтернативность сплайсинга в данном случае). Вырезанные фрагменты РНК уплывают вдаль, облепленные разнообразными полупрозрачными РНК-связывающими белками. Рис. © Graham T. Johnson. с сайта www.hhmi.org
Альтернативный сплайсинг — механизм редактирования молекул РНК, благодаря которому на основе одного и того же гена организм может синтезировать несколько вариантов (изоформ) белковой молекулы. Анализ 400 млн фрагментов РНК из разных тканей и органов показал, что 94% человеческих генов подвергаются альтернативному сплайсингу, причем в разных тканях производятся разные наборы изоформ. Благодаря альтернативному сплайсингу разнообразие белков в организме млекопитающих значительно выше, чем у низших животных, хотя количество генов у тех и других примерно одинаково.
Две группы ученых из США и Канады независимо друг от друга провели широкомасштабные исследования альтернативного сплайсинга (alternative splicing) у человека и получили сходные результаты. Эти две работы опубликованы 2 ноября в журналахNature и Nature Genetics. (О том, что такое альтернативный сплайсинг, подробно рассказано в заметке «Сравнение геномов человека и мыши помогло обнаружить новый способ регуляции работы генов», «Элементы», 21.04.2007.)
Обе команды использовали новейшую, чрезвычайно эффективную методику массового анализа молекул РНК, выделенных из клеток (см.: mRNA-Seq). Главный вывод обеих исследовательских групп состоит в том, что альтернативный сплайсинг играет значительно более важную роль в организме млекопитающих, чем предполагалось ранее.
Американская команда, опубликовавшая свои результаты в Nature, получила несколько более детальные данные, чем их канадские коллеги. Исследователи отсеквенировали (определили нуклеотидную последовательность) 400 млн 32-нуклеотидных фрагментов матричных РНК (мРНК) из 10 тканей человеческого организма. Образцы тканей были взяты у анонимных, неродственных между собой мужчины и женщины. Для того чтобы понять, насколько рисунок альтернативного сплайсинга различается у разных индивидуумов, были дополнительно использованы образцы тканей шести неродственных мужчин.
Каждую прочтенную 32-нуклеотидную последовательность попытались «привязать» к человеческому геному, то есть определить то место в геноме, с которого была считана соответствующая молекула РНК. Поскольку в геноме много повторяющихся последовательностей, однозначные привязки удалось получить не для всех, а лишь для 60% прочтенных фрагментов. Еще 4% удалось привязать к местам сшивки экзонов, то есть к тем участкам, в которых во время сплайсинга происходит разрезание РНК, удаление «лишних» участков — интронов — и соединение оставшихся кодирующих участков — экзонов.
Из тех фрагментов, которые удалось привязать к геному, только 1% привязался к интронам или межгенным некодирующим участкам генома. Остальные 99% оказались частями экзонов. Это значит, что подавляющее большинство изученных фрагментов происходят от зрелых (то есть уже прошедших сплайсинг) матричных РНК, из которых интроны были уже вырезаны (методика mRNA-Seq как раз на это и рассчитана).
|
Самыми важными для выявления альтернативного сплайсинга были, естественно, те 32-нуклеотидные фрагменты РНК, внутри которых оказалась точка сшивки экзонов. Именно по этим фрагментам можно понять, какие участки РНК были вырезаны во время сплайсинга.
Оказалось, что альтернативному сплайсингу подвергается примерно 94% человеческих генов — гораздо больше, чем предполагалось ранее (прежние оценки были в районе 75%). Иногда причиной альтернативного сплайсинга могут быть случайные сбои в работе механизмов, осуществляющих сплайсинг (ключевую роль в нём играют сложные РНК-белковые комплексы — сплайсосомы). В этом случае «альтернативный» вариант зрелой мРНК должен встречаться очень редко по сравнению с «нормальным» вариантом. Однако такое характерно лишь для малой части генов, подвергающихся альтернативному сплайсингу. Даже если отбросить все случаи, когда частота альтернативной изоформы не превышает 15% во всех изученных пробах, всё равно остается 86% генов (от общего числа генов в геноме), у которых альтернативный сплайсинг наверняка не случаен.
Таким образом, почти все человеческие гены кодируют не по одному, а по несколько разных белков. Этот факт сам по себе очень важен, поскольку он позволяет ответить на вопрос, который не давал покоя генетикам с тех самых пор, как был прочтен геном человека. В нашем геноме оказалось всего около 20 000 генов — примерно столько же, сколько у круглого червя Caenorhabditis elegans, который устроен гораздо проще, чем человек. Эксперты этого не ожидали: все были уверены, что в более сложном организме разнообразие белков должно быть выше, чем в простом. Теперь понятно, что так оно и есть, просто разнообразие белков у млекопитающих повысилось не за счет роста числа генов, а за счет развития альтернативного сплайсинга и роста числа изоформ. У C. elegans, по имеющимся оценкам, лишь около 15% генов подвергаются альтернативному сплайсингу.
Очень важно выяснить, насколько различаются белки-изоформы по своим функциям. В принципе можно допустить, что в большинстве случаев альтернативный сплайсинг не оказывает существенного влияния на свойства получающегося белка, и разные изоформы сосуществуют в организме просто потому, что организму безразлично, какая из изоформ будет синтезироваться в тех или иных тканях.
Напрямую определить функции и свойства каждой изоформы — задача на сегодняшний день неподъемная, так что приходится идти окольными путями. Одним из таких путей является анализ тканеспецифичности сплайсинга. Иными словами, нужно выяснить, как распределяются изоформы по органам и тканям — хаотично или упорядоченно. Если свойства альтернативных изоформ примерно одинаковы, то они, скорее всего, будут распределяться по тканям более или менее хаотично. Если же они различны, то организм не может пустить дело на самотек: обязательно должны были развиться системы регуляции альтернативного сплайсинга, которые направляли бы сплайсинг в ту или иную сторону в зависимости от ситуации, то есть от потребностей данного органа или ткани. В этом случае ткани должны резко различаться между собой по набору изоформ белков, подвергающихся альтернативному сплайсингу.
Результаты, полученные американскими исследователями, убедительно свидетельствуют в пользу второй версии. Оказалось, что у большинства генов альтернативный сплайсинг тканеспецифичен: в одних тканях чаще синтезируются одни изоформы, в других — другие. Интересно, что среди генов, сплайсинг которых отличается наиболее строгой тканеспецифичностью (в одних тканях всегда или почти всегда синтезируется только одна изоформа, в других — другая) повышена доля генов — регуляторов индивидуального развития, обмена веществ, межклеточных взаимодействий и передачи сигналов. Это именно те функции, от которых зависят структурные и функциональные различия между тканями. Это говорит о том, что альтернативный сплайсинг, по-видимому, в большинстве случаев имеет функциональное значение и идет под жестким контролем.
Была обнаружена также и индивидуальная вариабельность «рисунка» альтернативного сплайсинга: у разных людей в одних и тех же тканях может быть разное соотношение изоформ. Однако различия между индивидуумами в среднем примерно в 2-3 раза меньше, чем различия между тканями. В ряде случаев, по-видимому, альтернативный сплайсинг может зависеть и от аллельных вариантов. Многие гены в популяции существуют в виде нескольких вариантов (аллелей), и для разных аллелей может быть характерно разное распределение вероятностей производства тех или иных изоформ. Именно этим, скорее всего, и объясняется значительная часть обнаруженных индивидуальных различий (ведь у каждого человека имеется свой уникальный набор аллелей, за исключением однояйцовых близнецов).
Как осуществляется регуляция сплайсинга в разных тканях? По-видимому, ключевую роль в этом играют специализированные регуляторные белки и особые регуляторные последовательности нуклеотидов, расположенные в интронах, прилегающих к альтернативным экзонам. Ранее уже был выявлен ряд белков — регуляторов сплайсинга, а для некоторых из них была показана тканеспецифичная экспрессия. Например, белки — регуляторы сплайсинга FOX-1 и FOX-2 активно синтезируются в клетках мозга, сердца и скелетных мышц. Эти белки распознают участки матричных РНК с последовательностью нуклеотидов UGCAUG и прикрепляются к ним, что, в свою очередь, как-то влияет на работу сплайсосомы. Было также показано, что частота встречаемости этой нуклеотидной последовательности (UGCAUG) резко повышена в интронах, следующих непосредственно за альтернативными экзонами, которые преимущественно включаются в зрелую мРНК как раз в клетках мозга, сердца и мышц. Кроме того, последовательность UGCAUG часто встречается в интронах, предшествующих альтернативным экзонам, которые не используются в перечисленных тканях. Это значит, что если последовательность UGCAUG расположена перед экзоном, белки FOX «приказывают» сплайсосоме вырезать этот экзон, а если она расположена после экзона, белки FOX не позволяют его вырезать.
Эти факты были установлены три года назад. Опираясь на них, авторы предприняли целенаправленный поиск других регуляторных шестинуклеотидных последовательностей в интронах, прилегающих к альтернативным экзонам. Они нашли еще 362 такие последовательности, среди которых есть как известные ранее регуляторы (сайты связывания белков — регуляторов сплайсинга), так и новые. Например, перед альтернативными экзонами, используемыми в коре мозжечка, часто располагаются последовательности UCUCUC и CUCUCU, напоминающие известные ранее сайты связывания белков — регуляторов сплайсинга PTBP1 и PTBP2. По-видимому, реальное разнообразие белков — регуляторов сплайсинга и соответствующих регуляторных нуклеотидных последовательностей значительно выше того, что известно на сегодняшний день.
Для полноты картины остается добавить, что практически все человеческие гены, которые не подвергаются альтернативному сплайсингу (как мы помним, таковых оказалось 6%) — это гены, которые вообще никакому сплайсингу не подвергаются, потому что в них нет интронов. Это заставляет задуматься: а бывает ли вообще у млекопитающих безальтернативный сплайсинг? Несколько в ином свете предстает и роль интронов: их регуляторные функции были известны и раньше, но теперь стало совсем уж очевидно, что интроны тоже, как и экзоны, кодируют инструкции по синтезу белка. Хотя, конечно, до тех пор, пока аналогичные исследования не будут проведены на других видах живых организмов, далеко идущие эволюционные выводы делать рано.
Источники:
1) Eric T. Wang, Rickard Sandberg, Shujun Luo, Irina Khrebtukova, Lu Zhang, Christine Mayr, Stephen F. Kingsmore, Gary P. Schroth, Christopher B. Burge. Alternative isoform regulation in human tissue transcriptomes // Nature. Advance online publication 2 November 2008.
2) Qun Pan, Ofer Shai, Leo J. Lee, Brendan J. Frey, Benjamin J. Blencowe. Deep surveying of alternative splicing complexity in the human transcriptome by high-throughput sequencing // Nature Genetics. Advance online publication 2 November 2008.
1) Eric T. Wang, Rickard Sandberg, Shujun Luo, Irina Khrebtukova, Lu Zhang, Christine Mayr, Stephen F. Kingsmore, Gary P. Schroth, Christopher B. Burge. Alternative isoform regulation in human tissue transcriptomes // Nature. Advance online publication 2 November 2008.
2) Qun Pan, Ofer Shai, Leo J. Lee, Brendan J. Frey, Benjamin J. Blencowe. Deep surveying of alternative splicing complexity in the human transcriptome by high-throughput sequencing // Nature Genetics. Advance online publication 2 November 2008.