Темы

C Cеквенирование E E1b1b G I I1 I2 J J1 J2 N N1c Q R1a R1b Y-ДНК Австролоиды Альпийский тип Америнды Англия Антропологическая реконструкция Антропоэстетика Арабы Арменоиды Армия Руси Археология Аудио Аутосомы Африканцы Бактерии Балканы Венгрия Вера Видео Вирусы Вьетнам Гаплогруппы Генетика человека Генетические классификации Геногеография Германцы Гормоны Графики Греция Группы крови ДНК Деградация Демография в России Дерматоглифика Динарская раса Дравиды Древние цивилизации Европа Европейская антропология Европейский генофонд ЖЗЛ Живопись Животные Звёзды кино Здоровье Знаменитости Зодчество Иберия Индия Индоарийцы Интеръер Иран Ирландия Испания Исскуство История Италия Кавказ Канада Карты Кельты Китай Корея Криминал Культура Руси Латинская Америка Летописание Лингвистика Миграция Мимикрия Мифология Модели Монголоидная раса Монголы Мт-ДНК Музыка для души Мутация Народные обычаи и традиции Народонаселение Народы России Наши Города Негроидная раса Немцы Нордиды Одежда на Руси Ориентальная раса Основы Антропологии Основы ДНК-генеалогии и популяционной генетики Остбалты Переднеазиатская раса Пигментация Политика Польша Понтиды Прибалтика Природа Происхождение человека Психология РАСОЛОГИЯ РНК Разное Русская Антропология Русская антропоэстетика Русская генетика Русские поэты и писатели Русский генофонд Русь США Семиты Скандинавы Скифы и Сарматы Славяне Славянская генетика Среднеазиаты Средниземноморская раса Схемы Тохары Тураниды Туризм Тюрки Тюрская антропогенетика Укрология Уралоидный тип Филиппины Фильм Финляндия Фото Франция Храмы Хромосомы Художники России Цыгане Чехия Чухонцы Шотландия Эстетика Этнография Этнопсихология Юмор Япония генетика интеллект научные открытия неандерталeц

Поиск по этому блогу

понедельник, 10 июня 2013 г.

Эгоистичный геном

Оригинал взят у galicarnax в Эгоистичный геном
Рассказ про генкод я завершил упоминанием его оптимальности. Вы наверняка слышали - аминокислоты распределены по кодонам таким образом, что эффект мутаций сведен к минимуму. Если где-то в кодоне происходит замена одного основания на другое, в большинстве случаев это приводит к вставке в белок другой, но похожей по гидрофобности аминокислоты. Хотя эта минимизация все же неидеальна (некоторые генетические заболевания вызваны именно заменой всего лишь одной аминокислоты на другую, как в случае серповидно-клеточной анемии), анализ показывает, что лишь один из миллиона случайно сгенерированных кодов в этом плане лучше, чем код, используемый в природе.

Но я расскажу о совсем другом свойстве генетического кода, которое тоже можно назвать оптимальностью, в другом аспекте.



Начну с двух вещей, которые, казалось бы, не имеют отношения к генетическому коду: нуклеотидный состав геномов и распределение массы в белках.


Нуклеотидный состав геномов

Текст геномов состоит из четырех букв - A, T, G и C. Согласно второму правилу Чаргаффа, в геномах почти всех организмов количество A равно (с хорошей точностью) количеству T, а количество G - количеству C. Но вот разница между уровнями GC и AT не фиксирована и отличается у разных организмов. Вот примеры нуклеотидного состава геномов трех бактерий:

БактерияT(%)A(%)C(%)G(%)
E.canis35.5135.5014.5014.49
D.dadantii23.2223.2026.7826.80
E.coli24.7224.7625.2425.28

Почему наблюдаются отличия в GC-содержании? (Можно говорить и об AT-содержании, но одно определяет другое, и первый варинат общепринят). Одно из объяснений было придумано давно. Известно, что в ДНК нуклеотиды A и T соединяются между собой комплементарно двумя водородными связями, а G и C - тремя. Это значит, что энергия связи между G и C больше, чем между A и T. Их труднее разъединить:

Известны опыты, в которых нити ДНК при нагревании начинают расходиться именно в тех местах, где больше пар A-T, чем G-C. Поэтому казалось бы очевидным, что те организмы, которые обитают в высокотемпературных условиях, должны иметь больше G-C-пар в своей ДНК. Другими словами, GC-содержание геномов должно коррелировать с оптимальной для данного организма температурой, являться адаптацией к термическим условиям.

Очень многие так и считают до сих пор, хотя еще 10 лет назад эта гипотеза была начисто опровергнута. Британские учОные провели сравнительный анализ более ста геномов прокариот и выявили, что с температурой не коррелирует ни полное GC-содержание геномов, ни GC-содержание кодирующих областей, ни даже GC-содержание третьих позиций кодонов (которые являются наиболее свободными в плане эволюции из-за вырожденности генкода). Зависимость от температуры нашлась лишь у функциональных молекул РНК (например, рРНК, тРНК), но их гены составляют доли процента от всего генома.

Стоит упомянуть, что не все считали GC-содержание приспособительным параметром. Нейтралисты полагали, что GC-содержание не регулируется отбором вообще и изменяется просто случайным образом.

Однако 8 лет назад уругвайские геномщики опубликовали данные, согласно которым GC-содержание коррелирует с тем, является ли организм аэробом или анаэробом. Как именно происходит изменение нуклеотидного состава геномов - для дальнейшего неважно.

Распределение массы в белках

Все белки - это определенным образом свернутые цепочки из аминокислот. Молекулы аминокислот можно условно поделить на две части - стандартный блок, который один и тот же у всех аминокислот, и боковые цепи (или радикалы), которые индивидуальны для каждой аминокислоты. Боковые цепи отличаются размером и массой. Например, у самой маленькой аминокислоты - глицина - в боковой цепи находится один несчастный водородик, а у самой массивной - триптофана -  там два углеродно-азотных кольца:


Массу молекул с хорошей точностью можно характеризовать числом нуклонов (протонов и нейтронов). В стандартном блоке нейтральной аминокислоты находится 74 нуклона, у глицина в боковой цепи один нуклон, у триптофана - 130, у остальных где-то в промежутке.

Во время синтеза белка на рибосоме аминокислоты соединяются в полипептидную цепочку через свои стандартные блоки. При образовании пептидной связи между аминокислотами их блоки теряют 2 атома водорода и один атом кислорода, т.е. 18 нуклонов, поэтому в стандартном блоке остается 74-18=56 нуклонов. Эти блоки образуют общий "хребет", из которого торчат индивидуальные боковые цепи. Весь этот хребет с отростками сворачивается специальным образом, образуя функциональный белок.

Особенностью природных белков является то, что для них разница между массой всего хребта и общей массой боковых цепей небольшая, а для многих белков просто мизерная. Например, в глициновой синтетазе человека 740 аминокислот. Число нуклонов в хребте равно 56*740=41440 (на самом деле 41345, т.к. у первого и последнего блока теряется меньше атомов, и к тому же у одной из аминокислот - пролина - схема строения нестандартная, ее боковая цепь соединена с блоком двумя связями, и нуклонов в блоке пролина на один меньше, чем у остальных аминокислот). При этом число нуклонов всех боковых цепей - 41704. Разница составляет всего ~0.86%.

Как влияет распределение массы между стандартными блоками и боковыми цепями на функцию белков, и влияет ли вообще - непонятно. Но набор канонических аминокислот таков, что если создавать из них чисто случайную последовательность в полипептидной цепочке, ее боковые цепи будут всегда существенно перевешивать хребет, примерно на 12%.

Назад к генетическому коду

Но если с помощью универсального генетического кода перевести чисто случайную последовательность нуклеотидов ДНК, то получится белок с практически нулевой разницей между массами хребта и боковых цепей. Более того. Создадим мысленно кольцевую молекулу белка, вставляя в нее каждую аминокислоту столько раз, сколько она встречается в генкоде (например, триптофан - один раз, аргинин - 6 раз, т.к. у него 6 кодонов и т.п.). Получим кольцевой белок из 61 аминокислоты. Учтем реальные физические условия (в цитоплазме часть аминокислот теряет либо приобретает один протон). В итоге увидим, что разница между нуклонными числами кольцевого хребта такой молекулы и ее боковыми отростками будет точно равна нулю.
Другими словами, универсальный генетический код таков, что из чисто случайной последовательности нуклеотидов он производит наиболее "сбалансированный" белок. Статистически понятно, что чем длиньше последовательность, тем точнее будет баланс. Это и есть вторая оптимальность генкода, о которой я упоминал в начале. Эта фича была обнаружена одновременно несколькими исследователями в 2002 году, причем из разных соображений. Для интересующихся вот статья австралийцев.

Cамое интересное

В чисто случайной последовательности каждый из четырех нуклеотидов занимает в целом примерно четверть длины. Таких чисто-случайных геномов в природе не бывает - см. таблицу в начале текста. Что происходит, если в последовательности больше букв G и C, чем A и T? Ответ прост - в результирующем белке массовый баланс будет сдвинут в сторону хребта. Если же преобладают A и T, то у белков в сумме тяжелее будут боковые цепи. И это действительно так. Если взять организм с повышенным содержанием GC в геноме, то у подавляющего большинства его белков хребет окажется тяжелее цепей. У организмов с повышенным содержанием AT - наоборот. Это следствие того самого особого распределения аминокислот в генкоде, т.к. в кодонах наиболее легких аминокислот чаще всречаются буквы C и G, в кодонах тяжелых - A и T.

Можно предположить, что распределение массы в белках как-то связано с их функцией. Тогда одному организму выгоднее иметь белки с более тяжелым хребтом, и отбор будет закреплять соответствующие мутации в генах, повышая в них процент G и C. Другой организм адаптируется к условиям, в которых белкам выгоднее иметь легкий хребет, и отбор будет повышать содержание A и T в генах.

Но проблема в том, что GC-контент в геномах примерно одинаков как для генов, для и для некодирующих участков. Это значит, что эволюция белков здесь не при чем. Вспомним находку уругвайцев: GC-содержание связано с аэробным метаболизмом. Это значит, что сам геном как целое эволюционирует под действием внешних условий. А результатом этого является изменение аминокислотного состава белков.

Выходит, что далеко не только функция белков определяет их аминокислотный состав и, в конечном итоге, эволюцию генов. Если еще вспомнить про второе правило Чаргаффа, которое месит содержимое геномов безотносительно к функциям закодированных белков, можно сказать, что на смену эгоистичному гену идет эгоистичный геном. В том смысле, что вряд ли гены являются независимыми единицами эволюции/отбора.

На самом деле, все что рассказано выше - это только небольшая часть, подтверждающая, что за эволюцией генов стоит не только биологическая функция конечных белков. Есть данные, показывающие, что на эволюцию генов сильно влияет процедура сплайсинга и сам процесс синтеза белка, организация хроматина и некоторые другие вещи.

Рисунки - (c) Wikipedia