Темы

Австролоиды Альпийский тип Америнды Англия Антропологическая реконструкция Антропоэстетика Арабы Арменоиды Армия Руси Археология Аудио Аутосомы Африканцы Бактерии Балканы Венгрия Вера Видео Вирусы Вьетнам Гаплогруппы генетика Генетика человека Генетические классификации Геногеография Германцы Гормоны Графики Греция Группы крови Деградация Демография в России Дерматоглифика Динарская раса ДНК Дравиды Древние цивилизации Европа Европейская антропология Европейский генофонд ЖЗЛ Живопись Животные Звёзды кино Здоровье Знаменитости Зодчество Иберия Индия Индоарийцы интеллект Интеръер Иран Ирландия Испания Исскуство История Италия Кавказ Канада Карты Кельты Китай Корея Криминал Культура Руси Латинская Америка Летописание Лингвистика Миграция Мимикрия Мифология Модели Монголоидная раса Монголы Мт-ДНК Музыка для души Мутация Народные обычаи и традиции Народонаселение Народы России научные открытия Наши Города неандерталeц Негроидная раса Немцы Нордиды Одежда на Руси Ориентальная раса Основы Антропологии Основы ДНК-генеалогии и популяционной генетики Остбалты Переднеазиатская раса Пигментация Политика Польша Понтиды Прибалтика Природа Происхождение человека Психология Разное РАСОЛОГИЯ РНК Русская Антропология Русская антропоэстетика Русская генетика Русские поэты и писатели Русский генофонд Русь Семиты Скандинавы Скифы и Сарматы Славяне Славянская генетика Среднеазиаты Средниземноморская раса Схемы США Тохары Тураниды Туризм Тюрки Тюрская антропогенетика Укрология Уралоидный тип Филиппины Фильм Финляндия Фото Франция Храмы Хромосомы Художники России Цыгане Чехия Чухонцы Шотландия Эстетика Этнография Этнопсихология Юмор Япония C Cеквенирование E E1b1b G I I1 I2 J J1 J2 N N1c Q R1a R1b Y-ДНК

Поиск по этому блогу

понедельник, 3 января 2011 г.

Понятия и определения ДНК-генеалогии

А. А. Клёсов 
ДНК, дезоксирибонуклеиновая кислота, сохраняет и реализует генетическую программу развития и функционирования организма человека (в контексте настоящего рассмотрения). Находится в ядре клетки в составе 46 хромосом, одна из которых, самая маленькая по размеру -мужская половая хромосома, или Y-хромосома. В ней содержится примерно 50 миллионов нуклеотидов, повторяющихся структурных единиц ДНК -аденина, гуанина, тимина и цитозина. Все 46 хромосом в совокупности состоят из трёх миллиардов нуклеотидов, и в их составе примерно 30 тысяч генов, в среднем по 652 гена на хромосому. В Y-хромосоме всего 27 генов, остальная часть - некодирующая, «никчёмная», как её часто называют. В ней находится много повторов нуклеотидных цепочек, часть которых генетики и выбрали в качестве гаплотипов для ДНК-генеалогии. Копирование, или репликацию ДНК выполняет ДНК-зависимая ДНК-полимераза (в составе большого комплекса, реплисомы), которая иногда допускает ошибки, называемые мутациями.
Y-ХРОМОСОМА, мужская половая хромосома (см. ДНК).


МАРКЕР, или локус, сегмент, участок Y-хромосомы (в контексте данного рассмотрения), выбранный для определения числа повторов нуклеотидов для целей ДНК-генеалогии. Число повторов нуклеотидов в локусе называют «аллель». Маркеры нумеруют и присваивают им индексы, например, DYS19, то есть «DNA Y Segment, локус номер 19». В этом конкретном локусе повторяется четвёрка (квадруплет) ТАГА, то есть тимин-аденин-гуанин-аденин, причём повторяется у разных людей от 11 до 19 раз подряд. Число повторов - индивидуальная характеристика человека, и при увеличении числа маркеров эта характеристика становится всё более индивидуальной. В ранних научных исследованиях типировали (то есть определяли последовательности) от 5 до 9 маркеров, в современных - от 10 до 22 маркеров, в коммерческих работах обычно типируют от 12 до 67 маркеров (стандартные варианты - 12, 17, 25, 37, 43 и 67 маркеров).
АЛЛЕЛЬ, число тандемных повторов определенных блоков нуклеотидов в маркерах (см. Гаплотип).


ГАПЛОТИП, совокупность аллелей, то есть наборов повторов в локусах, или маркерах. Гаплотип записывается в виде набора чисел, которые и отражают число аллелей в каждом маркере. Например, типичный гаплотип среди славян Русской равнины в 12-маркерном формате (формате FTDNA)
13 25 16 11 11 14 12 12 10 13 11 30
в 25-маркерном формате
13 25 16 11 11 14 12 12 10 13 11 30 - 15 9 10 11 11 24 14 20 32 12 15 15 16
(здесь поставлено тире между первой и второй панелью маркеров, точнее -аллелей),

в 37-маркерном формате

13 25 16 11 11 14 12 12 10 13 11 30 - 15 9 10 11 11 24 14 20 32 12 15 15 16 - 11 11 19 23 16 16 18 19 34 39 13 11

в 67-маркерном формате

13 25 16 11 11 14 12 12 10 13 11 30 - 15 9 10 11 11 24 14 20 32 12 15 15 16 - 11 11 19 23 16 16 18 19 34 39 13 11 - 11 8 17 17 8 12 10 8 11 10 12 22 22 15 10 12 12 13 8 14 23 21 12 12 11 13 11 11 12 13
ФОРМАТ FTDNA - форма записи гаплотипов, принятая компанией Family Tree DNA (США). Порядок маркеров в 12-, 25-, 37- и 67-маркерных гаплотипах следующий (в верхней строке - порядковый номер маркера, в нижней - номер маркера, или локуса DYS):

1
2
3
4
5
6
7
8
9
10
393
390
19
391
385a
385b
426
388
439
389-1


11
12
13
14
15
16
17
18
19
20
392
389-2
458
459a
459b
455
454
447
437
448

31
32
33
34
35
36
37
38
39
40
607
576
570
CDYa
CDYb
442
438
531
578
395S1a

41
42
43
44
45
46
47
48
49
50
395S1b
590
537
641
472
406S1
511
425
413a
413b

51
52
53
54
55
56
57
58
59
60
557
594
436
490
534
450
444
481
520
446


ДЕРЕВО ГАПЛОТИПОВ, серия гаплотипов, рассортированная с помощью специальной компьютерной программы и представленная в виде круговой или линейной диаграммы. Эта диаграмма группирует гаплотипы по динамике их мутаций во всех маркерах, и таким образом представляет дерево в виде совокупности ветвей гаплотипов, соответствующих их предполагаемым ДНК-генеалогическим линиям. Например, среди гаплотипов гаплогруппы R1a1 встречаются гаплотипы с «типовой» мутацией, в которой маркер DYS388=12 заменён на DYS=10. Это отдельная (и древняя) ДНК-генеалогическая линия, потому что и многие остальные мутации более присущи этой линии «10», по сравнениями с мутациями для линии «12». Действительно, на дереве гаплотипов линия «10» выделяется в отдельную, которую следует анализировать отдельно. В большинстве статей в данном Вестнике деревья гаплотипов строятся с помощью программы PHYLIP (Felsenstein, 2005), подробное объяснение дается в работе (Klyosov, 2009).



ГАПЛОГРУППА, совокупность гаплотипов, объединённая «групповой» необратимой мутацией, присущей определённому человеческому роду, то есть потомков одного «патриарха», как правило, тысячелетия назад. Эти мутации («снипы») выбирают по определённым критериям. Гаплогруппой также называют сам род в таких выражениях, как «гаплогруппа мигрировала шесть тысяч лет назад на восток», понимая, естественно, что мигрировали носители данной гаплогруппы. В настоящее время классификация включает 20 основных гаплогрупп, от А до Т в алфавитном порядке, и сотни «нисходящих» гаплогрупп и субкладов. Индекс гаплогруппы с надстрочным * (например, I*) показывает, что «нисходящих» мутаций у их носителей в классификации нет. Это - прямые потомки данной гаплогруппы или субклада.


СУБКЛАД, подчинённая, «нижестоящая» гаплогруппа, ДНК-генеалогическая ветвь в пределах той же гаплогруппы, все члены которой имеют не только мутацию основной гаплогруппы, но и дополнительную мутацию, общую только для данной ветви. Например, гаплогруппа R имеет «подчинённые», или «дочерние» гаплогруппы R1 и R2; R1, в свою очередь, имеет R1a и R1b и так далее. R1b в настоящее время (2009 год) имеет 35 «официальных» субкладов, утвержденных Международным обществом генетической генеалогии.

МУТАЦИЯ, в ДНК-генеалогии ошибка при копировании последовательности Y-хромосомальной ДНК, в результате которой (ошибки) или меняется число аллелей в определённом локусе (STR мутации, от Short Tandem Repeats), или происходит модификация гаплогруппы (SNP мутации, от Single Nucleotide Polymorphism).

МУТАЦИЯ В ГАПЛОТИПЕ, ТАНДЕМНАЯ МУТАЦИЯ, изменение числа аллелей в маркере. Происходит в среднем примерно раз в 500 поколений, хотя для каждого маркера своя скорость мутаций, которая для первых 37 маркеров варьируется от одного раза в 1100 поколений (примерно 28 тысяч лет) до одного раза в 28 поколений (примерно 700 лет).

СРЕДНЕЕ ЧИСЛО МУТАЦИЙ НА МАРКЕР, важнейшая величина в ДНК-генеалогии, она напрямую связана с гаплотипом прямого предка, от значения аллелей которого и отсчитываются мутации. В серии гаплотипов современников, потомков одного общего предка (то есть принадлежащих одной ДНК-генеалогической линии) насчитывается определённое суммарное количество мутаций. Чем больше прошло времени от общего предка серии гаплотипов (популяции), тем больше суммарное количество мутаций в рассматриваемой серии гаплотипов. Таким образом, отношение этого суммарного количества мутаций во всех маркерах (от всех аллелей) к общему числу маркеров есть мера того, как давно жил общий предок. Это есть базовое положение ДНК-генеалогии. Это отношение можно откалибровать в поколениях или годах по абсолютной шкале времени при наличии хронологических «реперных точек».

Например, в серии из 110 25-маркерных гаплотипов гаплогруппы R1a1 на постсоветском пространстве (в основном тестированы этнические русские и украинцы) имеется 804 мутации, то есть среднее число мутаций на маркер составляет 804/110/25 = 0.292. Для сравнения, среднее число мутаций у индийцев той же гаплогруппы R1a1 (то есть того же рода) равно 191/30/25 = 0.255. Из этого уже следует, что общий предок рассматриваемой популяции индийцев жил позже, чем общий предок рассматриваемой популяции славян. Ещё пример - среднее число мутаций для западно- и


центральноевропейских гаплотипов гаплогруппы R1b1b2 равно 1340/197/25 = 0.272, то есть общий предок славян, живущих в настоящее время на постсоветском пространстве, заметно древнее, чем общий предок современных западноевропейцев указанной гаплогруппы (наиболее распространенной в Европе).

ОБЩАЯ ОТНОСИТЕЛЬНАЯ ПОГРЕШНОСТЬ, важная величина, указывающая на доверительный интервал, или надежность определения среднего числа мутаций на маркер (см. выше) или рассчитываемого времени жизни общего предка рассматриваемой популяции. Для среднего числа мутаций на маркер упрощённая величина погрешности при 95%-ном доверительном интервале равна обратной величине квадратного корня из общего числа мутаций в выборке (здесь пренебрегается симметричностью мутаций в гаплотипах, учёт которой часто требует лишь несущественной поправки). Например, для трёх примеров выше погрешности средних величин числа мутаций на маркер равны 3,53% (для 110 гаплотипов славян), 7,24% (для 30 гаплотипов индийцев) и 2,73% (для 197 гаплотипов западноевропейцев), и сами величины равны 0.292±0.010, 0.255±0.018 и 0.272±0.007 мутаций на маркер, соответственно, при 95%-ном доверительном интервале. Для 5%-ной погрешности в определении средних скоростей мутации общая относительная погрешность (одна
сигма)    для     рассматриваемых    случаев     равна     л/з.532 + 52 = 6.1%,
л/7.242 + 52 = 8.8% и л/2.732 + 52 = 5.7%.

Часто берут удвоенную величину погрешности для средней скорости мутации, то есть величину «два сигма», чтобы получить погрешности при 95%-ном   доверительном   интервале.   Для   примеров   выше   это дает
л/3.532 +102 = 10.6%, л/7.242 +102 = 12.35% и л/2.732 +102 = 10.4%. Применяя величину средней скорости мутации для 25-маркерных гаплотипов, равную 0.00183 (см. ниже) и вводя поправку на возвратные мутации, получим для трёх рассматриваемых случаев 4725±500, 4050±500 и 4375±450 лет до общих предков соответствующих популяций восточных славян (R1a1), индийцев (R1a1) и западноевропейцев (R1b1b2). Это означает, что общие предки указанных популяций жили в пределах данных временных интервалов с вероятностью 95%.

СНИП, «гаплогруппо-образующая мутация», от английского сокращения SNP (Single Nucleotide Polymorphism), практически необратима, происходит, как правило, на одном нуклеотиде, превращая один нуклеотид в другой. Это приводит к появлению своебразной «метки», которая практически навсегда наследуется потомками. Именно поэтому каждый род (в понятиях ДНК-генеалогии) носит характерную метку и может быть надёжно и количественно отличим один от другого. Снипы обозначают индексами, например, М17 (это - «входная» мутация гаплогруппы R1a1), Р25 («входная» мутация в гаплогруппу R1b1), L21, то же самое S145 (мутация, определяющая субклад R1b1b2a1a2f) и так далее. Первая буква снипа показывает, в каком научном коллективе снип идентифицирован:
       М, лаборатория под руководством Peter Underhill, Stanford University
(США);
       Р, лаборатория, руководимая Michael Hammer, University of Arizona
(США);
       S, лаборатория, руководимая James F. Wilson, Edinburgh University (Шотландия);
       L, исследовательский центр под названием Family Tree DNA's Genomics Research Center под руководством Thomas Krahn (США).
       Uуниверситет центральной  Флориды  (Lynn MSims  и Jack Ballantyne) и
университет Gonzaga (Dennis Garvey);
       V, университет La Sapienza, Rosaria Scozzari and Fulvio Cruciani (Рим, Италия);
       N, лаборатория биоинформатики, Институт биофизики КАН, Пекин (Китай).

СКОРОСТЬ МУТАЦИИ, средняя частота изменения числа повторов в локусе, или маркере, обычно измеряется в числе мутаций на поколение. Средняя скорость мутаций составляет 0.00183 на маркер на поколение для первых 12-ти и первых 25-ти маркеров в стандартном формате гаплотипов (см. выше). Для первых 37-и маркеров средняя скорость мутаций составляет 0.00243 на маркер на поколение, для первых 67-ти маркеров - 0.00216 на маркер на поколение. В неопределённых ситуациях часто принимается в виде «канонической» величины 0.002 мутаций на маркер на поколение.

СРЕДНЯЯ СКОРОСТЬ МУТАЦИИ НА ГАПЛОТИП, для первых 6-ти маркеров в «научном формате», DYS19, 388, 390, 391, 393, 393 - 0.088 мутаций на гаплотип на поколение, для первых 12-ти маркеров (первая панель маркеров в формате FTDNA) - 0.022 мутации на гаплотип на поколение, для первых 25-ти маркеров - 0.046 мутаций на гаплотип на поколение, для первых 37-ти маркеров - 0.09 мутаций на гаплотип на поколение, для 67-ми маркеров - 0.145 мутаций на гаплотип на поколение. Отсюда сразу можно заключить, что если два 67-маркерных гаплотипа отличаются, например, на 6 мутаций, то они разошлись от общего предка, который жил 6/2/0.145 = 21 поколение назад, или 525 лет назад. Однако для таких расчётов надо знать, что оба гаплотипа относятся к одной гаплогруппе, и понимать, что для двух гаплотипов и столь немногих мутаций подобные расчёты могут быть только оценочными. Например, в данном конкретном случае оценка равна 525±220 лет с 95%-ной надёжностью.

«БУТЫЛОЧНОЕ ГОРЛЫШКО» ПОПУЛЯЦИИ, резкое или медленное сокращение популяции до критического, после чего популяция либо выживает, либо терминируется. Причинами «бутылочного горлышка» могут быть события, катастрофические в отношении популяции (природные катаклизмы, эпидемии, войны), либо медленное вымирание популяции. Обычно выжившая популяция «обнуляет» набор своих мутаций в гаплотипах до гаплотипа выжившего члена популяции, и он становится «общим предком» для потомков. Исследования показывают, что многие популяции в прошлом имели пульсирующий характер и многие популяции терминировались, не проходили «бутылочное горлышко». Многие древние популяции остались во «фрагментах», в серии относительно недавних популяций, «кластеров», которые очень значительно отличаются друг от друга по гаплотипам, оставаясь внутри одной и той же гаплогруппы. Примеры - гаплотипы американских индейцев, африканские гаплотипы, гаплотипы Русской равнины, ряд европейских гаплотипов.

ОБЩИЙ ПРЕДОК ПОПУЛЯЦИИ, предполагаемый носитель «базового», или «предкового» гаплотипа. Время жизни общего предка популяции вычисляется по совокупности гаплотипов его потомков, принимая во внимание число мутаций, накопившееся в популяции, нормированное на гаплотип или на маркер, и константу скорости мутации, или частоту мутации в расчёте на поколение. Расчёты времён жизни общих предков популяций позволяют делать предположения о времени и направлениях миграций популяций в древности, о передвижениях популяций. Поскольку, передвигаясь, популяции оставляли следы в виде материальных признаков, ресурсов, это позволяет проводить интерпретацию археологических данных в отношении носителей этих признаков, их принадлежности к определённым родам и племенам, связанных родственными взаимоотношениями. Аналогично, популяции, передвигаясь, приводили к перемещению языков, диалектов, и определение общих предков и времён их жизни даёт возможность прослеживать динамику языков в отношении соответствующих родов и племён, связанных родственными взаимоотношениями.