Темы

Австролоиды Альпийский тип Америнды Англия Антропологическая реконструкция Антропоэстетика Арабы Арменоиды Армия Руси Археология Аудио Аутосомы Африканцы Бактерии Балканы Венгрия Вера Видео Вирусы Вьетнам Гаплогруппы генетика Генетика человека Генетические классификации Геногеография Германцы Гормоны Графики Греция Группы крови Деградация Демография в России Дерматоглифика Динарская раса ДНК Дравиды Древние цивилизации Европа Европейская антропология Европейский генофонд ЖЗЛ Живопись Животные Звёзды кино Здоровье Знаменитости Зодчество Иберия Индия Индоарийцы интеллект Интеръер Иран Ирландия Испания Исскуство История Италия Кавказ Канада Карты Кельты Китай Корея Криминал Культура Руси Латинская Америка Летописание Лингвистика Миграция Мимикрия Мифология Модели Монголоидная раса Монголы Мт-ДНК Музыка для души Мутация Народные обычаи и традиции Народонаселение Народы России научные открытия Наши Города неандерталeц Негроидная раса Немцы Нордиды Одежда на Руси Ориентальная раса Основы Антропологии Основы ДНК-генеалогии и популяционной генетики Остбалты Переднеазиатская раса Пигментация Политика Польша Понтиды Прибалтика Природа Происхождение человека Психология Разное РАСОЛОГИЯ РНК Русская Антропология Русская антропоэстетика Русская генетика Русские поэты и писатели Русский генофонд Русь Семиты Скандинавы Скифы и Сарматы Славяне Славянская генетика Среднеазиаты Средниземноморская раса Схемы США Тохары Тураниды Туризм Тюрки Тюрская антропогенетика Укрология Уралоидный тип Филиппины Фильм Финляндия Фото Франция Храмы Хромосомы Художники России Цыгане Чехия Чухонцы Шотландия Эстетика Этнография Этнопсихология Юмор Япония C Cеквенирование E E1b1b G I I1 I2 J J1 J2 N N1c Q R1a R1b Y-ДНК

Поиск по этому блогу

вторник, 4 января 2011 г.

Общие принципы ДНК-генеалогии (новая редакция) А.А. Клёсов

Введение

В данной статье речь пойдет о роли, которую ДНК-генеалогия может играть в понимании происхождения, динамики и миграции человеческих родов, племен, генеалогических линий, а также языков человечества - в пространстве и во времени. В отличие от антропологии, истории, археологии, которые оперируют памятниками прошлого, ДНК-генеалогия имеет дело с молекулами, извлекаемыми из нашего организма. Путем серии нехитрых физико-химических операций, доступных грамотному технику-лаборанту, и почти полностью автоматизированных, исследователь получает сведения о мутациях, накопившихся в определенных участках ДНК, и может сравнивать характер (рисунок) этих мутаций у конкретных людей или их коллективов, популяций, этнических групп, народов. Это позволяет получать сведения о передвижениях предков современных (и ископаемых) носителей анализируемых молекул ДНК, опять же в пространстве и во времени, вплоть до времен 50-80 тысяч лет назад и на любой территории. На самом деле, вплоть до любых времен жизни предков человека, до сотен тысяч и миллионов лет назад, но наука на таких временах пока имеет слишком малую базу.



Помимо того, любая человеческая популяция в определенные моменты времени проходила то, что генетики называют «бутылочным горлышком» популяции. Это означает, что популяция, будь то род, племя, или просто группа родственников, сокращается в размере настолько, что или прекращает свое существование, генеалогическая линия прерывается (не прошли «бутылочное горлышко»), или сокращается до нескольких, или буквально до одного человека, потомство которого в итоге выживает и увеличивается в числе. В таких случаях этот человек и оказывается «общим предком» выжившей популяции. Методы расчета времени жизни общего предка данной, выжившей популяции ведут именно к тому человеку, картина мутаций в ДНК его потомков сводится именно к нему, потому что «разбег» мутаций в ДНК потомков отсчитывается именно этого, выжившего предка. Он становится, в рамках понятий  ДНК-генеалогии, общим предком данной популяции.
«Буквально до одного человека» здесь - это в понятия ДНК-генеалогии, то есть скорее «до одного гаплотипа». Людей, оставшихся в данной популяции, могло быть несколько, это могли быть отец и сын, или братья, группа родственников, у которых и гаплотип мог и не различаться, или различаться несколькими мутациями, но в итоге выжил только один гаплотип, и именно от него пошел «разбег мутаций» у потомков.

Методы ДНК-генеалогии позволяют узнать, когда жил общий предок, и значит - когда имело место «бутылочное горлышко» популяции на абсолютной шкале времени. При этом при наличии умеренной статистики, а именно при рассмотрении всего нескольких десятков или (лучше) сотен образцов ДНК потомков, можно идентифицировать времена жизни общих предков с точностью до 10% при 95%-ной достоверности полученных абсолютных значений времени. Иначе говоря, если общий предок данной популяции жил 5000 лет назад, то при наличии (путем тестирования) сотни «гаплотипов» (так называемых «25-маркерных гаплотипов»), то есть определенных фрагментов Y-хромосомы современников, потомков данного общего предка, время жизни общего предка определится с точностью 5000±530 лет до настоящего премени. Это означает, что время жизни общего предка данной популяции попадает в указанный интервал времени, между 4470 и 5530 лет назад, с надежностью 95%.

Такая точность вызвана тем, что в сотне 25-маркерных гаплотипов (то есть когда в каждом гаплотипе имеется по 25 олигонуклеотидных маркеров, и каждый мутирует с определенной средней скоростью на протяжении этих тысяч лет), в распоряжении исследователя есть 2500 «экспериментальных точек», в которых на протяжении 5000±530 лет произойдет, как исследователь знает, примерно 770 мутаций. Эта величина довольно жестко завязана на среднюю скорость мутаций, установленную и калиброванную. Если мутаций меньше, то общий предок жил более недавно, и опять можно вполне надежно установить, когда он жил. Например, при рассмотрении 750 19-маркерных гаплотипов жителей Пиренейского полуострова, род (гаплогруппа) R1b1b2, оказалось, что все они содержат 2796 мутаций от гаплотипа, равноудаленного от всех (это и есть предковый гаплотип, так как мутации происходят в большинстве совершенно неупорядоченно, со степенью симметрии 0.5 в любую сторону, «вверх» или «вниз» по значению аллелей). Это означает, что общий предок всех 750 человек жил 3625±370 лет назад.

Можно вообще не обращать внимания на число мутаций, и просто посчитать, сколько среди этих 750 гаплотипов есть «равноудаленных», причем идентичных друг другу. Это и есть предковые гаплотипы, и их число задается законами химической кинетики, то есть физической химии.
Примерно такими же законами задается скорость радиоактивного распада, хотя после превращения стабильный изотоп не может стать обратно радиоактивным нуклидом, эти процессы необратимы. Мутация же может вернуться обратно, потому что мутации, как мы отмечали, полностью неупорядочены. Иначе говоря, мутированному гаплотипу все равно, в какую сторону мутировать в следующий раз, мутации обратимы. Это вносит усложнения в расчеты по сравнению с простыми процессами радиоактивного распада, но проблема с успехом решаема.

Так вот, среди 750 гаплотипов (см. выше) 16 оказались предковыми. То есть за прошедшие 3625±370 лет в полном соответствии с теорией вероятности 16 гаплотипов из 750 так и остались предковыми. Они не успели мутировать, они - «на хвосте» кривой вероятностного распределения мутаций. Если бы считать по законам радоактивного распада (физико-химики говорят - по законам кинетики первого порядка), то из 750 гаплотипов 16 останутся неизменными за ln(750/16)/0.0285 = 135 поколений, прошедших со времени жизни общего предка, то есть за 3375 лет (продолжительность поколения в 25 лет заложена в константу скорости мутации 0.0285 мутаций на гаплотип на поколение). Но при этом расчете, как мы отмечали, не учитывалась обратимость мутаций. Учет этой обратимости, опять в строгом соответствии с теорией вероятности, сдвигает число поколений со 135 до 156, то есть до 3900 лет до общего предка. Для введения подобных поправок есть детальные таблицы расчетов (Клёсов, 2008c; Klyosov, 2009a). Как мы видим, эта величина, 3900 лет, попадает в интервал 95%-ной надежности расчетов 3625±370 лет до общего предка.

Очевидно, что считать мутации, или считать предковые гаплотипы (если от времени жизни общего предка прошло не так много лет) - не имеет большого значения или большой разницы. Величины получаются примерно те же самые, если расчет ведется правильно, и используются надежные константы скоростей мутации, подтвержденные экспериментально, то есть с учетом известных генеалогий или известных исторических событий. Эта работа проведена, и в недавней работе (Klyosov, 2009a) приведены значения констант скоростей мутаций для 28 типичных гаплотипов, применяемых в ДНК-генеалогии, от 5-маркерного до 67-маркерного. Приведенная ниже таблица расширена до 30 типичных гаплотипов.

Чтобы показать, насколько массивными бывают расчеты, насколько точными получаются данные, приведем еще один пример - выборку из 857 25-маркерных гаплотипов Англии, род I1 (определение рода дано ниже), то есть 21425 «экспериментальных точек» (Klyosov, 2009a). Эти гаплотипы содержали 4868 мутаций от предкового гаплотипа, который в ДНК генеалогии часто называют «базовым». Такое название принято потому, что во многих случаях нет полной уверенности, особенно с очень древними гаплотипами, что «равноудаленный» - это непременно предковый гаплотип. Это может быть хорошее приближение, но не более того. Назвать его «предковым» было бы натяжкой. Поэтому - «базовый». Так вот, такое число мутаций позволяет определять среднее число мутаций на маркер (а именно это среднее число фактически используется для расчета времени жизни общего предка) с точностью до 1-2% с 95%-ной надежностью. Это потому, что для несимметричных мутаций точность расчетов (среднеквадратичное отклонение) средней величины мутаций на маркер задается обратной величиной квадратного корня из числа мутаций, а для симметричных отличается лишь немногим (Адамов и Клёсов, 2008a; Klyosov, 2009a). Для 4868 мутаций это отклонение - с 95%-ной надежностью - составляет 1.43%. Но поскольку точность средних скоростей мутаций в гаплотипах принимается за 5%, то для 95%-ной надежности расчетов времени жизни общего предка предельной точностью может быть только плюс-минус 5%, то есть 10%-ный интервал. Поэтому для английских гаплотипов определено, что общий предок всех 857 человек в данной выборке жил 3425±350 лет назад. Это - относительно недавнее время, относительно молодые европейские популяции. Хотя для некоторых европейских родов общие предки - по данным ДНК-генеалогии - жили 16­18 тысяч лет назад. Как будет показано ниже, для ряда азиатских родов общий предок рода жил 16-20 тысяч лет назад, для африканских родов - 28­37 тысяч лет назад.

Эти примеры здесь даются для того, чтобы читатель осознал, что ДНК-генеалогия - это не просто нарождающаяся наука с зыбким фундаментом, что характерно для новых областей наук. За последние несколько лет ДНК-генеалогия практически закончила формировать расчетный базис, платформу, и временные расчеты проводятся теперь с достаточной надежностью. Было экспериментально показано, с использованием геномов многих популяций людей, а также геномов шимпанзе, что мутации представляют собой действительно «молекулярные часы», скорость которых в ДНК неизменна на протяжении по меньшей мере последних двух миллионов лет (Sun et al, 2009). Было экспериментально показано на тысячах пар «отец-сын», что мутации в гаплотипах действительно равновероятны по «направлению», и тандемные, повторяющиеся блоки нуклеотидов, называющиеся в ДНК-генеалогии маркерами, могут укорачиваться или удлиняться на блок (то есть менять чисто аллелей) с одинаковой вероятностью. На этих системах было показано что «двойные» или более мутации в гаплотипах (маркерах) происходят редко, на уровне единиц процентов, и практически не влияют на получаемые расчеты времен до общих предков популяций, или серий гаплотипов.
Сложнее с географической привязкой, с выявлением того, где именно жил общий предок, так как время его жизни (то есть сколько поколений или лет назад он жил) о географии не говорит. Для выявления того, где, на каких территориях жили общие предки популяции, приходится привлекать независимые данные археологии, антропологии, лингвистики, понимая частую условность их сведений, поскольку о том, что те ископаемые предки действительно дожили в потомках до наших дней, приходится только гадать.

Именно потому союз антропологии, археологии, лингвистики с ДНК-генеалогией так важен. ДНК-генеалогия предоставляет в их распоряжение жесткую привязку в виде «метки» рода, определенную и однозначно определяемую мутацию в Y-хромосоме ДНК, мутацию под названием «снип» (SNP = Single Nucleotide Polymorphism), которая всегда сопровождает каждого члена рода. Эта мутация не ассимилируется в популяциях, как ассимилируются языки, культуры, религии, физические черты, антропологические показатели, эта мутация, снип, одна и та же в смешанных популяциях, она позволяет отличить члена рода через тысячи и десятки тысяч лет. Она позволяет проследить миграции родов и отдельных представителей рода, она позволяет понять, останки представителей каких родов находятся в археологических раскопах, и как археологические культуры связаны друг с другом - не только через материальные, культурообразующие носители, но и через людей, через конкретные рода, понять генезис, динамику археологических культур, добавить важнейшую компоненту к динамике человеческих популяций и их материальных носителей.

Определение снипа, то есть конкретной родовой принадлежности останков в Костенках и Сунгирях немедленно и надежно позволило бы определить, есть ли их потомки среди нас, среди современного человечества. Если снип окажется совершенно незнакомым, каких среди современных людей нет, то потомки этих культур, увы, не выжили. По крайней мере в мужском населении планеты. Но поскольку женщины имеют свои гаплогруппы и гаплотипы, в митохондриальных ДНК, то аналогичные тесты позволили бы однозначно установить, есть ли потомки женщин древних Костенок и Сунгирей среди женщин Земли в настоящее время. Можно выдвинуть и частично обосновать гипотезу, что потомки обитателей тех древних стоянок 45-50 тысяч лет назад действительно дожили до настоящего времени, но она, гипотеза, может быть верифицирована только путем анализа ДНК ископаемых останков. Технически это возможно секвенированием, то есть определением нуклеотидной последовательности фрагментов костной ДНК, глубоко упрятанных в костях и частично пережившей тысячелетия, и (немногочисленные) примеры таких исследований и их результаты приведены в литературе. Эти исследования немногочисленны, фактически единичны, работа трудна и дорогостояща.


Следует еще раз подчеркнуть - ДНК-генеалогия наших современников «докапывается» только до бутылочных горлышек популяций, родов, племен, генеалогических линий, связывающих современников с их предками. «Бутылочное горлышко» - это далеко не обязательно результат мора, эпидемий, войн, природных катаклизмов в прошлом, хотя все эти факторы непременно имели место и оказали влияние на состав современных популяций. Трудно представить, насколько чума середины 14-го века, которая выкосила четверть европейцев, терминировала генеалогические линии, гаплотипы, и, возможно, целые гаплогруппы, рода. Много генеалогических линий начинаются именно в середине 14-го века. Это - выжившие люди, поведшие линию популяции опять сначала, ставшие «общими предками многочисленных групп наших современников.

Геноцид - худший враг ДНК-генеалогии, не говоря о всем человечестве. Сколько генеалогических линий прервала резня в Армении второго десятилетия прошлого века - об этом можно только догадываться. Да и любая война вносит необратимый вклад в уничтожение генетического «материала». Галльские войны Юлия Цезаря, по данным Плутарха, привели к гибели более миллиона жителей Центральной Европы, и еще миллион был угнан в рабство. Опять, можно только гадать, как это изменило ландшафт гаплотипов и гаплогрупп в Европе.


Но не только войны и эпидемии создают «бутылочные горлышки», но и переезд, переход, миграция носителя гаплогруппы и гаплотипа на новое место. Если миграция массовая, или даже нескольких человек, то они «переносят» мутации своего общего предка на новое место, и с точки зрения ДНК-генеалогии общий предок мигрантов как был тысячелетия назад, так и остался. Так, например, общий предок англичан в Англии и в США - один и тот же. Как и русских, восточных славян, например. Это вовсе не означает, что восточные славяне жили в Северной Америке 4800 лет назад, как на территории современной России. Тем не менее, подобные заключения - типичная ошибка ДНК-генеалогии. Исландия была заселена только в 9-м веке нашей эры, а общий предок исландцев практически по всем родам - тысячелетия назад, как и в континентальной Европе.
С другой стороны - общий предок гаплогруппы R1b1 по расчетам ДНК-генеалогии (по мутациям в гаплотипах) жил в Центральной (Средней) Азии 16 тысяч лет назад; на территории современной России, среди этнических русских - 6775 лет назад; на Ближнем Востоке (в частности, среди евреев, а  также в Ливане) 5200-5500 лет назад, в Северной Африке - 3875 лет назад, на Пиренеях - 3625 лет назад, в Ирландии - 3800-3400 лет назад. Вот такой шлейф дает обоснованное представление о временах и направлении миграций рода R1b1, более того - дает основания связать этот род с курганной культурой (точнее, серией культур, горизонтом). Более того, он показывает истоки этой культуры в Евразии, дает материал для интерпретаций в области языкознания. Показывает, что вряд ли гаплогруппа, род R1b1 может рассматриваться в качество «прото­индоевропейского» в отношении языка, и отдает это место роду R1a1, который мигрировал на Русскую равнину из Европы и имеет общего предка на Русской равнине 4800 лет назад, то есть намного позже, чем «курганники» (R1b1). Носители гаплогруппы R1a1 продвинулись на восток, основали, среди прочих, андроновскую культуру (с ископаемыми R1a1 с датировкой 3800-3400 лет назад), с последующими тагарской и таштыкской культурами (ископаемые гаплогруппы практически исключительно R1a1), и примерно 3500 лет назад продвинулись в Индию, вся северная часть которой в настоящее время преимущественно R1a1. Вот и корни индоевропейской семьи языков, корни санскрита, свидетельства прибытия туда носителей гаплогруппы R1a1, преобладающей по доле гаплогруппы в современной России (в среднем 48% среди этнических русских, при второй по численности гаплогруппы только 15%, тоже, кстати, европейской гаплогруппы I2, которой много у сербов и болгар; в южной части России -Белгородская, Орловская области и прилегающие территории - доля гаплогруппы R1a1 доходит до 62%).


Кстати, эта «курганная» гаплогруппа (хотя курганная археологическая культура - всего эпизод в истории гаплогруппы) сейчас является наиболее распространенной в центральной и западной Европе и на Британских островах, достигая до 95% у ирландцев и до 93% у жителей Пиренейского полуострова.

Отсюда и новый термин - молекулярная история, то есть создание исторических реконструкций, исходя из молекулярных характеристик ДНК потомков, а порой и (ископаемых) предков. Поскольку далекие предки, передвигаясь, несли в новые края языки, то, прослеживая миграции предков, происходившие сотни, тысячи и десятки тысяч лет назад, можно получать сведения о миграции языков во времена столь глубокой древности. Сопоставление этих реконструкций с данными лингвистики, полученными принципиально другими методами, может позволить получать более обоснованные сведения в области языкознания, проверять существующие концепции и приходить к новым, совершенно неожиданным концепциям и идеям.
Теперь дадим несколько определений, и уточним некоторые положения, приведенные выше. Потом перейдем к систематическому рассмотрению некоторых принципов и методов ДНК-генеалогии.

Мы будем здесь рассматривать ту область ДНК-генеалогии, которая оперирует картиной мутаций в Y-хромосоме, то есть мужской половой хромосоме. Женскую ДНК-генеалогию, основанную на мутациях в митохондриальной ДНК, мы здесь рассматривать не будем. Совокупность картин мутаций прилагается к популяциям, выбранным для рассмотрения. Здесь термин «популяция» относится к любой группе мужчин, ДНК которых была извлечена (из слюны или крови) и тестирована по определенной методике, результатом чего явился набор цифр, характерных для каждого субъекта данной популяции. Эти цифры можно сопоставить по аналогии с серией и номером паспорта человека. «Серия паспорта» - это род, к которому относится данный человек. Род - это совокупность людей, имеющих общего (для всех) прямого предка (рода). Все члены рода имеют характерную метку, то есть мутацию в ДНК, которую не имеют представители других родов. Эта мутация, как уже было отмечено, называется в ДНК-генеалогии «снип», и была дана расшифровка этого понятия. Эта мутация в каждом роду необратима, и передается из поколения в поколение, начиная со времени возникновения данной мутации, обычно тысячи или десятки тысяч лет назад. Таким образом, возраст родов исчисляется в тысячах, а то и в десятках тысячах лет. Возраст ДНК-генеалогических линий, ветвей рода, исчисляется порой всего в сотнях лет, опять же исходя из картины мутаций в ДНК тестируемых людей (Клёсов, 2008а; Klyosov, 2009 b,c).

В задачи данного рассмотрения не входит давать исчерпывающий обзор истории создания и развития ДНК-генеалогии, хотя для справедливости следует отметить, что ДНК-генеалогия вырастает из дисциплины под названием популяционная генетика, которая была заложена трудами многих специалистов. Приложение популяционной генетики к ДНК человека в 1990-х годах - заслуга в первую очередь таких имен (хотя в данном списке, безусловно, отражаются личные предпочтения авторов), как Cavalli-Sforza L.L., Feldman M.W., Goldstein D.B., Hammer M.F., Jobling M.A., Kayser M., de Knijff P., Nebel A., Nei M., Oppenheim A., Semino O, Stoneking M., Thomas M., Underhill P., Walsh B., Wells R.S., Л.А. Животовский, Т. М. Карафет, и многих других, которые здесь поместить просто невозможно (см., например, Cordaux et al, 2004; Goldstein et al., 1995; Hammer et al., 2000; Heyer et al., 1997; Jobling & Tyler-Smith, 1995; Karafet et al., 1999; Kayser et al., 2000; Nebel et al., 2000, 2001; Nei, 1995; Semino et al., 2000; Takezaki & Nei, 1996; Underhill et al., 2000; Walsh, 2001; Wells, 2001; Zhivotovsky & Feldman, 1995)
Трудами этих и десятков других исследователей были проведены тщательные отнесения снипов к принципиальным родам человечества и их подчиненным родам и отдельным генеалогическим линиям рода, имеющим свои мутационные метки в ДНК), называемым субкладами. Снипы тщательно идентифицируют и выбирают для классификации, так, чтобы рода (в терминах ДНК-генеалогии) были максимально четко дифференцированы. Всего на Земле насчитывают 20 родов (их именуют по буквам латинского алфавита, от А до Т), хотя снипов, применяемых в ДНК-генеалогии, известно уже несколько сотен. Они в большинстве своем и относятся к подчиненным родам, субкладам. Наиболее изучен так называемый «западноевропейский» род R1b1b2, в котором в свою очередь выделяют 35 субкладов, и число их с каждым годом растет (в 2008 году в нем насчитывали 22 субклада). Для сравнения, в «восточноевропейском» роде R1a1, к которому принадлежит в среднем 48% этнических русских, насчитывают всего восемь субкладов, из которых два пусты, то есть имеют скорее теоретический характер, в четырех насчитывают всего два десятка человек из более чем двух тысяч тестированных, и только в одном, субкладе R1a1a7, насчитывают около трехсот человек. Остальные - в «тупиковом» (пока) субкладе R1a1a* (Underhill et al, 2009).

Носителей одного и того же снипа относят к одной и той же гаплогруппе. Иначе говоря, гаплогруппа - это и есть род в понятиях ДНК-генеалогии.

Надо сказать, что есть по меньшей мере две причины, по которым в гаплогруппе R1a1 так мало субкладов. Первая - то, что примерно 4500 лет назад что-то произошло с гаплогруппой R1a1 в Европе, она практически «обнулилась», не прошла бутылочное горлышко популяции. Это мог быть некий грандиозный природный катаклизм, мор, эпидемии, или что-то, почти уничтожившее носителей гаплогруппы R1a1 в Европе, и, похоже, не только их. Выжили только перешедшие к тому времени на Русскую равнину, они и возродили популяцию R1a1, которая частью вернулась в Европу. Потому расселение гаплогруппы R1a1 резко падает от Восточной Европы к центральной Европе и далее к Атлантике. На большей части Британских островов доля R1a1 составяляет 2-5%, а в России, Польше, Украине - в среднем до 50%, порой и до 70% по территориям. В среднем по Европейской части России доля R1a1 составляет 48%, падая от 70-80% за счет заметной доли N1c в северных районах. То, что R1a1 в Европе значительно более древняя, по оценкам не менее 10-12 тысяч лет, выявляется по одиночным современным гаплотипам случайно выживших древних ДНК-генеалогических линий (Рожанский и Клёсов, 2009).
Вторая причина - весьма прозаична. Основные центры исследований ДНК-генеалогии - на Западе, где значительно преобладают гаплогруппы R1b1 и I1-I2, и где крайне мало R1a1. На первые и направлены усилия исследователей и финансирование. Выше уже было упомянуто, что в гаплогруппе R1b1b2 идентифицировано 35 субкладов, добавим, что в гаплогруппе I - 34 субклада. В гаплогруппе R1a1 - практически два, сама гаплогруппа и субклад R1a1a7*. Но в недавней статье (Рожанский и Клёсов, 2009) было показано наличие четырнадцати ДНК-генеалогических ветвей в гаплогруппе R1a1, две из которых относятся к тому самому, недавно идентифицированному субкладу R1a1a7*.

Число и расположение мутаций в выбранных для анализа участках ДНК, так называемых гаплотипах, можно сопоставить с «номером паспорта». Это - индивидуальная характеристика человека. Гаплотипы можно определять на коротких участках ДНК, можно на более протяженных участках, что увеличивает разрешение, информативность исследования. Длину участка ДНК, то есть протяженность гаплотипов, измеряют в числе маркеров. Маркер - это участок ДНК, специально охарактеризованный и «откалиброванный» числом нуклеотидов, которые образуют повторяющиеся, или «тандемные» последовательности. Наиболее распространенными при исследованиях являются гаплотипы в 12, 17, 25, 37 или 67 маркеров. Чем протяженнее гаплотип, чем больше в нем маркеров, тем он более уникален, более точно описывает «паспорт» человека. Вот как выглядят 12-маркерные гаплотипы всех четырех человек в редкой гаплогруппе R1a1a1, упомянутой выше как один из пяти субкладов в «восточноевропейском» роде R1a1a:
13-23-14-11-11-14-12-14-12-13-13-16 

13-24-14-10-11-15-12-12-12-14-13-16

13-24-14-10-11-14-12-12-11-13-13-17

13-24-14-11-11-15-12-12-12-13-13-16
Этот род иногда называют «восточноевропейским», так как гаплогруппа R1a1, как отмечалось выше, наиболее распространена в Восточной Европе. Но в данном случае носители гаплогруппы R1a1a1 указали на своих наиболее ранних им известных предков (как правило, живших не ранее 19-го века) в Канаде, Шотландии, Ирландии, Испании. Вполне возможно, что их более далекие предки действительно были восточноевропейцами, например, обитателями Балкан. Может быть, жили и в других регионах Европы, мы этого пока не знаем. Приведенные выше четыре гаплотипа различаются между собой на 10 мутаций (считая только отклонения от преобладающих, «базовых», или «предковых» значений маркеров). Чем больше число отклонений (мутаций), тем раньше жил общий предок рассматриваемой группы людей.

Одна мутация в 12-маркерных гаплотипах происходит в среднем примерно в тысячу лет, точнее, раз в 1140 лет (Klyosov, 2009a), с точностью определения, зависящей от числа мутаций в гаплотипе. Чем больше мутаций, тем точнее определение средней частоты мутаций. 10 мутаций на четыре 12-маркерных гаплотипа, то есть на 48 маркеров - это в среднем 0.208 мутаций на маркер, что при расчетах дает 3200±1100 лет до общего предка всех четырех человек данного рода R1a1a1. Расчеты обычно проводятся по формулам или по таблицам (Klyosov, 2009a; Клёсов, 2008c).

Более точно расчеты проводятся по 25-маркерным гаплотипам. Они определены всего для трех человек данной группы R1a1b (YSearch, май  2009):

13-23-14-11-11-14-12-14-12-13-13-16-18-9-10-11-11-24-15-19-29-15-16-16-19 
13-24-14-10-11-15-12-12-12-14-13-16-16- 9- 9-11-11-25-15-18-30-15-15-17-17 
13-24-14-10-11-14-12-12-11-13-13-17 -18-9- 9-11-11-25-15-19-31-15-15-17-18

Между всеми тремя гаплотипами - 19 мутаций. На все 75 маркеров это дает в среднем 0.253 мутации на маркер, что приводит к времени жизни общего предка для всех трех человек 4000±1000 лет назад. В пределах ошибки эти величины перекрываются для 25- и 12-маркерных гаплотипов, и видно, что величины в принципе довольно близкие, причем вторая величина, рассчитанная для почти вдвое большего количества маркеров, должна быть точнее.

Для 37-маркерных гаплотипов имеем:

13-23-14-11-11-14-12-14-12-13-13-16-18-9-10-11-11-24-15-19-29-15-16-16-19-11-11-19-23-16-15-17-17-36-38-13-12

13-24-14-10-11-15-12-12-12-14-13-16-16- 9- 9-11-11-25-15-18-30-15-15-17-17-11-10­19-23-16-15-17-18-39-40-11-12

13-24-14-10-11-14-12-12-11-13-13-17 -18-9- 9-11-11-25-15-19-31-15-15-17-18-11-12­19-24-15-15-18-17-36-36-12-12

Это добавило еще 15 мутаций, доведя общее число до 34 мутаций на 111 маркеров, или в среднем 0.306 мутаций на маркер. Скорости мутаций для 37-маркерных гаплотипов на треть выше, чем для 12- и 25-маркерных гаплотипов, поэтому и мутаций больше. Расчеты дают, что общий предок трех человек данной гаплогруппы жил 3600±700 лет назад. Как видно, 12-, 25- и 37-маркерные гаплотипы дают примерно один и тот же возраст общего предка, в пределах ошибки расчетов.


Естественно, для такого малого числа гаплотипов подобные расчеты обычно не делают, и здесь они приведены просто для иллюстрации принципа расчетов. Именно из-за малого числа гаплотипов и мутаций в них ошибка расчетов составила от 30 до 20%. Обычно для больших серий, порой в сотни, а то и тысячи гаплотипов (Klyosov, 2009a; 2009b; Адамов и Клёсов, 2009d) ошибки расчетов уменьшаются, приближаясь к 10%, как было описано выше, при 95%-ном доверительном интервале, и к 5% при 68%-ном доверительном интервале. Большей точности обычно не бывает, поскольку лимитирует уже точность определения скоростей мутаций.

Систематическое рассмотрение основ и принципов ДНК-генеалогии

Для начала определимся, что такое «род», поскольку будем часто пользоваться этим понятием. В контексте ДНК-генеалогии, да пожалуй и вообще - это группа людей, в которой каждый человек связан с общим предком прямой наследственной линией. Этот род может быть очень древним, или относительно - или совсем - недавний, и относиться к любому прямому предку. В этом смысле как вы, так и брат вашего отца, то есть ваш дядя, ведете род от вашего дедушки. Как правило, «ведете род» - это понятие коллективное, и объединяет вас, как уже было сказано, с определенным кругом родственников, связанных прямыми наследственными линиями с одним общим предком. Чем предок глубже по времени, тем шире круг этих современных родственников. Все они принадлежат одному роду, более того, все несут в своих ДНК мутацию их БЛИЖАЙШЕГО общего предка.

Итак, в ДНК-генеалогии эта принадлежность к одному роду идентифицируется по наличию у каждого члена рода характерного признака - определенной «метки» в ДНК. Причем не просто в ДНК, а в нерекомбинируемой части ДНК, которая не перетасовывается с материнской ДНК, но передается по наследству как есть. Это делает ее исключительно ценной для ДНК-генеалогии, потому что нерекомбируемая часть ДНК - единственная, которая не смешивается с материнскими хромосомами. Эта нерекомбинируемая часть ДНК находится в Y-хромосоме, мужской половой хромосоме. Потому и не рекомбинируется с женской половой хромосомой, а передается мужчинам целиком и полностью от отца.

Таким образом, если говорить о любой относительно стабильной и многочисленной общности людей, которые идентифицируют себя как относящиеся к этой общности, то они подразделяются на несколько  доминирующих родовых групп. Однородными в этом смысле были бы только те общности, которые в течение тысяч и десятков тысяч лет жили бы в полной изоляции в пределах своего рода. Но так обычно не бывает.

В соответствии с этими понятиями любое вторжение - речь, естественно, о половых вторжениях - представителя другого рода, которое приводит к рождению мальчика, в свою очередь дающего мужское потомство, означает, что это потомство ведет наследственные нити уже к тому, другому роду. У этого потомства уже другой характерный рисунок в мужской хромосоме, другие молекулярные метки. Естественно, при таком вторжении приобретаются и гены отца, а с ними и масса других наследственных признаков, но гены по ходу поколений постепенно разбавляются другими, опять своего рода, «вымывая» генетику «чужака». А вот Y-хромосома не вымывается, остается той же. Точнее, почти той же, за исключением накопленных мутаций. Об этом речь ниже.

В итоге потомки часто и понятия не имеют, что они - прямые потомки другого рода. Язык, образ жизни, традиции, религия, даже характерные черты внешности, «возвращенные» генетическим вымыванием - все говорит о том, что никаких вторжений не было. Собственно, даже и мысли об этом обычно нет. И - самоидентификация со своим родом на месте, что обычно самое главное для сознания человека в этом отношении.

И только данные по «меткам» в Y-хромосоме могут показывать, что на самом деле прямые потомки в отдалении - близком или далеком -принадлежали вовсе другому роду.

Важно это знать или нет? Кому как. Многим совершенно не важно, и они по-своему правы. В конце концов, в жизни масса других приоритетов, чем интересоваться предками. Другим важно, иначе не было бы огромного количества людей, интересующихся генеалогией своих предков. А это фактически то же самое, только методология другая и другие диапазоны времени.

Видимо, важно это и третьим, которые применяют генеалогию как аргумент в политических спорах или даже физических действиях. И вот здесь сходятся непримиримые позиции, когда на кону или выживание и расцвет нации, или ее притеснение, вплоть до физического истребления, геноцида. И аргументы здесь тоже по сути дела генеалогические, в какой бы форме они ни выражались.


Как вынесено в заголовок, мы будем оперировать понятиями ДНК-генеалогии. Напомним основные положения этой новой дисциплины, поскольку материал нуждается в изложении понятийного аппарата.

Основные положения ДНК-генеалогии

Первое - к генетике наше повествование отношения не имеет (хотя в определенной части ДНК-генеалогии рассматривают и гены, но здесь этого не будет). ДНК - это не только гены. Гены вообще занимают только 1.9% последовательности ДНК. Остальные 98.1% - длинные участки, так называемые «никчемные». Генов там нет. Есть длинные последовательности нуклеотидов, которые детально копируются при передаче наследственной информации от отца к сыну. Мы специально пишем «от отца к сыну», потому что у нас речь пойдет только о «мужской» наследственной информации, передаваемой с мужской половой Y-хромосомой. У женщин её, этой хромосомы, нет.

«Никчемными» эти негенные последовательности ДНК назвали по незнанию, и это название уже уходит в прошлое. Оказалось, что эти последовательности хранят массу информации, и не только «генеалогического» характера. Более того, оказалось, что они, эти «никчемные» участки, содержат сотни, если не тысячи крошечных генов РНК, кодирующих так называемые микро-РНК, длиной всего пару десятков нуклеотидов каждый, и которые регулируют синтез белков. Но об этом - в другой раз.

А сейчас - о том, что эти негенные участки ДНК в мужской Y-хромосоме, одной из 23 хромосом, которые доставляются сперматозоидом в организм будущей матери, копируются от отца к сыну, поколение за поколением. Поскольку у матери такой хромосомы нет, то сын наследует ее только от отца. Остальные хромосомы сплетаются с материнской и образуют новую комбинированную молекулу ДНК, в которой хромосомы отца и матери перетасовываются. Перетасовываются все, кроме мужской Y-хромосомы.

Так и получается, что отец передает сыну эту Y-хромосому интактной, строго скопированной со своей. А свою Y-хромосому он получил от своего отца. Тот - от своего. И так далее, на тысячи и десятки тысяч лет вглубь, назад, к далеким предкам современных людей, и к предкам тех далеких предков.

Здесь - важное примечание. В антропологии принято считать, в соответствии с базовыми понятиями, парадигмой антропологии, что сотни тысяч лет назад людей не было, во всяком случае на бОльшей части земной территории. Были палеонтропы, архантропы, неандертальцы, эректусы, другие гоминиды. Но дело в том, что наши предки были, как их ни называть. Они были и десятки, и сотни тысяч лет назад, и миллионы лет назад. От них, приматов, мы и наследуем гаплотипы и гаплогруппы, пусть в значительной степени измененные, мутированные. Но наследуем. Значит, предки. Таким образом, аргументы, что тогда-то давно не было предков современного человека, в принципе неверны. Они были, но просто или не обнаружены антропологами (что вполне возможно), хотя и были на рассматриваемой территории, или они были минорной долей гоминидов и прочих приматов, и при изучении последних просто не встречались, проскочили сито антропологов, весьма крупноячеистое, или определение, используемое антропологами, слишком жесткое, и не отражает значительно более сложной истории происхождения человечества. Это же относится в полной мере и к Африке, поэтому типичный аргумент антропологов, что там 40-200 лет назад были только палеоантропы и архантропы, не есть на самом деле значимый аргумент.

Если бы Y-хромосома так и передавалась из поколения в поколение действительно неизменной, толку для генеалогии от нее было бы мало. Но неизменного ничего в мире нет, особенно когда речь о копировании. Копирования без ошибок не бывает. В том числе и копирование Y-хромосомы.

Итак, второе положение - время от времени при копировании Y-хромосомы (а сейчас только о ней речь) в копии проскакивают ошибки. Фермент под названием ДНК-полимераза, а на самом деле вместе с целым набором молекулярных инструментов, или просто ошибается, и делает некоторые участки ДНК короче или длиннее, удлиняя или сокращая повторы нуклеотидов, или «ремонтирует» поврежденные участки, и в ходе «ремонта» удаляет повреждение (эта операция называется «делеция») или «вшивает» новый нуклеотид (называется «вставка», или «инсерт»).

Поэтому мутации, которые интересуют ДНК-генеалогию, бывают двух типов - или изменение числа повторов, тандемов, или «точечные», однонуклеотидные.

Оказалось, что многие повторы нуклеотидов находятся у разных людей в одних и тех же участках Y-хромосомы. Эти участки уже биохимиками пронумерованы, классифицированы, сведены в списки. Они получили название «маркеры». Набор маркеров, точнее, повторов в них, называется «гаплотип». Уже известных маркеров - многие сотни. И они, как правило, одни и те же у всех людей на Земле. Они отличаются только числом повторов,   что   вызвано   теми   самыми   ошибками   ферментов при копировании из поколения в поколение. Внимательное рассмотрение маркеров и гаплотипов позволило сделать вывод, что все люди на Земле произошли от одного предка. Иначе говоря, все люди - родственники. Пока не удалось найти ни одного человека, у которого маркеры и гаплотипы были бы принципиально другие, которые не удалось бы вывести (по мутациям на временной шкале) из других жителей Земли в пределах последней сотни тысяч лет. И это - серьезный (если не последний) аргумент против «теории мультирегиональности», согласно которой люди произошли от разных племянников современного человека, включая неандертальцев, синантропов и прочих гоминидов. То, что эти кузены человека существовали, сомнению не подвергается, но то, что выжившего потомства они не оставили - это, так сказать, экспериментальный факт. Пока не опровергнутый, но с каждым новым определением гаплотипа подтверждаемый.

Строго говоря, приведенное выше рассуждение не отвергает теорию мультирегиональности в отношении жизни на Земле в ПРОШЛОМ потомков различных родов и видов, но отвергает наличие нескольких разных предков у СОВРЕМЕННЫХ людей. Иначе говоря, если даже разнообразные люди были, в полном соответствии с теорией мультирегиональности, они не прошли «бутылочные горлышки» популяций, не выжили. Выжила всего одна генеалогическая линия, от нее и произошло современное человечество. К настоящему времени образцы ДНК взяты у представителей практически всех популяций, и все сводятся к одному общем предку. Время жизни этого предка определяется разными исследователями в интервале между 100 и 200 тысяч лет, порой и глубже во времени, вплоть до 800 тысяч лет назад (хотя это - верхняя грань большой погрешности расчетов), поскольку разные исследователи используют разные значения скоростей мутаций, и эти данные пока в должной мере не упорядочены. Тем не менее, между ведущими исследователями имеется консенсус, что этот предок жил в Африке.

Итак, положение третье - все люди происходят от одного предка, который жил - по разным расчетам - от 100 до 200 тысяч лет назад. Примерно такое время понадобилось, чтобы получить то расхождение гаплотипов по мутациям, какое наблюдается у всех живущих ныне людей.

Положение четвертое - гаплотипы изображают в виде числа тандемов, или повторов, по каждому маркеру, выбранному из десятков и сотен. В англоязычной литературе их называют STR, или Short Tandem Repeats. Самый простой и короткий гаплотип из тех, которые рассматривает ДНК-генеалогия, состоит из пяти или шести маркеров. Например, у восточных славян, к которым относится от 50% до 80% жителей старинных русских городов, городков и селений, базовый (или предковый) 6-маркерный гаплотип, в той записи, в которой обычно приводят в научных публикациях, такой

16-12-25-11-11-13

Он показывает число повторов нуклеотидных участков в маркерах, которые обозначают соответствующими индексами 19, 388, 390, 391, 392 и 393. В первом маркере (номер 19) было найдено 16 повторов определенной последовательности нуклеотидов. Во втором - 12 повторов уже другой последовательности, и так далее. При передаче этого гаплотипа от отца сыну с вероятностью примерно одна сотая (то есть в среднем у одного на сто рождений) может произойти мутация, например, такая:

16-12-24-11-11-13

(в третьем маркере, выделена). Именно такая мутация есть у автора, поскольку она произошла у его предка. Остается неизвестным, когда она произошла - может, тысячелетия назад, может - автор такой в его генеалогической линии первый. И узнать это можно только изучая ДНК прямых предков, или самых ближайших родственников. Например, если у родного брата такая же мутация - тогда автор точно не первый. Надо смотреть ДНК у дедушки или у брата дедушки, и так далее по генеалогической цепочке. Но это не имеет большого практического значения. Что есть, то есть. Хотя любознательность порой наказуема, и у родного (по документам) брата может оказаться вообще другой гаплотип, да и другой род. Такое в ДНК-генеалогии бывает, и чаще, чем хотелось бы. Например, случилось с Рюриковичами, которые принадлежат как к славянскому, так и норманскому родам, в лингвистических категориях -угро-финскому. Афронт случился несколько сот лет назад, на уровне Владимира Мономаха, плюс-минус одно поколение.

Возвращаясь к нашему примеру, мутация могла произойти и в первом маркере:

15-12-25-11-11-13

или могла произойти любая другая мутация (как правило, одношаговая) в этих или любом другом маркере этого гаплотипа.

Например, еврейский ближневосточный гаплотип («гаплотип двенадцати колен израилевых», «гаплотип коэнов» - оба названия условные, а во втором случае и просто неверное, но принятое в литературе, о чем речь пойдет ниже), записанный в таком же 6-маркерном виде, такой:

14-16-23-10-11-12

Между восточно-славянским и ближневосточным еврейским гаплотипами -9 одношаговых мутаций, или в среднем 1.5 мутации на маркер. Это отражает долгий путь, который славяне и евреи эволюционно (в отношении гаплотипов) прошли, отделившись от общего предка. 9 мутаций на 6-маркерном гаплотипе означают, дистанция между двумя гаплотипами равна 86 тысяч лет, или что общий для славян и евреев общий предок жил огромное время назад, не менее 40 тысяч лет тому (точнее, 43 тысячи лет назад). Как эти дистанции считать - об этом позже.

Часто рассматривают 12-маркерные гаплотипы. Например, у восточных славян базовый гаплотип такой (здесь запись уже по стандартам наиболее известных баз данных):

13-25-16-11-11-14-12-12-10-13-11-30

Здесь маркеры по порядку следующие: 393, 390, 19, 391, 385a, 385b, 426, 388,
439, 389-1, 392, 389-2.
В 25-маркерном варианте восточно-славянский гаплотип записывается так:
13-25-16-11-11-14-12-12-10-13-11-30-15-9-10-11-11-24-14-20-32-12-15-15-16
У ближневосточных евреев часто встречается такой 12-маркерный гаплотип («недавний гаплотип коэнов»):

12-23-14-10-13-15-11-16-12-13-11-30

У него с восточно-славянским уже 16 мутаций-расхождений, то есть в среднем 1.33 мутаций на маркер. Чем длиннее гаплотип, тем лучше статистика, тем точнее расчеты.

У ближневосточных евреев часто наблюдается следующий 25-маркерный гаплотип:

12-23-14-10-13-15-11-16-12-13-11-30-17-8-9-11-11-26-14-21-27-12-14-16-17

Это дает 31 мутацию на 25-маркерном гаплотипе, или в среднем 1.24 мутации на маркер. По скоростям мутаций это примерно соответствует 1.35  мутации на маркер для 12-маркерного гаплотипа. Так что статистика работает, и данные в целом вполне соответствуют друг другу на гаплотипах разной длины. Опять же, чем длиннее, тем точнее.

А вот пример 37-маркерного гаплотипа, который в данном случае принадлежит потомку человека по фамилии Коэн, который жил полтораста лет назад в Санкт-Петербурге:

12-23-14-10-13-15-11-16-12-13-11-30-17-8-9-11-11-26-14-21-27-12-14-16-17-11-10-22-22-15-14-21-18-31-35-13-10

Естественно, чем длиннее гаплотип, тем больше вероятность найти своего близкого предка в наше время. Заметьте, кстати, что на первых 25 маркерах этот гаплотип в точности совпадает с базовым, предковым, приведенным выше. А ведь предок жил 1350 лет назад, в 7-м веке нашей эры. Вот насколько стабильными могут быть гаплотипы и их маркеры.

Еще пример, не столько стабильного гаплотипа. Статистика есть статистика.

12-23-14-10-13-15-11-16-11-13-11-30

Жирным шрифтом выделена одна мутация в 12-маркерном гаплотипе по сравнению с базовым «гаплотипом коэнов», приведенным выше. Этот гаплотип принадлежит еврею, живущему сейчас в Англии, и предок которого родился много поколений назад, в 1799 году, там же, в Англии. А обладатель 37-маркерного гаплотипа, приведенного выше, как уже упомянуто, родился на 50 лет позже в России. Различаются всего на одну мутацию на 12 маркерах.

А на 37 маркерах? Приведем гаплотип еврея-англичанина более детально:

12-23-14-10-13-15-11-16-11-13-11-30-17-8-9-11-11-26-14-21-27-12-14-16-16-11-10-22-22-15-14-17-17-31-35-14-10

По сравнению с петербуржским Коэном добавились еще семь мутаций, всего восемь: 12->11, 17->16, 21->17, 18->17, 13->14. Восемь, потому что одна мутация четырехшаговая, она могла проходить шаг за шагом на протяжении длительного времени.

То, что данные примеры относятся к евреям, объясняется двумя причинами. Одна - потому что автор много занимался ДНК-генеалогией евреев.  За три с лишним тысячи лет относительной изоляции (по религиозным и прочим причинам) евреев от «гоев» у евреев выработались характерные ДНК-генеалогические линии, порой четко отличающие евреев от неевреев. Поэтому наблюдается парадокс - сами евреи порой не могут дать четкого определения евреев, которого и в самом деле нет, но ДНК-генеалогические линии часто выявляют определенные ДНК-популяции евреев и почти безошибочно идентифицируют их носителей как евреев, независимо от их религиозной принадлежности, гражданства, или места жительства. Вторая причина - потому, что евреи более других (и это «экспериментальный факт») интересуются своей ДНК-генеалогией, своими корнями. Это в свою очередь объясняется трагичной историей еврейского народа, постоянным передвижением по миру, часто вынужденным, часто - бегством, отсюда - потерей родовых, предковых связей. Сейчас, с помощью ДНК-генеалогии, эти связи восстанавливаются. И вовсе не нужно расматривать интерес к ДНК-генеалогии евреев как вторжение в их приватность, как попытки их «выявить и обмерить». Доказательством тому - многочисленные перепечатки работ автора в еврейских изданиях и награды и дипломы автору от еврейских коллективов, в том числе и золотая медаль от Международного общества коэнов (коханим) за вклад в изучение истории евреев.

Это - к тому, что по мнению немалого количества малообразованных и негативно настроенных людей, ДНК-генеалогия, да и антропология - это попытки разделить людей на «высших и низших». Нет ничего более далекого от истины. Это - попытки понять наше прошлое, а значит - и будущее. Как раз единство общих предков показывает, что все люди - в буквальном смысле родственники.

Возвращаясь к последнему примеру выше, сообщим, что восемь мутаций у пары 37-маркерных гаплотипов соответствуют дистанции примерно в 98 поколений между ними, или примерно 2450 лет разницы во времени. То есть их условный общий предок жил на половине этого временного срока, или примерно 1225 лет назад. Кстати, одна мутация на 12 маркерах соответствует примерно 1200 лет, как будет упомянуто чуть ниже. Так что здесь неплохое сходство во времени.

Но здесь это совпадение просто случайное. Потому что надо привести положение пятое: нельзя сравнивать мутации в парах гаплотипов. Мутации - дело статистическое, и их можно количественно (и часто полуколичественно) расчитывать только на больших выборках. Чем выборка меньше - тем результат расчета менее точный. А на двух гаплотипах мутация-другая могла добавиться буквально в предыдущем или нынешнем поколении. Это может сразу привести к прибавлению­ отнятию тысячи лет «в одном поколении». А в большой выборке разница относительно нивелируется статистикой.

Подходы теории вероятности могут оценить погрешности расчетов в парах гаплотипах (или в любом их количестве), принадлежащих одному роду (одной гаплогруппе). Если два гаплотипа различаются на одну мутацию, то в 6-маркерных гаплотипах их общий предок жил 1600+1600 лет назад с надежностью 95%. Как видно, информативность такой информации близка к нулю. Если два 67-маркерных гаплотипа различаются на одну мутацию, то их общий предок жил 75+75 лет назад, с той же 95%-ной надежностью. Иначе говоря, общий предок этих двух человек с 95%-ной вероятностью подапает в интервал времени от 150 лет назад до настоящего времени. В общем случае, одна мутация - это ±100%-й интервал погрешности для любого гаплотипа.

Две мутации - это ±71%-й интервал погрешности, с той же 95%-ной надежностью. Пять мутаций в серии гаплотипов - 46%-й интервал погрешности. 10 мутаций - 33% погрешности. 100 мутаций - 14% погрешности. 1000 мутаций - 10.5% погрешности. То есть мы вплотную приблизились к предельной, минимальной погрешности, когда уже лимитирует точность константы скорости мутаций в гаплотипах. Точнее уже не будет, если не доказать, что константа определяется с погрешностью меньше, чем 5%. Естественно, 1000 мутаций могут быть только в больших сериях гаплотипов, причем не происходящих от недавнего предка. В тех мутаций мало. В любом случае, чем больше гаплотипов в выборке, тем больше в них мутаций, тем точнее расчет времен жизни общего предка.

А как часто происходят мутации в гаплотипах? Для ответа на этот вопрос надо вернуться к тому, что мутации бывают двух разных типов -тандемные и точечные. Для тандемных мутаций средняя скорость мутации в 6-маркерном гаплотипе равна 0.0088 мутаций на гаплотип в поколение, то есть одна мутация в гаплотипе происходит в среднем примерно за 114 поколений, или за 2850 лет, если считать поколение за 25 лет (а именно это часто заложено в ДНК-генеалогические расчеты). На самом деле, это будет не 114 поколений, а 129, то есть 3225 лет, если принять в расчет возвратные мутации, как будет пояснено ниже.

В 12-маркерном гаплотипе средняя скорость тандемных мутаций равна 0.022 на гаплотип в поколение, то есть одна мутация в 12-маркерном гаплотипе происходит в среднем примерно за 48 поколений, или примерно раз в 1200 лет. А точечные мутации происходят раз и навсегда. Они и являются метками гаплогрупп.


В 17-маркерном гаплотипе одна мутация происходит раз в 740 лет, в 19-маркерном - раз в 880 лет, в 25-маркерном - раз в 540 лет, в 37-маркерном -раз в 280 лет, и в 67-маркерном гаплотипе - раз в 170 лет. Это дает общее представление, как часто происходят мутации в гаплотипах.

То есть имеем положение шестое - по числу тандемных мутаций в гаплотипах можно определять возраст гаплотипа.

А от чего, или от кого считать? От того предка, кто имел такой гаплотип. Поскольку его сыновья сохраняют гаплотип отца, переданный по наследству, и мутации в этом гаплотипе проскакивают в среднем только раз примерно в 3225 лет (6-маркерный гаплотип) или раз в 1200 лет (12-маркерный гаплотип), то даже через 5000 лет у потомков сохранится 23% исходного 6-маркерного гаплотипа, без изменений. То есть в списке из 100 гаплотипов потомков - 23 гаплотипа будут такими же, какой был у предка 5000 лет назад. Это если рассматривать 6-маркерные гаплотипы. При рассмотрении 12-маркерных гаплотипов те же 23% гаплотипов предка сохранятся через 72 поколения, или 1800 лет.

Так что и через тысячелетия можно определить гаплотип предка. И по его виду можно узнать, из каких краев предок пришел.

К этому ведет положение седьмое - гаплотипы в немалой степени (но не всегда) связаны с определенными территориями.

Но как такое может быть? А вот как. В древности большинство людей передвигались племенами, родами. Род, по определению, это группа людей, связанных родством. То есть гаплотипы у них одинаковые или близкие. Помните - одна мутация в среднем происходит за тысячелетия? Проходили тысячелетия, численность родов порой сокращалась до минимума (бутылочное горлышко популяции), и если выживший имел некоторую мутацию в гаплотипе, то его потомки уже «стартовали» с этой новой мутацией. Некоторые люди покидали род по своей или чужой воле -плен, бегство, путешествия, военные походы, и выжившие начинали новый род на новом месте. В итоге карта мира с точки зрения ДНК-генеалогии получилась пятнистой, и каждое пятно порой имеет свой превалируюший гаплотип, гаплотип рода. Такой наиболее популярный гаплотип на определенной территории называют «модальным». Часто он и есть гаплотип предка, начавшего род на данной территории.

Но есть еще один тип мутации - помните? Точечные мутации, однонуклеотидные. Они - практически вечные. Раз появившись, они уже не исчезают. Теоретически, в том же нуклеотиде может произойти другая мутация, изменив первую. Но нуклеотидов - миллионы, и вероятность такого события крайне мала. Всего в хромосомах насчитали более трех миллионов точечных мутаций (The International HapMap Consortium, 2007), и ДНК-генеалоги нашли применение нескольким сотням, которые, как уже было пояснено, называют «снипы», что и расшифровывается (в переводе с английского языка) римерно как «единичная нуклеотидная мутация». Так вот, те, кто в древности покинул свой род по своей или чужой воле, всегда имели в своей Y-хромосоме эти самые снипы, причем во множестве. Все они передавались сыновьям, в результате того самого копирования ДНК от отца к сыну. Так что все мы имеем и тандемные мутации, и снипы. Из нескольких сотен снипов, которым ДНК-генеалоги нашли применение, около двухсот оказались удачными метками определенных популяций на Земле. Эти популяции и есть те самые рода, о чем речь шла выше, в самом начале. Их, эти рода, потомки которых несут соответствующие метки в ДНК, назвали «гаплогруппы», и присвоили им буквенные обозначения от А до Т, в хронологическом порядке появления соответствующего рода на планете. Или по крайней мере в том порядке, как ученые полагают эти рода появились. Хотя ревизий на этот счет предстоит еще много.

Итак, положение восьмое - людей можно классифицировать по древним родам не только (и не столько) по виду гаплотипов, но и по наличию определенных снипов. Например, гаплогруппы А и В - исконно африканские и самые древние; гаплогруппа С - монголоидная (и значительной части американских индейцев, потомков монголоидов), а также австралоидная; гаплогруппа J - исходно Ближний Восток, причем J1 -в основном евреи и арабы, гаплогруппа J2- в основном жители Средиземноморья (хотя и часть евреев тоже); гаплогруппа N - многие жители Китая, Сибири, севера России и части Скандинавии, куда и прибыли носители гаплогруппы N тысячелетия назад. Гаплогруппа R -происхождение неясно, отцы-основатели ДНК-генеалогии определили ее происхождение как азиатское, но тогда трудно объяснить ее «европеоидность», как очевидно, глядя на большинство носителей гаплогрупп R1a1 и R1b1b2. Весьма вероятно, что гаплогруппа R появилась на Русской равнине 50-40 тысяч лет назад, вместе с гаплогруппами I и N, тоже в основном европеоидными, и затем гаплогруппа I в своей части перешла в Европу 45-35 тысяч лет назад, став кроманьонцами и граветтами, а гаплогруппа R (или R1) перешла в Азию, дав далее гаплогруппы R1a и R1b. Подгруппа R1b - преобладающая подгруппа Западной Европы, доля которой превышает 90% в некоторых регионах Испании и Ирландии), и R1a - преобладающая в Восточной Европе, России, Украине, а также имеющая значительное представительство в Индии (более 100 млн человек, не менее 16% от мужской популяции, но по некоторым данным и 30%), куда эта гаплогруппа (R1a1) была принесена из Восточной Европы и Русской  равнины. Гаплогруппой R1a1 отмечены и довольно резко очерчены территории Средней Азии (в Киргизии и Таджикистане), куда снип, образующий R1a1, был принесен его обладателями - ариями - по дороге в Индию и Китай. Интересно, что эти довольно резкие очертания границ гаплогруппы R1a1 в Средней Азии в ряде случаев, возможно, воспроизводят маршрут похода обладателей R1a1. А на переходе из горной долины Памира в Индостан, в самой теснине перехода, по которому шли предки, целая малая народность так и донесла до современности этот европейский снип, образующий R1a1, в 80 процентов состава этой народности, под названием ишкашим. Гаплогруппа R1a1 представлена и в Восточном Иране, что, видимо, отражает арийский период этого региона в первом тысячелетии до нашей эры, примерно в то же самое время, что и переход в Индию (см. статью в этом выпуске Вестника).

Итак, данное положение сводится к тому, что у каждого мужчины есть снип из определенного набора, по которому можно сразу отнести носителя к определенному древнему роду. Времена появления снипов, обычно применяемых в ДНК-генеалогии, относятся к диапазону от 25-40 тысяч лет для «старых» снипов до 10-15 тысяч лет и менее - для «молодых». Снип гаплогруппы R1a1, преобладающей в России, образовался примерно 20 тысяч лет назад, как будет изложено ниже. Снип М458 субклада R1a1a7* образовался примерно 3900+300 лет назад (см. статью А. Клёсова и И. Рожанского в данном выпуске Вестника).

Положение девятое - гаплогруппы не просто соответствуют определенным родам, но образуют определенную последовательность, лестницу гаплогрупп, показывающих их иерархию, последовательный, ступенчатый переход от древнейшей гаплогруппы А до самой недавней гаплогруппы R (технически самыми последними гаплогруппами являются недавно введенные в номенклатуру гаплогруппы S и Т, но они ведут свое начало от промежуточной по положению гаплогруппы К). Эта последовательность называется «филогенетическое дерево гаплогрупп Y-хромосомы». Для его построения необходимо выполнение двух основных критериев - снип, образующий гаплогруппу, должен происходить со скоростью, не превыщающей 5х10-7 мутаций/ поколение, и что снип должен происходить не более двух раз за всю историю человечества.

Чтобы пояснить эти два положения, напомним, что снип - это определенная мутация в определенном нуклеотиде (или в нескольких нуклеотидах одновременно). Например, гаплогруппа R1a1 определяется как имеющая мутацию М17 с идентификационным индексом rs3908, которая превратила четырехнуклеотидный прогон в трехнуклеотидный GGGG->GGG в Y- хромосомном участке под номером 68 и в позиции под  номером 20192556. Носители той же гаплогруппы имеют также мутацию М198 с идентификационным индексом rs2020857, которая превратила цитозин в тимин (С->T) в Y- хромосомном участке под номером 45 ив позиции под номером 13540146. Вышестоящей гаплогруппой является R1a, c определяющей мутацией SRY10831.2 с идентификационным индексом rs2534636, которая превратила гуанин в аденин (G->A) в Y- хромосомном участке под номером 135 и в позиции под номером 2717176. Это -необычная мутация, поскольку ровно обратная ей есть у всех людей, потомков вышедших из Африки (по представлениям современной ДНК-генеалогии), и именно сводной гаплогруппы BR (то есть включающей в древние времена все гаплогруппы от B до R, поскольку их снипы тогда еще не образовались). Так вот, переход от древнейшей гаплогруппы A в ту сводную BR произошел посредством мутации SRY10831.1 с тем же идентификационным индексом rs2534636, только там, наоборот, аденин прератился в гуанин (А->G) в том же самом Y- хромосомном участке под номером 135 и в позиции под номером 2717176. Другими словами, гаплогруппа R1a вернулась к гаплогруппе А, но с новыми дополнительными мутациями, которые набежали за десятки тысяч лет. Но вот той самой мутации, которая есть у всех неафриканцев на планете, в нас, восточных славянах, нет. Она вроде как заросла. Такие возвратные мутации называются у генетиков реккурентными. Они редко, но бывают.

Конечно, сооблазнительно было бы объявить, что мы, восточные славяне, и есть самые первые люди на Земле, поскольку только у двух гаплогрупп, африканской А и восточнославянской R1a, нет этой самой мутации, как нет ее и у приматов, а у других она появилась позже, начиная со сводной гаплогруппы BR - но к этому у нас нет оснований. Потому что в братской гаплогруппе R1b, которая составляет большинство западноевропейцев, эта мутация есть. Как и другие мутации, роднящие нас с «вышестоящими» гаплогруппами R1 и R. Так что получается, что в гаплогруппе R1a, «восточнославянской» (на территории России), эта мутация просто «закрылась», гуанин вернулся в аденин. Бывает.

Возвращаемся к двум основным критериям вхождения в дерево гаплогрупп отдельной самостоятельной гаплогруппой. Максимально допустимая скорость «сниповой» мутации 5х10-7 на поколение означает, что мутация в любой генеалогической линии должна происходить реже, чем раз в два миллиона поколений, то есть раз примерно за 50 миллионов лет. То есть она действительно должна быть практически необратимой. Это и делает человеческие рода, основанные на классификации по снипам, совершенно стабильными. Потому они и не ассоциируются за практически бесконечное время, не говоря от каких-то десятках тысяч лет. Но мутации - дело статистическое, и все может случиться и за более короткое время. Поэтому ­второй критерий: если сниповая мутация и случится чаще, чем ожидается, то уж во всяком случае не чаще, чем два раза за историю человечества. Если случилась три раза - она из списка снипов вычеркивается как ненадежная, способная «взбрыкивать». Вот в R1a она произошла уже два раза, ситуация на пределе. Если в ближайшие пару миллионов лет произойдет еще раз, придется ее вычеркнуть.

Есть еще важный критерий - все гаплогруппы должны включать снипы «вышестоящих» гаплогрупп. То есть принцип «лесенки» должен выполняться. Преемственность узловых родов человечества должны соблюдаться.

Все это делает филогенетическое дерево гаплотипов достаточно прочной и обоснованной структурой. У него есть только одно слабое место - само дерево, ее филогения не показывает, на каком континенте зародилось человечество, откуда пошли гаплогруппы, начиная с первой, гаплогруппы А. Говоря языком филогении, дерево гаплогрупп не «укоренено». Укоренение дерева - результат интерпретаций наблюдений и доступных экспериментальных данных. К этому мы еще вернемся, а пока - как же представляется укоренение и последующее развитие дерева гаплотипов в пространстве и во времени? Как, откуда и куда шли миграции родов человечества? Это и есть центральный вопрос ДНК-генеалогии. Ниже - результат консенсуса специалистов в том виде, как он изложен в программном документе Международного общества генетической генеалогии (ISOGG) за 2009 год, хотя определенные положения там определенно не доработаны.

В целом у специалистов-генетиков и биологов за последние 15 лет сложилось убеждение, что человечество вышло из Африки. На этом основании было построено филогенетическое дерево гаплогрупп, начинающееся от африканской гаплогруппы A, и продолжающееся до самой молодой, заключительной гаплогруппы R (недавно, как уже упомингалось, были добавлены еще две гаплогруппы, S и Т, но они ведут свое начало от более ранней гаплогруппы К). По этим представлениям, гаплогруппа А образовалась примерно 60-80 тысяч лет назад. До этого рода человечества как рода (гаплогруппы) не рассматриваются. Здесь не нужно путать понятие «рода» (tribe - англ.) в ДНК-генеалогии с понятием «рода» (genus - лат.) в биологии.

Возможно, это найдет полное понимание у антропологов, поскольку до этого, то есть до образования гаплогруппы А (60-80 тысяч лет назад) и до образования анатомически современного человека, Homo sapiens, 100-200 тысяч лет назад, понятие «человечества» стоит на шаткой базе. Предки
определенно были, но не от «человечества». Это могли быть «продвинутые» неандертальцы, гейдельберги, архантропы, палеоантропы, эректусы и прочие гоминиды (здесь мы умышленно смешиваем разные номенклатуры рода Homo семейства гоминид). Относительно немного представителей гаплогруппы А осталось в Африке, в частности, в Эфиопии и Судане, и среди популяций с щелкающими языками. Популяции с этой гаплогруппой разбросаны по всему континенту «пятнами». Похоже, что это все, что осталось от самой древней гаплогруппы. Расчеты времен жизни общего предка с помощью реальных гаплотипов гаплогруппы А проведены в статье (Клёсов, 2009a). У этой гаплогруппы есть свои подгруппы с более недавними снипами, такие, как подгруппы A2, A3b1, A3b2 (снипы М6, М51 и М13, соответственно). А2 и А3Ь1 живут преимущественно в южной Африке, причем A3b1 - почти исключительно койзанская популяция. 1.1% чернокожих африканского происхождения в США имеют гаплогруппу
A3b2.

Сводная (в те времена) гаплогрупппа ВТ образовалась из гаплогруппы А 55 тысяч лет назад, в северо-восточной Африке, и гаплогруппа В оформилась примерно 50 тысяч лет назад. Расчеты времен жизни общего предка с помощью реальных гаплотипов гаплогруппы B проведены в статье (Клёсов, 2009b). Территория и частота встречаемости примерно та же, что и гаплогруппы А, но добавляются центральноафриканские пигмеи и южно­африканские койзаны (гаплогруппа B2b). Язык банту распространен во многом среди носителей гаплогруппы B2a. К гаплогруппе В относятся 2.3% американских чернокожих (афро-американцев).

От гаплогруппы В отделилась сводная гаплогруппа СF, которая и мигрировала из Африки. Это произошло в интервале 31-55 тысяч лет назад. От этой сводной гаплогруппы 50 тысяч лет назад образовалась гаплогруппа С, ее носители мигрировали на восток, и часть ее шлейфа осталась на юге Аравийского полуострова, остальные через Пакистан и Индию, Шри Ланку и через Юго-Восточную Азию ушли в Австралию. Подгруппы этой гаплогруппы наблюдаются в Японии (С1), в Полинезии, Меланезии и в Папуа-Новая Гвинея (С2), в юго-восточной и Центральной Азии (С3), среди аборигенов Австралии (почти исключительно С4).

От сводной гаплогруппы CF 50 тысяч лет назад образовалась сводная гаплогруппа DE, которая в свою очередь образовала гаплогруппу Е, которая разошлась по Северной Африке и Европе, и D, которая мигрировала в Индию и далее по Азии. Носители D1 живут в Тибете, Монголии, Центральной Азии, Юго-Восточной Азии, D2 - почти исключительно в Японии. Тот факт, что в Тибете примерно 50% гаплогруппы D, в Японии ­35%, может указывать на миграционные связи древних обитателей Азии. Высокое содержание гаплогруппы D2 наблюдается среди популяции айну.

Гаплогруппа Е появилась, видимо, в Северо-восточной Африке, но не исключен ближневосточный регион, откуда она могла попасть в Африку. Основания для этого предположения - что гаплогруппы E и D были в прошлом тестно связаны, но D в Африке не наблюдается. Гаплогруппа распространилась на огромные территории в Африке и Европе. Большинство афро-американцев имеют именно эту гаплогруппу.

Тот факт, что гаплогруппы F в Африке практически нет, но более 90% людей Земли имеют гаплогруппы, нисходящие от F, может означать, что она образовалась уже за пределами континента, или вышла из Африки в составе небольшой группы людей.

Гаплогруппа G, которая предположительно образовалась 30 тысяч лет назад в Северной Месопотамии, наблюдается в основном на Кавказе, в Иране, на Ближнем Востоке, и в Средиземноморье, но ее почти нет на севере Европы -менее 2% популяции. На юге Европы она достигает 8-10% от общего состава Испании, Италии, Греции, Турции. Значительная доля гаплогруппы G наблюдается в Северной Осетии (до 50%), в Грузии и в Азербайджане. Гаплогруппу G имел И. Сталин (тест проведен по ДНК его внука), причем гаплотип практически в точности соответствует гаплотипам осетинского района, где и предполагалась родина его предков. В Европе наблюдается преимущественно G2а, в Иране - G1.

Гаплогруппа Н образовалась из F примерно 30-40 тысяч лет назад, предположительно в Индии, там в основном и осталась. Эта гаплогруппа пришла в Европу с цыганами в виде подгруппы Н1.

Сводная гаплогруппа IJK, образовавшаяся из F на Ближнем Востоке 45 тысяч лет назад, сначала отделила сводную гаплогруппу IJ и отдельную гаплогруппу K, затем разделилась на I и J, и разошлась по Ближнему Востоку, Средиземноморью и далее по Европе, причем в Европу сначала прибыла гаплогруппа I, по всей видимости, с Русской равнины, куда мигрировала из Месопотамии через Кавказские горы, или в обход их. Это -новое положение, и оно потребовалось, чтобы объяснить наличие многих археологических памятников на Русской равнине с датировкой 50-45 тысяч лет назад, появление европеоидов в Европе 45-40 тысяч лет назад, причем, видимо, с северо-востока, и европеоидность гаплогрупп I и R.



Сейчас гаплогруппа I (в составе двух основных подгрупп - I2 [«балканской», которую стоило бы назвать «гаплотипом Русской равнины»] и балтийской» или «скандинавской»]) охватывает примерно 20% европейцев, будучи второй по численности после гаплогруппы R1b1. Названия этих гаплогрупп опять условные, и даются здесь просто для ориентации, потому что указанные территории содержат наибольшие доли этих гаплогрупп. За пределами Европы гаплогрупп I1 и I2 практически нет. I2 - старейшая гаплогруппа в Европе.
Гаплогруппа J1 наблюдается преимущественно у арабов и евреев, генеалогические линии которых разошлись примерно 4000 лет назад, в любопытном соответствии с тем, что изложено в Библии и ее трактовках. Так, исход из Египта трактуется как имевший место в ходе извержения вулканак Санторин примерно 3600 лет назад, а библейский Авраам жил за 400 лет до того. В Египет, как излагает Библия, пришел внук Авраама Иаков с детьми и семейством. По иронии судьбы, евреи и арабы, включая палестинских арабов, в значительной степени делят не только гаплогруппу J, но и ее подгруппу J1. Они - близкие ДНК-генеалогические родственники. Гаплогруппа J2 наблюдается среди жителей Средиземноморья - греков, итальянцев, а также многих евреев, выходцев с Ближнего Востока. Немало ее в Индии, и расчеты времен жизни их индийских общих предков даны в статье (Клёсов, 2009c).

Сводная гаплогруппа NOP (rs2033003) образовалась из гаплогруппы К примерно 35-40 тысяч лет назад к востоку от Аральского моря (это - одна из двух основных версий), потом разделилась на N, заселившую Сибирь и территории южнее и севернее, О, мигрировавшую через Индию в Южную Азию, и Р, ушедшую в южную Сибирь, и разделившуюся на Q и R. Та же гаплогруппа К дала гаплогруппы L и M. Первая наблюдается в основном в Индии и Шри-Ланке (как субклад L1) и Пакистане (L3), гаплогруппа M в основном находится в Папуа - Новой Гвинее, где ее насчитывается от трети до двух третей всей гаплогруппы М всей планеты. Неясным остается несомненная европеоидность финнов, русских поморов, и этнических русских гаплогруппы N, проживающих в немалой степени в регионе от Белого моря до Новгорода-Пскова. Не исключено, что гаплогруппа N, наряду с I и R, образовалась (или развилась) на Русской равнине, и только потом, 30-20-15 тысяч лет назад мигрировала на восток, перейдя на Алтай и далее в Китай. О том, что такие миграции с Русской равнины имели место, свидетельствуют алхеологические находни европеоидов в Прибайкалье с датировкой 24-15 тысяч лет назад (по разным данным).

Гаплогруппа Q наблюдается в значительной степени среди сибирских народов, а также у американских индейцев, включая потомков племен майя. Немало этой гаплогруппы у евреев-ашкенази, что относят к хазарским временам, поскольку общему предку этой гаплогруппы среди евреев не более тысячи лет. Другая версия маршрута миграции сводной гаплогруппы NO - из Северной Месопотамии 35-40 тысяч лет назад, на восток до Памирского узла, и далее по южной дуге до Индостана и Китая с последующей миграцией на север до Южной Сибири, Алтая и далее по северной дуге до Урала, Белого моря и Балтийского моря, куда носители гаплогруппы N прибыли только несколько тысяч лет назад, и образовали группы уральских и угро-финских языков. Там они встретились с носителями гаплогруппы R1a1, группа арийских языков, или, как их сейчас называют лингвисты, «иранских» языков, с носителями гаплогруппы R1b1, тогда носителями, возможно, вариантов древних тюркских языков, которые и до настоящего времени местами остались на востоке Русской равнины, в Прикамье и Приуралье, и с носителями гаплогруппы I, древний язык которых остается загадкой.

Гаплогруппа R дала три наиболее известные гаплогруппы - R1a1, R1b1 и R2. Все три рассмотрены довольно подробно в статьях настоящего Вестника, например (Клёсов, 2008 b,d,e; 2009 d,e,f). Коротко - R1a1 наиболее представлена в России (48% в среднем и до 62% в южных областях России) и в Восточной Европе (Польша, Украина, Белоруссия, примерно такие же или несколько меньшие доли в популяциях); в Центральной Европе и в Скандинавии ее примерно 15-20%, и в Атлантических регионах ее почти нет, порой на уровне единиц процентов. Гаплогруппа R1a1 образовалась примерно 20 тысяч лет назад, предположительно в Южной Сибири, и разошлась на европейскую и азиатскую ветви. Первая мигрировала в Европу, где зафиксирована 8-12 тысяч лет назад, вторая - через Китай мигрировала в Индию и Пакистан, со временем общего предка там 8-12 тысяч лет назад.

Европейские R1a1 - это гаплогруппа древних «прото-индоевропейцев», они же арии, прибывших в Индию примерно 3500 лет назад, и замкнувших языковую связь межде Европой и Индией (и тогда же с Ираном). Примерно тогда же они прибыли в Анатолию, предположительно через Кавказские горы. В высших кастах Индии и сейчас до 72% носителей гаплогруппы R1a1. R1b1 - это, вероятно, носители «курганной культуры» 5-7 тысяч лет назад в южных степях России и Украины, на своем пути из Центральной Азии до Ближнего Востока, Северной Африки (включая Египет и Алжир), и через Пиренейский полуостров - в Европу, где они сейчас наиболее широко представлены. Гаплогруппа R2 - относительно недавняя, преимущественно локализована в Индии, ее возраст там около 7 тысяч лет  (Клёсов, 2009е).
Положение десятое - в ДНК-генеалогии обычно оперируют поколениями. Поколение в контексте ДНК-генеалогии - это событие, которое происходит  четыре раза в столетие. Численно и по времени оно близко к продолжительности поколения в житейском смысле этого слова, но не обязательно равно ему. Хотя бы потому, что продолжительность поколения не может быть точно, или хотя бы в среднем определена, и «плавает» в реальной жизни, в зависимости от многих факторов, включая культурные, религиозные, и бытовые традиции, примерно и в среднем от 18 до 36 лет. В древности этот диапазон был, видимо, заметно смещен к первой величине. Поэтому использовать столь «плавающую» величину для расчетов в широких временных диапазонах и для разных народов не представляется возможным или разумным. Скорости мутаций в наших работах откалиброваны под условно взятое поколение продолжительностью 25 лет. Если кому-то больше нравится 30 лет на поколение, или любое другое количество лет, скорости придется перекалибровать, и в итоге окажутся ровно те же величины в годах. Так что сколько лет приходится на поколение - в данном случае не имеет значения, потому что при расчетах меньшему числу лет на поколение будет просто соответствовать пропорционально большее число поколений, и итоговая величина в годах не изменится.

Положение одиннадцатое - только те мутации в гаплотипах имеет смысл рассчитывать, экстраполируя к времени общего предка, которые подчиняются определенным количественным закономерностям. Другими словами, ДНК-генеалогия оперирует тремя экспериментальными факторами - (1) наличием снипов, относящих человека к определенному роду, (2) наличием мутаций, позволяющих оценивать время, прошедшее от общего предка совокупности гаплотипов, и - при больших выборках - от начала самого рода, от самого далекого из предков ныне живущих потомков данного рода, и (3) закономерности переходов гаплотипов в их мутированные формы, без численного учета самих мутаций. Это позволяет оценить, насколько достоверны расчеты предка по мутациям, и дает еще один, независимый способ расчетов.

Только если число поколений до общего предка совпадет по пп (2) и (3), естественно, в пределах разумной ошибки, то эту временную оценку можно считать числом поколений до общего предка. Иначе говоря, это совпадение показывает, что общий предок был один (в рамках ДНК-генеалогии; например, это могли быть и родные братья, и даже группа близких родственников с одинаковыми или близкими гаплотипами). Если же число поколений, полученное по числу мутаций и по доле сохранившихся немутированными гаплотипов, заметно различается (порой в 2-3 раза), то данная выборка гаплотипов не может численно обрабатываться в предположении, что предок был один. Такую выборку надо делить по разным общим предкам, и для этого могут использоваться деревья гаплотипов или медианные сети. Тогда разные ветви дерева часто (не не всегда) соответствуют разным общим предкам.

Приведем пример подобного подхода. Рассмотрим два набора по 10 гаплотипов в каждом.


14-16-24-10-11-12 
14-16-24-10-11-12
14-16-24-10-11-12 
14-16-24-10-11-12
14-16-24-10-11-12
14-16-24-10-11-12
14-17-24-10-11-12
15-16-24-10-11-12

14-15-24-10-11-12
15-17-24-10-11-12 
14-16-24-10-11-12
14-16-24-10-11-12
14-16-24-10-11-12
14-16-24-10-11-12
14-16-24-10-11-12
14-16-24-10-11-12
14-16-25-9-11-13
14-16-25-10-12-13
14-17-23-10-10-13
16-16-24-10-11-12



Первые шесть гаплотипов в каждом наборе - базовые (предковые) гаплотипы. Остальные четыре - мутированные, в первом наборе 5 мутаций, во втором - 12. Если обращать внимание только на мутации, то среднее количество мутаций в наборах равно 5/10/6 = 0.083 и 12/10/6 = 0.200 мутаций на маркер. Ясно, что второй набор «древнее» в том смысле, что происходит от более древнего общего предка (если он один для всего набора), поскольку со времени его жизни в гаплотипах его потомков накопилось больше мутаций. Чтобы определить соответствующее количество поколений, отделяющих современных гаплотипы от их общего предка, надо полученные средние величины мутаций разделить на константу скорости мутаций. Для 6-маркерных гаплотипов (в стандартном формате) она равна 0.00088 мутаций на гаплотип, или 0.00147 мутаций на маркер. Таким образом, количество поколений до общего предка будет равно 57 и 136 поколений, соответственно (с поправками на возвратные мутации разница будет еще больше, а именно 61 и 158 поколений, соответственно).

Однако в обоих случаях число поколений, рассчитанное по доле базовых гаплотипов, равно ln(10/6)/0.0088 = 58 (с поправкой - 62 поколения; принципы расчетов описаны ниже). Как видно, только первый набор дал примерно такое же число поколений (61 и 62), и, таким образом, представляет «чистую выборку», имеющую одного общего предка. Второй набор искажен, и соответствует более чем одному общему предку. Поэтому он не может быть использован для прямых расчетов временной дистанции до общего предка.


л/44.72 +102 = 45.8%, и второй серии - V28.92 +102 = 30.6%, то есть 61±28 поколений, или 1525±700 лет до общего предка в первой серии гаплотипов. В такой серии гаплотипов общий предок всей серии жил в указанном интервале лет с 95%-ной достоверностью.
Если же рассчитывать число поколений и погрешности по числу базовых гаплотипов, то при оставшихся шести базовых гаплотипов погрешность в их числе равна в простейшем случае обратному квадратному корню из числа базовых гаплотипов, то есть 6±40.8%, или 6±2 базовых гаплотипов, и погрешность для числа поколений до  общего  предка первой серии
гаплотипов равна л/40.82 +102 = 42.0%, то есть 62±26 поколений, или 1550±650 лет до общего предка. Как видно, обе величины, рассчитанные по мутациям и по базовым гаплотипам практически одинаковы, но ошибка определения оказалась даже несколько меньше для расчетов по базовым гаплотипам. Это - следствие того, что число базовых гаплотипов оказалось больше, чем число мутаций в данной серии.
Вторая серия является смесью ДНК-генеалогических линий, и ее суммарный расчет был бы некорректным.


«Научные» и «коммерческие» выборки гаплотипов
Выборки гаплотипов, которые публикуются в научной литературе, часто бедны, немногочисленны и урезаны, и часто относятся только к коротким, шестимаркерным гаплотипам, намного реже к 8- или 10-маркерным, еще реже в 17- или 22-маркерным. В последнее время ситуация, впрочем, стала улучшаться, и чаще стали типировать 17-маркерные гаплотипы. Гаплотипы с 25, 37 и 67 маркерами в научной литературе не приводятся, на это у ученых просто нет средств. Да и задачи в основном другие, опять же из-за отсутствия достаточных средств. Зато в коммерческих базах данных таких протяженных, полновесных гаплотипов – тысячи. Но в науке к таким базам данных – предубеждение.

Работает научный снобизм – выборки «ненаучные», кто хотел – тот и прислал свой материал на тестирование, контроля за «контингентом пользователей» - никакого. 

В работах автора этот разрыв между «наукой» и «коммерцией» был практически закрыт, то есть было показано, что в подавляющем большинстве случаев «научные» и «коммерческие» выборки приводят к одним и тем же результатам, только «коммерческие» зачастую точнее (Клёсов, 2008а, Klyosov, 2009a). Иначе говоря, коммерческие базы данных предоставляют значительно более полную и многочисленную информацию по гаплотипам, и позволяют получать более полные и более надежные данные.


Естественно, есть крайние случаи, когда выборки содержат ошибочные гаплотипы, гаплогруппы или гаплотипы неправильно типированы, но и научные выборки не гарантируют от присутствия ошибок. Естественно, надо внимательно относиться к «коммерческим» выборкам, удалять из них дубли, и вообще осмысливать полученные даные, но это и к научным выборкам относится.

Редкий пример предположительно искаженных выборок - это коммерческие выборки по африканским гаплотипам (Клёсов, 2009а^). Они составлены из гаплотипов тех, кто направил образцы своих ДНК в коммерческие лаборатории (как правило, в США) и смог оплатить анализ стоимостью в 150-300 долларов. Вряд ли в из число входят обитатели удаленных африканских племен. Это, как правило, образованные афро-американцы. Понятно, что среди их предков, доставляемых в виде рабов в Америку, были и представители удаленных племен, и именно это и дает время жизни их общего предка до 28 тысяч лет назад в гаплогруппе А, и 37 тысяч лет назад по гаплогруппам А и В совместно. Тем не менее, можно ожидать, что реальные цифры окажутся заметно более древними.


Подобный пример можно привести и по индийцам. Коммерческие базы данных приводят гаплотипы почти исключительно индийцев-«индоевропейцев» носителей гаплогруппы R1a1, с гаплотипами, практически идентичными европейским, в частности, гаплотипам R1a1 этнических русских (гаплотип автора практически неотличим от индийских гаплотипов гаплогруппы R1a1, и находится на одной ветви дерева гаплотипов с индийцами, поляками, и сербами), и принципиально с тем же, европейским, возрастом общего предка, только на 800 лет «моложе» (примерно 4000 лет). Потому и «индоевропейцы», оттого и индоевропейская семья языков. А вот гаплотипы некоторых индийских  удаленных племен, имея ту же гаплогруппу R1a1, значительно древнее, с общим предком 8-12 тысяч лет. Но в коммерческих базах данных представителей удаленных племен практически нет, их гаплотипы получены только в ходе научных экспедиций. Впрочем, оказалось, что и в некоторых племенах в индийских джунглях (например, племени Ченчу) гаплотипы «индоевропейские», и с возрастом около 3000 лет назад (Klyosov, 2009b). Так что бывают и плохо предсказуемые варианты.

Но так бывает нечасто, когда разные группы населения одной страны или территории имеют совершенно разную историю в пределах одного рода. В Индии - почти уникальный случай, когда один и тот же род прибыл на одну территорию (хотя и обширную) с интервалом в 10 тысяч лет, и с тех пор практически не перемешивались. Для этого нужно иметь прочную кастовую структуру общества.


В качестве противоположного примера приведем сопоставление «научных» и «коммерческих» выборок по гаплотипам евреев гаплогрупп J1 и J2. До последнего времени их практически не разделяли. В самой известной статье по гаплотипам евреев (Behar et al, 2003) приведено почти двести гаплотипов, объединенных в одну сводную гаплогруппу J. А вот в коммерческой базе данных евреи есть и в разделе «Гаплогруппа J1», и в разделе «Гаплогруппа J2». Но можно ли использовать коммерческую базу данных, которая составлена добровольным участием, хотя и за деньги? А как же научные принципы формирования выборок?

Сравним научную выборку (Behar et al, 2003) и коммерческую.

В научной выборке - 194 гаплотипа евреев, имеющих гаплотипы группы J. Из них 91 гаплотип, или 47%, представляют один и тот же

14-16-23-10-11-12

который по правилам ДНК-генеалогии следует назвать базовым, или предковым гаплотипом. Действительно, он один сохраняется длительное время, а все остальные представляют его мутированные варианты, расходящиеся статистически по частным случаям - с одной мутацией там или здесь, с двумя, с тремя и так далее. Вот и набегают 103 мутированных гаплотипа из 194, каждого понемногу.

А в коммерческой выборке? В ней - 90 гаплотипов евреев, все гаплогруппы J1. Это - все, кто там оказались, судя по именам и фамилиям. Всего в этой базе данных 294 гаплотипа гаплогруппы J1, так что евреи в ней занимают немалую долю, около трети. Из остальных - определенно многие тоже
евреи, но с нехарактерными (на мой взгляд) для евреев именами и фамилиями, а также арабы и другие обладатели гаплотипов группы J1. И из этих выбранных 90 «коммерческих» гаплотипов 41 - той же самой структуры

14-16-23-10-11-12.

Это - 46%. В «научной» выборке было 47%. То есть практически полное совпадение по доле базовых гаплотипов в научной и коммерческой выборках. Это, кстати, тот самый «модальный гаплотип коэнов». Он же «гаплотип двенадцати колен израилевых» в 6-маркерном варианте.

Хорошо, по доле базовых гаплотипов научная выборка, со всеми положенными критериями объективности, и коммерческая база дали совпадающие результаты. А по мутациям?

В научной выборке 194 гаплотипа содержат 263 мутации, или 1.36 мутации на гаплотип. В коммерческой - 90 гаплотипов содержат 123 мутации, то есть 1.37 мутации на гаплотип. Совпадение - лучше не бывает.

Другими словами, обе выборки дают практически идентичные результаты. По этим мутациям можно посчитать и время, когда жил общий предок и тех евреев, его потомков, что нашли отражение в научной базе (сводная гаплогруппа J), и тех, что в коммерческой (гаплогруппа J1). Это на самом деле физически разные потомки. 194 человека, гаплотипы которых попали в научную статью, были протестированы в конце 1990-х - начале 2000-х годов и бесплатно, в коммерческой базе данных - недавно (в основном 2005­2007 гг) и за деньги.

В простейшем случае расчеты общего предка ведутся, принимая (по умолчанию) простое симметричное дерево мутаций. То есть дерево в виде симметричной пирамиды (или шестеренки в другом формате, который мы обычно используем), сходящейся вниз к гаплотипу общего предка (см. рисунки в этом и других выпусках Вестника). Что-то наподобие обычного генеалогического древа, но если в последнем порядок поколений уже заложен, то в дереве гаплотипов поколения беспорядочно упрятаны в ветвях. Чем больше в гаплотипе мутаций - тем дальше гаплотип отстоит от основания «шестеренки», тем от более древнего предка он происходит, если в «дереве» смешаны гаплотипы потомков разных предков. Иначе говоря, гаплотипы недавнего предка жмутся у основания, гаплотипы древнего предка уходят вдаль в виде неких протуберанцев. Это и дает основания для расчетов.


Как уже упоминалось, средняя скорость мутации шестимаркерных гаплотипов, таких, как приведены выше - 0.0088 мутации на гаплотип на поколение. И тогда приведенные выше 1.36 мутации на гаплотип дадут 155 поколения (183 поколения - с поправкой на возвратные мутации) до общего предка, а 1.37 мутации на гаплотип дадут 156 поколения до общего предка (184 поколения - с поправкой). То есть примерно 4600 лет, считая 25 лет на поколение.

Казалось бы, можно объявить, что на двух разных выборках евреев, одна общей гаплогруппы J, другая - гаплогруппы J1 получено, что общий предок ближневосточных евреев жил 4600 лет назад. И с Ветхим Заветом примерно сходится, ну, может, на несколько веков больше по сравнению с известными толкованиями.

Но это не так. Потому что для срока в 184 поколения, или 4600 лет, слишком много сохранилось базового, предкового гаплотипа. Почти половина от гаплотипов в выборке. Его должно быть меньше.

А сколько меньше? И вот здесь работает способ расчета, связывающий долю оставшегося нетронутым базового гаплотипа и временем до общего предка, причем независимо от числа мутаций. Чтобы понять, как рассматривать гаплотипы в отношении их происхождения, нам придется заняться немного математикой и картинками «деревьев гаплотипов».


Кинетика мутаций гаплотипов, их калибровка и проверка. Принципы датировки. Основа исторических реконструкций


Если принять, что генеалогическое дерево действительно симметричное, то переход базового гаплотипа в мутированные должен проходить в соответствии с уравнением кинетики первого порядка

ln (B/A) = kt

где В - это общее количество гаплотипов в списке, А - число сохранившихся базовых гаплотипов, k - средняя скорость (частота) мутации (0.0088 на гаплотип на поколение для шестимаркерного гаплотипа), t - число поколений до общего предка, ln - натуральный логарифм. Профессиональные кинетики эту формулу знают (см, например, Березин и Клёсов, Практический курс химической и ферментативной кинетики, М., 1976), только ее в ДНК-генеалогии до недавнего времени никто не применял.


А можно ли применять? - спросит придирчивый читатель. И мы покажем, что можно. Для этого нужно взять гаплотипы, для которых время обшего предка известно, и проверить формулу на практике.


Семейство Мак-Доналдов, таблица Чандлера и деревья гаплотипов

Есть такие гаплотипы, для которых время общего предка известно. Это, например, обширное семейство Мак-Доналдов, предок которых, Джон Лорд Островов (John Lord of the Isles), умер в 1386 году, и для которых на сегодняшний день известны 102 гаплотипов семейства, а именно мужчин. Принимая те же 25 лет на поколение, можно предположить, что Джон жил 26 поколений назад. Посмотрим, что нам дадут гаплотипы.

Этот вопрос рассматривать тем более полезно, что автор настоящей статьи повторял эти расчеты несколько раз за последние два года, в ходе расширения списка гаплотипов Мак-Доналдов от 69 до 113. Иначе говоря, можно проследить, насколько размер выборки и принципы ее формирования вляют на конечный результат, на датировку общего предка.

В качестве «точки опоры» возьмем известную таблицу скоростей мутаций для 37 маркеров, которые используются в ДНК-генеалогии. Сейчас уже в ходу 67-маркерные гаплотипы, так что таблица неполная. Тем не менее это лучшее, что продолжает оставаться в профессиональной научной литературе, и принято научной общественностью в виде хотя и не конечной истины, но хорошего приближения. Автор таблицы - Джон Чандлер (Chandler, 2006) - проанализировал тысячи гаплотипов и сопоставил частоту мутаций каждого из внесенных в таблицу 37 маркеров. Здесь первая колонка - первые 12 маркеров, вторая - последующие 13 маркеров, третья - последующие 12 маркеров, чтобы завершить 37-маркерные гаплотипы. Все цифры - это скорости мутаций на маркер на поколение. Выделенные цифры - номера маркеров:


393
0.00076
458
0.00814
460
0.00402
390
0.00311
459a
0.00132
GATA0.00208
19
0.00151
459b
0.00132
YCAa0.00123
391
0.00265
455
0.00016
YCAb0.00123
385a
0.00226
454
0.00016
456
0.00735
385b
0.00226
447
0.00264
607
0.00411
426
0.00009
437
0.00099
576
0.01022
388
0.00022
448
0.00135
570
0.00790
439
0.00477
449
0.00838
CDYa0.03531
389i
0.00186
464a
0.00566
CDYb0.03531
392
0.00052
464b
0.00566
442
0.00324
389ii
0.00242
464c
0.00566
438
0.00055


464d
0.00566



Поскольку скорости отдельных маркеров складываются (мутации принимаются независимыми, и в целом так оно и есть, за несколькими исключениями), то для первых 6 маркеров средняя скорость мутации получится 0.00880±0.00015, для первых 12 маркеров средняя скорость мутации получится 0.022±0.004, для первых 25 маркеров - 0.070±0.011, и для всех 37 маркеров - 0.18±0.03 мутаций на гаплотип на поколение. Погрешности взяты из работы, в которой были опубликованы значения маркеров (Chandler, 2006).

Если эти величины перевести в значения скоростей мутаций (или констант скоростей мутаций, они же частоты мутаций), то для 6- и 12-маркерных гаплотипов получим таблицу:




Гаплотип в
формате FTDNA
Средняя величина
константы скорости
мутации на поколение
(25 лет по условиям
калибровки)
Примечания
На
На маркер
393-390-19-391-X-X-
X-388-X-X-392-X
0.0088
0.00147
6-маркерный
гаплотип в «старом
научном» формате:
19-388-390-391-392-
393

393-390-19-391-
385a-385b-426-388-
1          2
439-389 -392-389
0.022
0.00183
12-маркерный
гаплотип в формате
FTDNA



Это - лишь частный вариант общей таблицы скоростей мутаций, в которой приведены данные для 23 вариантов гаплотипов в различных форматах, и которую мы приведем позже. Причина в том, что только две первые строки, составленные из данных Чандлера - для так называемой первой панели маркеров (от 1-го до 12-го) разумно описывают реальные системы. Во второй и третьей панели (12-25 и 26-37 маркерных фрагментах гаплотипов) мутации в ряде локусов, или сайтов (тандемов, повторяющихся прогонов ДНК) происходят сложным образом. Некоторые сайты оказываются как бы сцепленными друг с другом, и мутации в них не являются независимыми (нумерацию этих сайтов обычно сопровождают буквами, как показано в таблице скоростей мутаций отдельных маркеров выше). В итоге количество мутаций, рассчитанное по этим сайтам в отдельности, оказывается порой сильно завышенным.

Это фактически парализовало работу по использованию мутаций в гаплотипах для проведения временных оценок в масштабах исторических событий. Дискуссии, какие скорости мутаций использовать и как их адаптировать к расчетам в режимах реального времени продолжаются до сих пор, и проблема казалось нерешаемой. Для «академических ученых» проблема до сих пор не решена. Нет даже минимального консенсуса. Поэтому редкие расчеты в академической науке ведутся на страх и риск авторов, а еще чаще вообще не проводятся, в ожидании того, что проблема как-то рассосется. К сожалению, академическая наука в последние годы приняла для расчетов «коэффициент Животовского» (см. первую статью в данном выпуске Вестника), который приводит к огромным ошибкам в расчетах.
Проблема была в значительной степени решена, когда к скоростям мутации гаплотипов автором были применены подходы физической химии (химической кинетики) и соответствующих принципов математической статистики, и полученные данные выверены на известных генеалогиях (с соответствующим определением гаплотипов) и известных исторических событиях. Были сопоставлены скорости мутаций по их накоплению, и по одновременному уменьшению числа немутированных гаплотипов, были применены графические деревья гаплотипов с соответствующим разделением генеалогических ветвей, в каждой из которых была своя картина мутаций, были введены принципы симметрии мутаций и количественный учет симметрии, количественный учет возвратных мутаций, а также - что немаловажно - количественный расчет доверительных интервалов получаемых времен жизни общего предка, что позволило давать реалистическую картину получаемых датировок. Эти принципы изложены в двух объемных статьях (Klyosov, 2009a, 2009b), и в серии статей в Вестнике Российской Академии ДНК-генеалогии (2008, 2009, в соавторстве с Д. Адамовым) и лишь в сокращенном виде изложены здесь на конкретных примерах, избегая сложных математических рассмотрений. Полностью эти выкладки приведены в работах (Адамов и Клёсов, 2008а, b; 2009a,b,c,d).


Первый наглядный пример и есть серия гаплотипов семейства Мак-Доналдов.

Полтора года назад их было в списке 68 человек, и, соответственно, 68 гаплотипов. Из них 53 шестимаркерных базовых, то есть идентичных друг  другу:

15-12-25-11-11-13

и на остальные 6-маркерные приходилось 17 одношаговых мутаций. Посмотрим, сколько поколений от общего предка должно было пройти, чтобы из 68 гаплотипов осталось «нетронутыми», то есть немутированными 53, и чтобы во всех 68 набежало 17 мутаций. Применим средние скорости мутаций для 6-маркерных гаплотипов, рассчитанных по таблице Чандлера:

ln(68/53)/0.0088 = 28±5 поколений

17/68/0.0088 = 28±7 поколений


Как мы помним, генеалогическое дерево Мак-Доналдов уходит вглубь на 26 поколений (650 лет), точнее, на 623 года назад до смерти отца-основателя. Видно, что лучшего совпадения, учитывая погрешность расчетов, желать трудно. Погрешности здесь рассчитывались, исходя из числа немутированных гаплотипов (53) в первой формуле, и из числа мутаций (17) во второй, как обратный квадратный корень из их величин, как было объяснено выше (Адамов и Клёсов, 2009с; Klyosov, 2009а).

Дерево 6-маркерных гаплотипов Мак-Доналдов показано на рис. 1. В нем, как и во всех деревьях гаплотипов, по кругу расположены базовые гаплотипы рассматриваемой серии, то есть идентичные друг другу, и, как правило, соответствующие предковому гаплотипу, общему для всей серии гаплотипов. Это в том случае, если предок действительно был один для всей серии. Как мы позже увидим, нередко базовый гаплотип относится всего лишь к части серии гаплотипов, а остальные сильно мутированы. Вот тогда и наблюдается дисбаланс между числом базовых гаплотипов, и числом мутаций в серии. Этот дисбаланс выявляется сопоставлением числа базовых гаплотипов и числа мутаций в серии, с использованием логарифмического и «линейного» подхода, как обсуждалось выше.

Чем больше мутаций в гаплотипе, тем дальше он удален от «ствола» дерева, то есть от базовых гаплотипов. Мутации графически располагаются по уровням. Каждый уровень - одна дополнительная мутация. Из рис. 1 видно, как на дереве формируются ветви, хотя все они в данном случае происходят от одного общего предка, жившего 26 поколений назад.





При рассмотрении 68 12-маркерных гаплотипов оказалось, что среди них 42 базовых гаплотипа

13 25 15 11 11 14 12 12 10 14 11 31

и 44 мутации


Это дает ln(68/42)/0.022 = 22±4 поколения до общего предка, если считать по базовым гаплотипам, и

44/68/0.022 = 29±5 поколений, если считать по мутациям.

Как видно, совпадение опять вполне приемлемое при расчете обоими способами.

На самом деле точность и воспроизводимость расчетов в ДНК-генеалогии зачастую поражает, принимая во внимание неупорядоченную природу мутаций и их чистую случайность. Более того, расчеты довольно чувствительны к числу мутаций и числу немутированных гаплотипов в серии. Ведь если в рассмотренном примере в серии оказалось бы не 42, а 41 базовых гаплотипов, что более чем вероятно - проскочила одна лишняя мутация - и одним базовым гаплотипом меньше, то ln(68/41)/0.022 = 23, то есть одним поколением больше. Этот пример показывает, что мутации в гаплотипах довольно точно придерживаются системы.

Дерево 12-маркерных гаплотипов показано на рис. 2. Видно, что оно начинает усложняться по сравнению с 6-маркерным. Число немутированных (базовых) гаплотипов по понятным причинам начинает уменьшаться, число мутаций расти.




А вот с 25-маркерными и 37-маркерными гаплотипами Мак-Доналдов таблица Чандлера дала сбой. Оказалось, что она включает на второй и третьей панели «сцепленные» маркеры, как DYS464a,b,c,d, и быстрые (см. таблицу Чандлера выше), которые «тянут одеяло» на себя, сводя к минимуму вклад большинства других маркеоров. Оказалось, что кажущиеся константы скоростей для 25-маркерных и 37-маркерных гаплотипов, полученные из таблицы Чандлера и приведенные выше, занижают времена жизни общих предков в полтора и два раза, соответственно, причем не только Мак-Доналдов, но и по любым сериям гаплотипов. В результате, после многих расчетов по многим сериям гаплотипов были приняты величины констант скоростей мутаций, приведенные в Таблице 1 для гаплотипов в 30 форматах, используемых в литературе.






25-маркерных гаплотипов в списке Мак-Доналдов было 60, и дерево их
гаплотипов приведено на рис. 3. Дело в том, что восемь человек
ограничились при тестировании 12-маркерными гаплотипами. Видно, что
дерево продолжает усложняться, и в нем осталось только 18 базовых, и
имеется 69 мутаций. Это дает ln(60/18)/0.046 = 26±4 поколений до общего предка по числу базовых гаплотипов, и 69/60/0.046 = 25±4 поколений по числу мутаций.

Совпадение почти идеальное – и логарифмического метода с линейным, и
с ожидаемым числом поколений до общего предка Мак-Доналдов. Базовый
(предковый) 25-маркерный гаплотип Мак-Доналдов имеет вид:

13 25 15 11 11 14 12 12 10 14 11 31 16 8 10 11 11 23 14 20 31 12 15 15 16



Дерево 37-маркерных гаплотипов Мак-Доналдов приведено на рис. 4. Совершенно наглядная картина усложнения дерева при переходе к столь протяженным гаплотипам. Базовых гаплотипов не осталось, слишком высока вероятность, что они не выживут без мутаций на протяжении 26-ти поколений от общего предка. Точнее, остался один базовый гаплотип (номер 001 на дереве), но от него для расчетов пользы мало. Поэтому в данном случае базовый гаплотип определяется как тот, от которого ко всем остальным имеется наименьшее количество мутаций. Иначе говоря, он центровой, эквидистанционный в серии гаплотипов. Это понятно, поскольку от него и шли все мутации в гаплотипах потомков. Базовый 37-маркерный гаплотип выглядит так:

13 25 15 11 11 14 12 12 10 14 11 31 -- 16 8 10 11 11 23 14 20 31 12 15 15 16 - 11 12 19 21 17 16 17 18 34 38 12 11



Здесь пунктирными линиями отделены панели гаплотипов - первая (1-12 маркеры), вторая (13-25 маркеры) и третья (26-37 маркеры). «Сцепленные» аллели 19-21 выделены (они имеют порядковые номера 28 и 29, если считать слева направо), это - характерные аллели для семейства Доналдов, отличающие из от гаплотипов практически всего мира. Речь об этом пойдет ниже, а сейчас заметим, что аллели - это повторяющиеся нуклеотидные прогоны в соответствующих участках ДНК, называемых «маркерами», или «локусами».



У Доналдов это прогоны повторены подряд 19 и 21 раз, соответственно. У восточных славян, например (той же гаплогруппы R1a1) они обычно повторяются 19 и 23 раза, соответственно. К этому мы еще вернемся.

На все 59 гаплотипов имеются 178 мутаций. Это дает 178/59/0.09 = 34 поколения до общего предка. Иначе говоря, с мутациями на этом дереве перебор. Рассмотрение мутаций сразу выявляет причину этого перебора. Всего один маркер из 37 дал пятую часть всех мутаций, а именно 36. Это -маркер CDYb, который в таблице Чандлера выше действительно зашкаливает по мутациям наряду с его близнецом CDYa, с которым они еще и сцеплены. Если его снять, то получится 142/59/0.09 = 27±3 поколения до общего предка, что вполне приемлемо.

Этот пример показывает, что 37-маркерные гаплотипы могут давать сбои (но не всегда, хотя никогда заранее неизвестно, будет перебор с мутациями или нет), поэтому в равных ситуациях для расчетов предпочтительны 25-маркерные гаплотипы. Хотя часто 25-маркерные и 37-маркерные гаплотипы в сериях дают практически идентичные результаты. Это, конечно, наилучшее доказательство, что расчет верный.

Наконец, на рис. 5 приведено дерево 67-маркерных гаплотипов Мак-Доналдов. В нем - 98 мутаций на все 26 гаплотипов, что дает 98/26/0.145 = 26±4 поколений до общего предка. Опять замечательная сходимость с результатами других расчетов и с данными «классической» генеалогии.

Эти примеры показывают, что расчеты как по базовым гаплотипам, так и по мутациям дают воспроизводимые данные, и это показано уже на десятках серий гаплотипов самых разных гаплогрупп. Прежние сомнения, что скорость мутации может на самом деле меняться при переходе к древним сериям гаплотипов (то есть происходящих от древних предков, тысячи и десятки тысяч лет назад) были развеяны недавней работой (Sun et al, 2009), выполненной совместным коллективом Гарвардского университета и Массачуссетского технологического института, согласно которой маркеры в гаплотипах представляют собой точные «молекулярные часы» с постоянной средней скоростью мутаций на протяжении как минимум 2 миллиона лет. Это было показано сопоставлением почти тысячи маркеров в человеческих популяциях по всему миру и сотен маркеров в шимпанзе, наряду с анализом нуклеотидных последовательной всего генома. В этой же работе было показано, что наиболее древние популяции человечества - это популяции африканских племен Сан, пигмеев Биака и пигмеев Мбути, и что африканские популяции отделены генным «разрывом» от неафриканских популяций человека. Это, пожалуй, наиболее убедительная работа, свидетельствующая об Африке как прародине современного человека, наших современников.


Возвращаемся к семейству Мак-Доналдов.

К концу прошлого, 2008 года, в списке Мак-Доналдов было уже 84 человека (25-маркерное дерево гаплотипов приведено на рис. 6).

В этой, новой серии гаплотипов -


12-маркерные гаплотипы - 52 базовых (из 84), 44 мутации 25-маркерные гаплотипы - 21 базовый (из 84), 109 мутаций

Базовые гаплотипы были, естественно, теми же. Это дало:

12 - маркерные гаплотипы:
ln(84/52)/0.022 = 22±4 поколений до общего предка, и 44/84/0.022 = 24±4 поколения,

25 - маркерные гаплотипы:
ln(84/21)/0.046 = 30±7 поколений до общего предка, и 109/84/0.046 = 28±4 поколений


В среднем эти средние значения дают 26±4 поколения до общего предка Мак-Доналдов. Как видно, увеличение выборки от 68 до 84 приводит к тому же результату.


В середине 2009 года число гаплотипов в серии возросло до 102, но при этом был расширен круг членов «семейства». Были введены те, кто ведет свой род не от Джона Лорда островов, а от его предка, Сомерледа, который по легендам жил в 12-м веке. Число мутаций в гаплотипах серии сразу резко увеличилось.

102 гаплотипа Мак-Доналдов в 25-маркерном формате содержат 156 мутаций, что дает 156/102/0.046 = 33 поколения, то есть 825±110 лет до общего предка. Это - граничный период времени, когда надо вводить поправку на возвратные мутации, что увеличивает полученную величину до 34 поколений до общего предка, то есть 850±110 лет назад. Это - 12-й век (плюс-минус столетие) до нашей эры. Действительно, времена Сомерледа. Иначе говоря, введенные в список гаплотипы вели свою линию действительно от Сомерледа (или от его современника), что и привело к уходу времени жизни общего предка всех 102 гаплотипов в более древние времена, в 12-й век. Как видно, результаты расчетов весьма чувствительны к времени жизни общих предков.

Наконец, в декабре 2009 года число гаплотипов МакДоналда возросло до 113, и число мутаций в 25-маркерных гаплотипах стало 170. Это помещает общего предка всей выборки на те же 170/113/25/0.00183 = 33 поколения (без поправки на возвратные мутации), или на 34 поколения (с поправкой). Как было только что отмечено выше, это 12-й век. Действительно, согласно средневековым хроникам, Сомерлед, гэло-норвежский полководец, основатель и первый правитель королевства Островов на Гебридах и западном побережье Шотландии, правил в 1156-1164 гг. Совпадение практически абсолютное.

Собственно, показать это - и была цель данного раздела. Читателю теперь должно быть ясно, что расчеты времен жизни общего предка - это не какая-то забава, это - операция, которая основана на прочном фундаменте, и которая позволяет достаточно надежно расчитывать абсолютные времена начала генеалогических линий. А это, в свою очередь, связано с определенными историческими событиями - миграциями народов, войнами, природными катаклизмами, переседениями предков на новые места.

Это - порой бесценная информация для археологии, антропологии, истории, лингвистики.

В выпусках Вестника это уже рассмотрено на десятках конкретных примерах. Но чтобы поместить данные о семействе Мас-Доналдов в определенный, более широкий исторический контекст, и проиллюстрировать еще одну особенность ДНК-генеалогии в этой, постановочной главе, рассмотрим, с какой популяцией сопряжены Мак-Доналды на общем дереве гаплотипов гаплогруппы R1a1 (рис. 7). На нем -около девятисот 25-маркерных гаплотипов Европы и Азии (на дереве есть немало гаплотипов США и Канады, в тех случаях, когда в базе данных были приведены места жительства наиболее удаленных предков «классической генеалогии), известных носителю гаплотипа; во всех случаях это была Европа или Азия).

На этом дереве можно выявить 14 отдельных ветвей гаплотипов, каждая со своим общим предком. Одна из этих ветвей имеет сочетание аллелей (то есть числа повторов нуклеотидных прогонов в маркерах, как отмечалось выше), характерное для семейства Мак-Доналдов. «Сцепленные» маркеры под номерами 28 и 29, если считать слева направо в базовых гаплотипах ветвей гаплогруппы R1a1, обычно имеют аллели 19-23 (эти маркеры имеют индексы YCAII a и b), а у всех до одного членов семейства Доналдов, для которых был проведен анализ ДНК, там 19-21. Поэтому на дереве гаплотипов образовалась отдельная ветвь для всех 19-21, и тех, кто от них немного мутировал, но сохранил общую структуру гаплотипа.



Таких оказалось 105 67-маркерных гаплотипов, то есть в формате гаплотипов наивысшего доступного разрешения. 65 из них представлены семейством Мак-Доналдов (помечены буквами mc на дереве гаплотипов на рис. 8), остальные - обычными номерами. На дерево 25-маркерных гаплотипов (рис. 7) они не нанесены, чтобы не усложнять его еще больше.



Видно, что дерево состоит из двух частей - слева более старые гаплотипы, числом 36; справа и в верхней части - более молодые, числом 69, почти исключительно гаплотипы «клана Доналда». Среди них - только четыре гаплотипа, которые не занесены в таблицу «клана». Гаплотипы «клана Доналда» в левой широкой ветви полностью отсутствуют.

Все 36 гаплотипов старой, левой ветви содержат 152 мутации от следующего базового гаплотипа


13 25 15 11 11 14 12 12 10 13 11 30 -- 15 9 10 11 11 23 14 20 32 12 15 15 16

что дает 2550±330 лет до общего предка ветви. Это - середина первого тысячелетия до н.э. Как показало более детальное исследование (Рожанский и Клёсов, 2009), этот предок жил на Русской равнине, если следовать данным археологии и древним скандинавским сказаниям. В свою очередь, этот предок на Русской равнине продолжил род более древнего общего предка, который жил примерно 4400 лет назад, и который имел почти исключительно пару 19,23 в маркерах YCAII. Где жил этот древний предок - пока неизвестно, но предположительно он принадлежал археологической культуре шнуровой керамики в Центральной Европе. Там были обнаружены останки носителей R1a1 давности 4600 лет назад (Eulau в Германии, см. Haak et al, 2009), и оттуда предположительно было направление миграции R1a1 примерно 5-6 тысяч лет назад, которое заложило ямную, срубную и андроновскую культуру при движении на восток. В середине 1-го тысячелетия н.э., в ходе Великого переселения народов, было обратное движение R1a1 на запад, в Центральную Европу и в Скандинавию. Вполне вероятно, что пара 19,21 в маркерах YCAII образовалась на Русской равнине и принесена в Скандинавию, оттуда - на Британские острова. Среди современных носителей R1a1 на Русской равнине этой пары 19,21 пока не обнаружено. Возможно, в те времена ее имели единичные носители, которые и перешли в Скандинавию. Или остальные носители и/или их потомки не выжили.

Вторая, более «молодая» половина дерева гаплотипов на рис. 8, включающая почти исключительно «клан Доналда», имеет 100 мутаций на 69 гаплотипов, что дает 825±120 лет до общего предка с гаплотипом

13 25 15 11 11 14 12 12 10 14 11 31 -- 16 8 10 11 11 23 14 20 31 12 15 15 16

Это - практически абсолютное совпадение со временем жизни общего предка 850±110 лет назад, но рассчитанное по 102 и 113 25-маркерным гаплотипам (см. выше). Этот гаплотип происходит непосредственно от скандинавской популяции возрастом 1700±220 лет, предположительно пришедший в Скандинавию в ходе Великого переселения народов, в середине первого тысячеления нашей эры:

13 25 15 11 11 14 12 12 10 14 11 31 -- 15 9 10 11 11 23 14 20 32 12 15 15 16

Первые 12 маркеров у них вообще идентичны (отмечены мутации во второй панели маркеров). На самом деле там не три мутации, а 2.2 (0.70+0.76+0.78), что и дает указанную разницу в «возрасте» общих предков.

Итак, выстраивается следующая картина. Исходный общий предок рассматриваемой серии скандинавских гаплотипов жил примерно 4400 лет назад, предположительно в Европе, в регионе культуры шнуровой керамики. Его прямые потомки продвинулись на восток, на Русскую равнину («Великий Свитьод» в скандинавских легендах и сагах), и 2550±330 лет назад, в середине первого тысячелетия до н.э. у его потомков на Русской равнине, или в ходе миграции на запад появилась мутация в YCAII c переходом от 19,23 в 19,21, возможно, через промежуточную форму 19,22, которая не получила развития. В середине 1-го тысячелетия н.э., в ходе Великого переселения народов, мигрантами R1a1 в Скандинавию было дано начало ДНК-генеалогической линии, продолжающей мутацию 19,21. Потомками этой линии были Сомерлед и Джон, Лорд Островов, которые дали начало знаменитому «клану Доналда» с его боевой историей, описанной во многих книгах и исторических документах.

Этот довольно подробный пример, как и весь раздел, дается с единственной целью - показать, что расчеты по гаплотипам имеют надежную основу, и позволяют проводить исторические реконструкции, как правило, не сами по себе, а в совокупности с независимыми данными. При этом независимые данные (история, археология, лингвистика) или подтверждаются, что придает им дополнительное обоснование и весомость, или не подтверждаются, что делает рассмотрение еще более интересным и важным. Вот именно там, в узлах противоречий, и ожидают нас интересные открытия.


Литература


Адамов Д.С., Клёсов А.А. (2008а) Определение возраста популяций по Y-хромосоме методами средних квадратичных отклонений. Вестник Российской Академии ДНК-генеалогии (ISSN 1942-7484). т. 1, № 5, 855 - 907.

Адамов Д.С., Клёсов А.А. (2008b) Теоретическая и практическая оценка возвратных мутаций в гаплотипах Y-хромосомы. Вестник Российской
Академии ДНК-генеалогии (ISSN 1942-7484). т. 1, № 4, 631 - 645.

Адамов Д.С., Клёсов А.А. (2009а) Определение возраста популяций по STR гаплотипам Y-хромосомы. Часть 1. Общая модель. Вестник Российской
Академии ДНК-генеалогии (ISSN 1942-7484). т. 2, № 1, 81 - 92.


Адамов Д.С., Клёсов А.А. (2009b) Определение возраста популяций по STR гаплотипам  Y-хромосомы.   Часть  2.   Погрешности  расчетов. Вестник
Российской Академии ДНК-генеалогии (ISSN 1942-7484). т. 2, № 1, 93 - 103.

Адамов Д.С., Клёсов А.А. (2009c) Определение возраста популяций по STR гаплотипам Y-хромосомы. Часть 3. Примеры «линейных» и «квадратичных» моделей с учетом степени асимметрии мутаций. Вестник
Российской Академии ДНК-генеалогии (ISSN 1942-7484). т. 2, № 2, 187 - 199.

Адамов Д.С., Клёсов А.А. (2009d) Практические методы определения возраста   больших   выборок   STR   гаплотипов   Y-хромосомы. Вестник
Российской Академии ДНК-генеалогии (ISSN 1942-7484). т. 2, № 3, 422 - 442.

Клёсов, A.A. (2008a) Основные положения ДНК-генеалогии (хромосома Y), скорости мутаций, их калибровка и примеры расчетов. Вестник Российской
Академии ДНК-генеалогии (ISSN 1942-7484). т. 1, №2, 252 - 348.

Клёсов А.А. (2008b) Откуда появились славяне и «индоевропейцы» и где их прародина? Ответ дает ДНК-генеалогия. "Вестник Российской Академии ДНК-генеалогии", т. 1, № 3, 400 - 477.

Клёсов А.А. (2008c) Руководство к расчету времен до общего предка гаплотипов   Y-хромосомы   и   таблица   возвратных   мутаций. Вестник
Российской Академии ДНК-генеалогии (ISSN 1942-7484), т. 1, №5, 812 - 835.

Клёсов, A.A. (2008d) Гаплотипы группы R^1 на пост-советском пространстве. Вестник Российской Академии ДНК-генеалогии (ISSN 1942­7484). т. 1, №5, 947 - 957.

Клёсов, А.А. (2008e) Загадки «западноевропейской» гаплогруппы R1b. Вестник Российской Академии ДНК-генеалогии (ISSN 1942-7484), т. 1, №4,
568 - 629.

Клёсов, A.A. (2009a) Гаплотипы «африканской» гаплогруппы А. Вестник
Российской Академии ДНК-генеалогии (ISSN 1942-7484). т. 2, №5, 896 - 899.

Клёсов, A.A. (2009b) Гаплотипы «африканской» гаплогруппы B. Вестник
Российской Академии ДНК-генеалогии (ISSN 1942-7484). т. 2, №5, 900 - 901.

Клёсов А.А. (2009c) Гаплогруппа J2 в Индии и России. Возраст предков. Вестник Российской Академии ДНК-генеалогии (ISSN 1942-7484). т. 2, №5,
842 - 854.


Клёсов А.А. (2009d) Древнейшие восточно-азиатские ветви гаплогруппы R1a. Вестник Российской Академии ДНК-генеалогии (ISSN 1942-7484). т. 2,
№5, 879 - 890.

Клёсов А.А. (2009e) Расчет времени жизни общих предков гаплогруппы R2 в Индии. Вестник Российской Академии ДНК-генеалогии. т. 2, № 5, 891 - 895.

Клёсов А.А. (2009f) О неправомерном отнесении сибирских гаплотипов R1a1 к представителям курганной археологической культуры (обсуждение статьи Keyser et al, Hum Genet., 2009). Вестник Российской Академии ДНК-
генеалогии (ISSN 1942-7484). т. 2, №5, 871 - 878.

Рожанский, И., Клёсов А. (2009) Гаплогруппа R1a1: гаплотипы, генеалогические   линии,    история,    география.    Вестник Российской
Академии ДНК-генеалогии (ISSN 1942-7484). т. 2, №6, 974-1099.

Adams, S.M., Bosch, E., Balaresque, P.L., Ballereau, S.J., Lee, A.C., Arroyo, E., Lopez-Parra, A.M., Aler,M., Gisbert Grifo,M.S., Brion,M., et al. (2008) The Genetic Legacy of Religious Diversity and Intolerance: Paternal Lineages of Christians, Jews, and Muslims in the Iberian Peninsula. Amer. J. Hum. Genet, 83,
725 - 736.

Battaglia, V. et al. (2008) Y-chromosomal evidence of the cultural diffusion of agriculture in southeast Europe. European Journal of Human Genetics advance online publication 24 December 2008.

Behar, D.M., Thomas, M.G., Skorecki, K., Hammer, M.F., Bulygina, E., Rosengarten, D., Jones, A.L., Held, K., Moses, V., Goldstein, D., Bradman, N and Weale, M.E. (2003) Multiple origins of Ashkenazi Levites: Y chromosome evidence for both Near Eastern and European ancestries. Am. J. Hum. Genet. 73,
768 - 779.

Bittles, A.H., Black, M.L., and Wang, W. (2007) Physical anthropology and
ethnicity in Asia: the transition from anthropology to genome-based studies. J.
Physiol. Anthropol. 26, 77 - 82.


Chandler, JF. (2006) Estimating per-locus mutation rates. J. Genetic Genealogy 2,
27 - 33.

Chiaroni, J., King, R.J., Myres, N.M., Henn, B.M., Ducourneau, A., Mitchell, M.J., Boetsch, G., Sheikha, I., Lin, A.A., Nik-Ahd, M., Ahmad, J., Lattanzi, F., Herrera, R.J., Ibrahim, M.E., Brody, A., Semino, O., Kivisild, T. and Underhill, P.A. (2009)


The emergence of Y-chromosome haplogroup J1e among Arabic-speaking populations. European Journal of Human Genetics advance online publication 14 October 2009; doi: 10.1038/ejhg.2009.166.

Cinnioglu, C., King, R., Kivisild, T., Kalfoglu, E., Atasoy, S., Cavalleri, G., Lillie, A.S., Roseman, C.C., Lin, A.A., Prince, K., Oefner, P.J., Shen, P., Semino, O., Cavalli-Sforza, L.L. and Underhill, P,A. (2004) Excavating Y-chromosome haplotype strata in Anatolia. Hum. Genet. 114, 127 - 148.

Contu, D., Morelli, L., Santoni, F., Foster, J.W., Francalacci, P., Cucca, F. (2008) Y-Chromosome based evidence for pre-neolithic origin of the genetically homogeneous but diverse Sardinian population: inference for association scans.
PLoS ONE, 1, 1 - 8

Cordaux, R., Bentley, G., Aunger, R., Sirajuddin, S.M., Stoneking, M. (2004) Y-STR haplotypes from eight South Indian groups based on five loci. J. Forensic Sci.
49, 1 - 2.

Cruciani, F., La Fratta, R., Trombetta, B., Sabtolamazza, P., Sellitto, D. et al. (2007) Tracing past human male movements in Northern/Eastern Africa and Western Eurasia: new clues from Y-chromosomal haplogroups E-M78 and J-M12. Mol.
Biol. Evol. 24, 1300 - 1311.

Goldstein, D.B., Linares, A.R., Cavalli-Sforza, L.L. and Feldman, M.W. (1995)
Genetic absolute dating based on microsatellites and the origin of modern
humans. Proc. Natl. Acad. Sci. US, 92, 6723 - 6727.

Fornarino, S., Pala, M., Battaglia, V., Maranta, R., Achilli, A., Modiano, G., Torroni, A., Semino, O., Santachiara-Benerecetti, S.A. (2009). Mitochondrial and Y-chromosome diversity of the Tharus (Nepal): a reservoir of genetic variation.
BMC Evolutionary Biology 2009, 9:154.

Haak, W., Brandt, G., de Jong, H.N., Meyer, C., Ganslmeier, R., Heyd, V.,
Hawkesworth, C., Pike, A.W.G., Meller, H., and Alt, K.W. (2008) Ancient DNA,
strontium isotopes, and osteological analyses shed light on social and kinship organization of the later Stone Age. Proc. Natl. Acad. Sci. US 105, 18226 - 18231.

Hammer, M.F., Redd, A.J., Wood, E.T., Bonner, M.R., Jarjabazi, H., Karafet, T., Santachiara-Benerecetti, S., Oppenheim, A., Jobling, M.A., Jenkins, T., et al. (2000) Jewish and Middle Eastern non-Jewish populations share a common pool of Y-chromosome biallelic haplotypes. Proc. Natl. Acad. Sci. US. 97, 6769 - 6774.


Hammer MF, Behar DM, Karafet TM, Mendez FL, Hallmark B, Erez T, Zhivotovsky LA, Rosset S, Skorecki K. (2009) Extended Y chromosome haplotypes resolve multiple and unique lineages of the Jewish Pristhood. Hum.
Genet. 126, 707-717.

Heyer, E., Puymirat, J., Dieltjes, P., Bakker, E., and de Knijff, P. (1997) Estimating Y chromosome specific microsatellite mutation frequencies using deep rooting pedigrees. Human Mol. Genetics 6, 799 - 803.

Jobling, M.A., and Tyler-Smith, C. (1995) Fathers ans sons: the Y chromosome and human evolution. TIG, 11, 449 - 456.

Karafet, T.M., Zegura, S.L., Posukh, O., Osipova, L., Bergen, A., Long, J.,
Goldman, D., Klitz, W., Harihara, S., de Knijff, P., et al. (1999) Ancestral Asian
source(s) of New World Y-chromosome founder haplotypes. Am. J. Hum. Genet.
64, 817 - 831.

Kayser, M., Roewer, L., Hedman, M., Henke, L., Hemke, J., Brauer, S., Kruger, C., Krawczak, M., Nagy, M., Dobosz, T., et al (2000) Characteristics and frequency of germline mutations at microsatellite loci from the human Y chromosome, as revealed by direct observation in father/son pairs. Am. J. Hum. Genet. 66, 1580 -
1588.

King, T.E., Parkin, E.J., Swinfield, G., Cruciani, F., Scozzari, R., Rosa, A., Lim, S.-K., Xue, Y., Tyler-Smith, C., Jobling, M. (2007) Africans in Yorkshire? The deepest-rooting clade of the Y phylogeny within an English genealogy. Eur. J.
Human Genetics, 15, 288 - 293.

Klyosov, A.A. (2009a) DNA Genealogy, mutation rates, and some historical evidences written in Y-chromosome. I. Basic principles and the method. J. Genetic Genealogy, 5, 186-216. http://www.jogg.info/52/files/Klyosov1.pdf

Klyosov, A.A. (2009b) DNA Genealogy, mutation rates, and some historical evidences written in Y-chromosome. II. Walking the map. J. Genetic Genealogy,
5, 217-256.

Klyosov, A.A. (2009c) A comment on the paper: Extended Y chromosome haplotypes resolve multiple and unique lineages of the Jewish Priesthood.
Human Genetics, 126, 719-724.


Mertens, G. (2007) Y-Haplogroup frequencies in the Flemish population. J. Genetic Genealogy 3, 19 - 25.

Mulero, J.J., Chang, C.W., Calandro, L.M., Green, R.L., Li, Y., Johnson, C.L., and Hennessy, L.K. (2006) Development and validation of the AmpFlSTR Yfiler PCR amplification kit: a male specific, single amplification 17 Y-STR multiplex system. J Forensic Sci 51, 64 - 75.

Nebel, A., Filon, D., Weiss, D.A., Weale, M., Faerman, M., Oppenheim, A., and Thomas, M. (2000) High-resolution Y chromosome haplotypes of Israeli and Palestinian Arabs reveal geographic substructure and substantial overlap with haplotypes of Jews. Hum. Genet. 107, 630 - 641.

Nebel, A., Filon, D., Brinkmann, B., Majumder, P.P., Faerman, M., and Oppenheim, A. (2001) The Y chromosome pool of Jews as part of the genetic
landscape of the Middle East. Am. J. Hum. Genet. 69, 1095 - 1112.

Nei, M. (1995) Genetic support for the out-of Africa theory of human evolution.
Proc. Natl. Acad. Sci. US, 92, 6720 - 6722.

Semino, O., Passarino, G., Oefner, P.J., Lin, A.A., Arbuzova, S., Beckman, L.E., De Benedictis, G., Francalacci, P., Kouvatsi, A., Limborska, S., Marcikiae, M., Mika, A., Mika, B., Primorac, D., Santachiara-Benerecetti, A.S., Cavalli-Sforza, L.L., Underhilll, P.A. (2000) The genetic legacy of paleolithic Homo sapiens in extant Europeans: a Y chromosome perspective. Science 290, 1155 - 1159.

Sun, J.X., Millikin, J.C., Patterson, N., Reich, D.E. (2009) Microsatellites are
molecular clocks that supports accurate inferences about history. Mol. Biol. Evol.
26, 1017-1027

Takezaki, N. and Nei, M. (1996) Genetic distances and reconstruction of phylogenic trees from microsatellite DNA. Genetics 144, 389 - 399.

Thanseem, I., Thangaraj, K., Chaubey, G., Singh, V.K., Bhaskar, L.V., Reddy, M.B., Reddy, A.G., Singh, L. (2006) Genetic affinities among the lower castes and tribal groups of India: Inference from Y chromosome and mitochondrial DNA.
BMC Genet. 2006 Aug 7; 7(1):42.

Tofanelli, S., Ferri, G., Bulayeva, K., Caciagli, L., Onofri, V., Taglioli, L., Bulayev, O., Boschi, I., Alu, M., Berti, A., Rapone, C., Beduschi, G., Luiselli, D., Cadenas, A.M., Awadelkarim, K.D., Mariani-Costantini, R.,Elwali, N.E.,Verginelli, F., Pilli, E., Herrera, R.J., Gusmao, L., Paoli, G., Capelli, C. (2009) J1-M267 Y lineage marks climate-driven pre-historical human displacements. Eur. J. Hum. Genetics, 1 - 5.


Underhill, P.A., Shen, P., Lin, A.A., Jin, L., Passarino, G., Yang, W.H., Kauffman, E., Bonne-Tamir, B., Bertranpetit, J., Francalacci, P., et al. (2000) Y chromosome sequence variation and the history of human populations. Nature genetics 26,
358 - 361.

Underhill, P.A., Myres, N.M., Rootsi, S., Metspalu, M., Zhivotovsky, L.A., King, R.J. et al (2009) Separating the post-Glacial coancestry of European and Asian Y chromosomes within haplogroup R1a. Eur. J. Human. Genet., advance online
publication, 4 November 2009, doi: 10.1038/ejhg.2009.194

Walsh, B. (2001) Estimating the time to the most common ancestor for the Y chromosome or mitochondrial DNA for a pair of individuals. Genetics 158, 897 -
912.

Wells, R.S., Yuldasheva, N., Ruzibakiev, R., Underhill, P.A. Evseeva, I., Blue-Smith, L., Jin, L., Su, B., Pitchappan, R., Shanmugalaksmi, S., Balakrishnan, K., Read, M., Pearson, N.M., Zerjal, T., Webster, M.T., Zholoshvili, I., Jamarjashvili, E., Gambarov, S., Nikbin, B., Dostiev, A., Aknazarov, O., Zallous, P., Tsoy, I., Kitaev, M., Mirrakhimov, M., Chariev, A., Bodmer, W.F. (2001) The Eurasian heartland: a continental perspective on Y-chromosome diversity. Proc. Natl.
Acad. Sci. US 98, 10244-10249.

Zalloua, P.A., Xue, Y., Khalife, J., Makhoul, N., Debiane, L., Platt, D.E., Royyuru, A.K., Herrera, R.J., Hernanz, D.F.S., Blue-Smith, J., Wells, R.S., Comas, D.,
Bertranpetit, J., Tyler-Smith et al. Y-Chromosomal diversity in Lebanon is structured by recent historical events. Amer. J. Hum. Genet. 82, 973 - 882 (2008).

Zhivotovsky, L.A., and Feldman, M.W. (1995) Microsatellite variability and
genetic distances. Proc. Natl. Acad. Sci. US, 92, 11549 - 11552.

Zhivotovsky, L.A., Underhill, P.A., Cinnoglu, C., Kayser, M., Morar, B., Kivisild, T., Scozzari, R., Cruciani, F., Destro-Bisol, G., Spedini, G., Chambers, G.K., Herrera, R.J., Yong, K.K., Gresham, D., Tournev, I., Feldman, M.W., and Kalaydjieva, L. (2004) The effective mutation rate at Y chromosome short tandem repeats, with application to human population-divergence time. Am. J. Human
Genet. 74, 50 - 61.