А.Клёсов
Данная работа является развитием исследований (Клёсов, 2008а; Адамов и Клёсов, 2008), в которых обсуждаются причины обратных мутаций в гаплотипах Y-хромосомы, и дается теоретическая и практическая оценка вклада возвратных мутаций в расчеты времен до общих предков выборок гаплотипов.
(например, в 1.5-2 раза и более) - выборка определенно гетерогенна в отношении общих предков, и таблица ниже, как и формулы выше, неприменимы для расчетов времен до общего предка. В таких случаях выборки необходимо разделять, используя дерево гаплотипов (Клёсов,
Данная работа является развитием исследований (Клёсов, 2008а; Адамов и Клёсов, 2008), в которых обсуждаются причины обратных мутаций в гаплотипах Y-хромосомы, и дается теоретическая и практическая оценка вклада возвратных мутаций в расчеты времен до общих предков выборок гаплотипов.
Практика настоятельно требует создания набора простых приемов, которые позволят максимально упростить расчет времен до общего предка. Эти приемы должны включать пять стадий.
Первое - убедиться, что для рассматриваемой выборки гаплотипов есть всего один предок, или соответствующий ему эквивалент. Эквивалентом могут быть братья или другие близкие родственники (что уже находится вне предела разрешения методами ДНК-генеалогии). Суть в том, что определенное количество поколений или лет назад существовал определенный базовый, или предковый гаплотип, от которого началась разветвленная последовательность мутаций, которая и привела к рассматриваемой выборке гаплотипов потомков предка, общего для данной выборки. Для того, чтобы убедиться, что выборка «однородная», то есть происходит от одного общего предка, есть несколько приемов.
Один - это построение дерева гаплотипов, которое должно сходиться к одному гаплотипу. Это и есть базовый, или предковый гаплотип. Иначе говоря, при наличии одного предка для всей выборки - в дереве гаплотипов не должно быть выраженных ветвей, идущих от основания дерева. Базовый гаплотип может быть равен предковому, и присутствовать в выборке, причем порой во множественных копиях, а может быть получен минимизацией мутаций в гаплотипах выборки. В таком случае полученный базовый гаплотип не обязательно идентичен предковому, и может быть всего некоторым приближением. Для другого приема необходимо сравнить времена для общего предка, рассчитанные с применением линейной и логарифмической модели. Здесь линейной моделью называется вариант применения формулы n/N/u = t, где t -время до общего предка в поколениях, n - количество мутаций во всех N гаплотипах выборки, u - средняя скорость (частота) мутаций, выраженная в числе мутаций на гаплотип на поколение. Логарифмическая модель рассматривает не число мутаций, а число базовых гаплотипов в выборке, то есть основывается на принципиально другом рассмотрении выборки гаплотипов. В этом случае необходимо сосчитать число базовых, идентичных гаплотипов в выборке, оценить число поколений до общего предка по формуле ln(N/m)/u = tln, где m -количество базовых (идентичных) гаплотипов в выборке, tln - время до общего предка в поколениях, остальные обозначения приведены выше. Если t = tln (в разумных пределах, например, в пределах 10%), то общий предок один. Если эти две величины значительно различаются
2008).
Другими словами, для однородной выборки, имеющей одного общего предка, число мутаций в гаплотипах должно согласовываться с числом базовых гаплотипов в выборке.
Очень важно, что если критерий наличия одного общего предка для выборки гаплотипов не соблюдается, или просто не расматривался, то таблицы, данные ниже, применять некорректно. Полученный результат с большой вероятностью будет относиться к некоему фантомному общему предку, который на самом деле модет оказаться суперпозицией времен до разных предков, порой разделенных тысячелетиями.
Второе - это сосчитать число мутаций в данной выборке гаплотипов.
Число мутаций следует считать по отношению к базовому гаплотипу, выявленному на первой стадии расчетов (см. выше).
Третье - это рассчитать среднее число мутаций на маркер для всех гаплотипов выборки, имеющей общего предка. Например, если на двадцать 7-маркерных гаплотипов приходится 65 мутаций, то среднее числе мутаций на маркер равно 65/20/7 = 0.464.
Четвертое - это пересчитать среднее число мутаций на условную скорость мутаций, равную 0.00200 мутациям на маркер на поколение. Дело в том, что каждый маркер имеет свою скорость мутаций, и в зависимости от набора маркеров в гаплотипе их средняя скорость мутаций разная. Эти скорости мутаций даны в Таблице 1 для наиболее часто рассматриваемых гаплотипов. Например, для 7-маркерных гаплотипов (продолжая пример выше) средняя скорость мутаций равна не 0.00200, а 0.00186 мутаций на гаплотип на поколение. Поэтому в пересчете на такую среднюю скорость 65 мутаций в двадцати 7-маркерных гаплотипах даст не 0.464 мутаций на маркер, а 0.464х2/1.86 (это - упрощенное 0.464x0.002/0.00186) = 0.499. Это - для условного гаплотипа, имеющего скорость мутаций 0.002 на маркер на поколение.
Пятое - применить Таблицу 2 (см. ниже), которая дает поправку на возвратные мутации. Например, среднему числу мутаций 0.499 на маркер (при скорости мутаций 0.002 на маркер на поколение) соотвествует 331 поколение в таблице 2 ниже, то есть 8275 лет до общего предка для 20 носителей данных гаплотипов.
Без такого пересчета нам пришлось бы давать 11 таблиц по типу Таблицы 2, приведенной ниже, по одной на каждый гаплотип в Таблице 1.
Если ограничиться только линейной моделью, без учета возвратных мутаций, то 65 мутаций в двадцати 7-маркерных гаплотипах дадут всего 65/20/0.013 = 250 поколений до общего предка, вместо 331 поколений (с учетом возвратных мутаций). Вместо 8275 лет до общего предка получится 6250 лет, на две с лишним тысячи лет меньше. Если
применить скорости мутаций не на гаплотип, а на маркер, которые тоже даны в Таблице 1, то получится 65/140/0.00186 = 250 поколений, то есть то же самое, с той же большой ошибкой (без учета возвратных мутаций) , что и при применении скоростей на маркер.
Таблица 2 позволяет вносить вклад возвратных мутаций и в число поколений до общего предка, рассчитанное с помощью простой линейной модели, или с помощью логарифмической модели, в которой тоже не учтены возвратные мутации. Например, находим 250 поколений до общего предка, рассчитанные выше для 65 мутаций в двадцати 7-маркерных гаплотипов (линейная модель, без учета возвратных мутаций), во второй колонке Таблицы 2, и читаем - 331 поколение, или 8275 лет с учетом возвратных мутаций.
Таблица 1
Средние скорости мутаций на гаплотип и маркер, рассчитанные по данным (Chandler, 2006) c модификациями для 25, 37- и 67-маркерных гаплотипов (Клёсов, 2008)
Гаплотипы в
формате FTDNA
Средняя скорость
мутаций
на поколение
Примечания
На гаплотип
|
На маркер
| ||
393-390-19-391-X-X-X-388-X-X-392-X
|
0.0088
|
0.00147
|
6-маркерный гаплотип в «научном» формате:
19-388-390-391-392-393
|
393-390-19-391-X-X-X-
|
0.013
|
0.00186
|
7-маркерный
|
X-X-3891-392-3892
|
гаплотип,
| ||
пропущены маркеры
| |||
385a, 385b, 426, 388,
| |||
439
|
393-390-19-391-385a-
|
0.017
|
0.00189
|
9-маркерный
|
385b-X-Y-Z-3891-392-
|
гаплотип,
| ||
3892
|
пропущены маркеры
426, 388, 439
|
393-390-19-391-X-Y-Z-
|
0.018
|
0.00200
|
9-маркерный
|
388-439-3891-392-3892
|
гаплотип,
| ||
пропущены маркеры
| |||
385a, 385b, 426
|
393-390-19-391-385a-
385b-X-388-Y-3891-392-3892
|
0.018
|
0.00180
|
10-маркерный гаплотип, пропущены маркеры
426, 439
|
393-390-19-391-385a-385b-X-Y-439-3891-
|
0.022
|
0.00220
|
10-маркерный гаплотип,
|
392-3892
|
пропущены маркеры 426, 388
| ||
393-390-19-391-X-Y-
|
0.018
|
0.00180
|
10-маркерный
|
426-388-439-389^392-
|
гаплотип,
| ||
3892
|
пропущены маркеры
385a, 385b
| ||
393-390-19-391-385a-
|
0.022
|
0.00183
|
12-маркерный
|
385b-426-388-439-
|
гаплотип
| ||
3891-392-3892
| |||
393-390-19-391-385a-
|
0.046
|
0.00184
|
25-маркерный
|
385b-426-388-439-
|
гаплотип
| ||
3891-392-3892-458-
| |||
459a-459b-455-454-
| |||
447-437-448-449-464a-
| |||
464b-464c-464d
| |||
Стандартный 37-
|
0.090
|
0.00243
|
37-маркерный
|
маркерный
|
гаплотип
| ||
гаплотип
| |||
Стандартный 67-
|
0.145
|
0.00216
|
67-маркерный
|
маркерный
|
гаплотип
| ||
гаплотип
|