Неделю назад Dienekes Pontikos опубликовал результаты статистического анализа аутосомных SNP-маркёров 871 образцов из 60 популяций Западной Евразии. Полученное деление на кластеры выявило предсказуемую структуру, которая, тем не менее, заслуживает самого пристального внимания.
Для тех, кто не хочет влезать глубоко в детали, сразу приведу структурную диаграмму с русскими, белорусами, поляками, литовцами и финнами, поставленными в один ряд с западными и южными европейцами.
В диаграмме отчётливо выделяются два ключевых компонента, один из которых доминирует у северо-восточных европейцев (оранжевый), второй — у северо-западных (розовый). Оба компонента выявляют связь не только с географическими областями, но и с языковыми семьями: первый строго совпадает со славянскими и балтскими языками, второй — с германскими и кельтскими. Показателен и контекст, в котором эти компоненты встречаются: первые почти идентичны финнам, вторые соседствуют с более пёстрыми по составу южными европейцами: итальянцами, испанцами, португальцами, французами (романские языки).
О чём всё это говорит? Со стороны популяционной генетики получено очередное подтверждение фактам, выявленным антропологами: всё население лесной зоны Северо-Восточной Европы родственно по своему происхождению и на протяжении многих тысяч лет не испытывало кардинальных влияний со стороны. Налицо разительное отличие как от западных, так и от южных европейцев, предки которых пришли в Европу ранними земледельцами и передали лесному населению земледелие в качестве технологии, без серьёзной демографической инфильтрации.
Отдельно, не удивляемся заметному финскому компоненту в серии Russian — она происходит из Вологды; серия Russian_D — средние по палате русские. Могут возникнуть сомнения по части репрезентативности популяций, но они очевидным образом снимаются после взгляда на выборки по народам, в которых отдельные образцы выглядят достаточно равномерными. Такие диаграммы составлены автором для каждой популяции по каждому кластерному анализу. Для русских она выглядит следующим образом.

Теперь доступно и подробно по делению всего исходного материала на кластеры количеством от 3 до 11.
Структурная диаграмма, построенная на основе SNP-маркёров, представляет собой массив исходных данных, где каждый столбец составляет отдельный образец, либо — в данном случае — сгруппированные в популяции средние значения по образцам. Деление на кластеры проводится машинным анализом сходства фрагментов SNP-маркёров при заранее заданном количестве кластеров. Другими словами, схожие последовательности отдельных образцов объединяются в кластеры и обозначаются своими цветами. Такого типа диаграмма однажды уже разбиралась на примере северных европейцев.
Теперь к данным от Dienekes.

Первая диаграмма с тремя кластерами (K=3) отчётливо выделяет три компонента: западно-евразийский, присахарский и восточно-азиатский.
Присахарский компонент доминирует среди населения Северной и Северо-Восточной Африки, в остальном встречается большей частью среди арабов; фиксируется он малыми долями и в Европе: среди испанцев, французов и итальянцев. Восточно-азиатский компонент широко встречается у носителей финно-угорских и тюркских языков. Любопытно здесь то, что почти 40% популяции Indian_D приходится на долю восточно-азиатского компонента, оставляя западно-евразийскому только половину.
В целом, деление на три кластера повторяет распространение трёх расовых комплексов: негроидного, монголоидного и европеоидного.

Диаграмма при K=4 оставляет неизменными присахарский и восточно-азиатский компоненты, затрагивая исключительно западно-евразийский. Последний компонент строго распадается на две части: северо-европейский и западно-азиатский; географическая изменчивость обоих формирует клинальный градиент на всём перечне популяций.
При этом северо-европейский компонент оказывается полностью доминирующим у всех народов Северной Европы от русских и финнов до норвежцев и британцев, охватывая в том числе славяноязычных жителей Балкан (Balkans_D) и французских басков (French_Basque). Западно-азиатский компонент показывает максимум среди жителей Ближнего Востока и Малой Азии, охватывая побережье Средиземного моря: греки, итальянцы, сардинцы. Пространство между двумя очерченными областями образует смешанную зону, где один компонент плавно перетекает во второй: испанцы, французы, румыны, северные итальянцы. При этом у народов северо-востока Европы — финны, русские, литовцы, белорусы — западно-азиатский компонент практически отсутствует.
Ясное выделение в популяциях Западной Евразии западно-азиатского и северо-европейского компонентов также находит близкую аналогию в антропологии, совпадая с ареалами отчётливого проявления южно- и северо-европеоидных признаков.

На диаграмме K=5 присахарский и восточно-азиатский кластеры вновь остаются без изменения, а в двух западно-евразийских выделяется третий компонент: средиземноморский.
Для выяснения происхождения средиземноморского компонента следует понять, кто является его предшественником. Из сравнения K=4 и K=5 нетрудно заметить, что выделение средиземноморского компонента происходит не из какого-то одного — северо-европейского или западно-азиатского, — а одновременно из обоих, однако в разных областях — в различных пропорциях.
Так, среди ближневосточных и северо-африканский популяций (от Ethiopians до North_African_D, область доминирования западно-азиатского компонента при K=4) средиземноморский компонент практически полностью выделяется из западно-азиатского, оставляя долю северо-европейского почти без изменений. Любопытны здесь Индия и Пакистан, где северо-европейский компонент резко уступает западно-азиатскому.
Следующий интервал — от Finnish_D до Tuscan (доминирование северо-европейского компонента при K=4) — выделяет средиземноморский компонент приблизительно поровну из северо-европейского и западно-азиатского.
В оставшемся перечне — от C_Italian_D до Iranian_D (область клинального градиента при K=4) — вновь видно, что средиземноморский компонент замещает собой по большей части западно-евразийский компонент, оставляя долю северо-европейского относительно неизменным. Отдельного внимания заслуживают популяции балканских славян и французских басков, где при K=4 доминировал северо-европейский компонент: в них средиземноморский или не появляется вообще, или выделяется исключительно из западно-азиатского. Средиземноморский компонент вовсе не обнаруживается у сардинцев и марокканцев.
Таким образом, выделившийся при K=5 средиземноморский компонент показывает тесную связь со своим западно-азиатским предшественником. По своему происхождению он повторяет градиент, существующий между двумя западно-евразийскими компонентами при K=4: в зонах смешения и доминирования западно-азиатского выделяясь большей частью из западно-евразийского, и только в области доминирования северо-европейского выделяясь примерно поровну из обоих. Эта тенденция сохраняется вплоть до отдельных исключений из западно-азиатского массива: преимущественно северо-европейских по своей структуре популяций Balkans_D и French_Basque.
Сказанное означает, что полученный при K=5 средиземноморский компонент следует признать ответвлением западно-азиатского компонента (выявленного при K=4). При этом его существование в областях центра и севера Европы является результатом серьёзной и тесной метисации с северо-европейским компонентом.

Диаграмма с K=6 выделяет северо-африканский компонент.
Компонент частично обнаруживается на Ближнем Востоке, в Индии и Пакистане, средиземноморских областях Южной Европы. Подробно на нём можно не останавливаться.

На диаграмме K=7 становится ясно заметен компонент юго-западной Азии (светло-зелёный).
Этот компонент оказывается доминирующей примесью в популяциях Ethiopian и East_African_D. Вместе с западно-азиатским и средиземноморским компонентами он практически полностью формирует структуру ближневосточных популяций (Аравийский полуостров, Сирия, Ливан, иракские евреи), а также ряда сопредельных народов (грузины, армяне, киприоты, ассирийцы, турки, жители Ирана); занимает заметное место в генофонде греков, итальянцев, лезгинов, адыгейцев. В Европе он практически не встречается к северу от Иберийского, Апеннинского и Балканского полуостровов. Любопытно, что этот компонент встречается в Пакистане, но отсутствует в Индии.
Из-за непостоянства цветов у одних и тех же компонентов при различных K, тяжело разобраться, откуда по преимуществу выделяется компонент юго-западной Азии. Тщательное сравнение показывает, что большей частью компонент юго-западной Азии складывается поровну из западно-азиатского и средиземноморского.

Диаграмма при K=8 вносит значительные изменения в картину, наблюдавшуюся на более крупном масштабе.
В первую очередь это изменения в появлении отчётливого южно-азиатского компонента, который доминирует в Индии и Пакистане, частично затрагивает Иран, Узбекистан. Меньшая, но заметная доля по всему Ближнему Востоку и на Кавказе. В остальных регионах этот компонент или полностью отсутствует, или проявляется крайне незначительно.
Важной деталью анализа при K=8 является частичная перекройка распределения трёх компонентов: средиземноморского, западно-азиатского и юго-западно-азиатского. Популяции Северной Африки, Ближнего Востока и Южной Европы здесь по своей структуре обнаруживают заметную преемственность с предыдущей диаграммой, чего нельзя сказать о греках, популяциях Малой Азии и Кавказа (вниз, начиная от Adygei, исключая Balkans_D). Последних теперь полностью объединяет единый доминирующий западно-азиатский компонент, чья доля возросла за счёт поглощения частей средиземноморского и юго-западно-азиатского компонентов. Появление в регионе такой однородности обязано тому факту, что все его популяции несут в себе схожую по своей структуре комбинацию средиземноморского и юго-западно-азиатского компонентов, что отличает их как от носителей более чистого юго-западно-азиатского (Ближний Восток), так и более чистого средиземноморского (Южная Европа) компонентов.
Фактически, значительное упрощение диаграммы при K=8 означает обнаружение более простого способа кластеризации исходного материала. Вместе с этим, диаграмма частично теряет способность наглядно отражать доли каждого из исходных компонентов. Последнее, однако, ничуть не затрагивает те компоненты, чья структура до этого момента оставалась устойчивой и неизменной, а именно: присахарский и восточно-азиатский (появились при K=3), северо-европейский (появился при K=4), северо-африканский (появился при K=6).

Для тех, кто не хочет влезать глубоко в детали, сразу приведу структурную диаграмму с русскими, белорусами, поляками, литовцами и финнами, поставленными в один ряд с западными и южными европейцами.
В диаграмме отчётливо выделяются два ключевых компонента, один из которых доминирует у северо-восточных европейцев (оранжевый), второй — у северо-западных (розовый). Оба компонента выявляют связь не только с географическими областями, но и с языковыми семьями: первый строго совпадает со славянскими и балтскими языками, второй — с германскими и кельтскими. Показателен и контекст, в котором эти компоненты встречаются: первые почти идентичны финнам, вторые соседствуют с более пёстрыми по составу южными европейцами: итальянцами, испанцами, португальцами, французами (романские языки).
О чём всё это говорит? Со стороны популяционной генетики получено очередное подтверждение фактам, выявленным антропологами: всё население лесной зоны Северо-Восточной Европы родственно по своему происхождению и на протяжении многих тысяч лет не испытывало кардинальных влияний со стороны. Налицо разительное отличие как от западных, так и от южных европейцев, предки которых пришли в Европу ранними земледельцами и передали лесному населению земледелие в качестве технологии, без серьёзной демографической инфильтрации.
Отдельно, не удивляемся заметному финскому компоненту в серии Russian — она происходит из Вологды; серия Russian_D — средние по палате русские. Могут возникнуть сомнения по части репрезентативности популяций, но они очевидным образом снимаются после взгляда на выборки по народам, в которых отдельные образцы выглядят достаточно равномерными. Такие диаграммы составлены автором для каждой популяции по каждому кластерному анализу. Для русских она выглядит следующим образом.
Теперь доступно и подробно по делению всего исходного материала на кластеры количеством от 3 до 11.
Структурная диаграмма, построенная на основе SNP-маркёров, представляет собой массив исходных данных, где каждый столбец составляет отдельный образец, либо — в данном случае — сгруппированные в популяции средние значения по образцам. Деление на кластеры проводится машинным анализом сходства фрагментов SNP-маркёров при заранее заданном количестве кластеров. Другими словами, схожие последовательности отдельных образцов объединяются в кластеры и обозначаются своими цветами. Такого типа диаграмма однажды уже разбиралась на примере северных европейцев.
Теперь к данным от Dienekes.

Первая диаграмма с тремя кластерами (K=3) отчётливо выделяет три компонента: западно-евразийский, присахарский и восточно-азиатский.
Присахарский компонент доминирует среди населения Северной и Северо-Восточной Африки, в остальном встречается большей частью среди арабов; фиксируется он малыми долями и в Европе: среди испанцев, французов и итальянцев. Восточно-азиатский компонент широко встречается у носителей финно-угорских и тюркских языков. Любопытно здесь то, что почти 40% популяции Indian_D приходится на долю восточно-азиатского компонента, оставляя западно-евразийскому только половину.
В целом, деление на три кластера повторяет распространение трёх расовых комплексов: негроидного, монголоидного и европеоидного.

Диаграмма при K=4 оставляет неизменными присахарский и восточно-азиатский компоненты, затрагивая исключительно западно-евразийский. Последний компонент строго распадается на две части: северо-европейский и западно-азиатский; географическая изменчивость обоих формирует клинальный градиент на всём перечне популяций.
При этом северо-европейский компонент оказывается полностью доминирующим у всех народов Северной Европы от русских и финнов до норвежцев и британцев, охватывая в том числе славяноязычных жителей Балкан (Balkans_D) и французских басков (French_Basque). Западно-азиатский компонент показывает максимум среди жителей Ближнего Востока и Малой Азии, охватывая побережье Средиземного моря: греки, итальянцы, сардинцы. Пространство между двумя очерченными областями образует смешанную зону, где один компонент плавно перетекает во второй: испанцы, французы, румыны, северные итальянцы. При этом у народов северо-востока Европы — финны, русские, литовцы, белорусы — западно-азиатский компонент практически отсутствует.
Ясное выделение в популяциях Западной Евразии западно-азиатского и северо-европейского компонентов также находит близкую аналогию в антропологии, совпадая с ареалами отчётливого проявления южно- и северо-европеоидных признаков.

На диаграмме K=5 присахарский и восточно-азиатский кластеры вновь остаются без изменения, а в двух западно-евразийских выделяется третий компонент: средиземноморский.
Для выяснения происхождения средиземноморского компонента следует понять, кто является его предшественником. Из сравнения K=4 и K=5 нетрудно заметить, что выделение средиземноморского компонента происходит не из какого-то одного — северо-европейского или западно-азиатского, — а одновременно из обоих, однако в разных областях — в различных пропорциях.
Так, среди ближневосточных и северо-африканский популяций (от Ethiopians до North_African_D, область доминирования западно-азиатского компонента при K=4) средиземноморский компонент практически полностью выделяется из западно-азиатского, оставляя долю северо-европейского почти без изменений. Любопытны здесь Индия и Пакистан, где северо-европейский компонент резко уступает западно-азиатскому.
Следующий интервал — от Finnish_D до Tuscan (доминирование северо-европейского компонента при K=4) — выделяет средиземноморский компонент приблизительно поровну из северо-европейского и западно-азиатского.
В оставшемся перечне — от C_Italian_D до Iranian_D (область клинального градиента при K=4) — вновь видно, что средиземноморский компонент замещает собой по большей части западно-евразийский компонент, оставляя долю северо-европейского относительно неизменным. Отдельного внимания заслуживают популяции балканских славян и французских басков, где при K=4 доминировал северо-европейский компонент: в них средиземноморский или не появляется вообще, или выделяется исключительно из западно-азиатского. Средиземноморский компонент вовсе не обнаруживается у сардинцев и марокканцев.
Таким образом, выделившийся при K=5 средиземноморский компонент показывает тесную связь со своим западно-азиатским предшественником. По своему происхождению он повторяет градиент, существующий между двумя западно-евразийскими компонентами при K=4: в зонах смешения и доминирования западно-азиатского выделяясь большей частью из западно-евразийского, и только в области доминирования северо-европейского выделяясь примерно поровну из обоих. Эта тенденция сохраняется вплоть до отдельных исключений из западно-азиатского массива: преимущественно северо-европейских по своей структуре популяций Balkans_D и French_Basque.
Сказанное означает, что полученный при K=5 средиземноморский компонент следует признать ответвлением западно-азиатского компонента (выявленного при K=4). При этом его существование в областях центра и севера Европы является результатом серьёзной и тесной метисации с северо-европейским компонентом.

Диаграмма с K=6 выделяет северо-африканский компонент.
Компонент частично обнаруживается на Ближнем Востоке, в Индии и Пакистане, средиземноморских областях Южной Европы. Подробно на нём можно не останавливаться.

На диаграмме K=7 становится ясно заметен компонент юго-западной Азии (светло-зелёный).
Этот компонент оказывается доминирующей примесью в популяциях Ethiopian и East_African_D. Вместе с западно-азиатским и средиземноморским компонентами он практически полностью формирует структуру ближневосточных популяций (Аравийский полуостров, Сирия, Ливан, иракские евреи), а также ряда сопредельных народов (грузины, армяне, киприоты, ассирийцы, турки, жители Ирана); занимает заметное место в генофонде греков, итальянцев, лезгинов, адыгейцев. В Европе он практически не встречается к северу от Иберийского, Апеннинского и Балканского полуостровов. Любопытно, что этот компонент встречается в Пакистане, но отсутствует в Индии.
Из-за непостоянства цветов у одних и тех же компонентов при различных K, тяжело разобраться, откуда по преимуществу выделяется компонент юго-западной Азии. Тщательное сравнение показывает, что большей частью компонент юго-западной Азии складывается поровну из западно-азиатского и средиземноморского.

Диаграмма при K=8 вносит значительные изменения в картину, наблюдавшуюся на более крупном масштабе.
В первую очередь это изменения в появлении отчётливого южно-азиатского компонента, который доминирует в Индии и Пакистане, частично затрагивает Иран, Узбекистан. Меньшая, но заметная доля по всему Ближнему Востоку и на Кавказе. В остальных регионах этот компонент или полностью отсутствует, или проявляется крайне незначительно.
Важной деталью анализа при K=8 является частичная перекройка распределения трёх компонентов: средиземноморского, западно-азиатского и юго-западно-азиатского. Популяции Северной Африки, Ближнего Востока и Южной Европы здесь по своей структуре обнаруживают заметную преемственность с предыдущей диаграммой, чего нельзя сказать о греках, популяциях Малой Азии и Кавказа (вниз, начиная от Adygei, исключая Balkans_D). Последних теперь полностью объединяет единый доминирующий западно-азиатский компонент, чья доля возросла за счёт поглощения частей средиземноморского и юго-западно-азиатского компонентов. Появление в регионе такой однородности обязано тому факту, что все его популяции несут в себе схожую по своей структуре комбинацию средиземноморского и юго-западно-азиатского компонентов, что отличает их как от носителей более чистого юго-западно-азиатского (Ближний Восток), так и более чистого средиземноморского (Южная Европа) компонентов.
Фактически, значительное упрощение диаграммы при K=8 означает обнаружение более простого способа кластеризации исходного материала. Вместе с этим, диаграмма частично теряет способность наглядно отражать доли каждого из исходных компонентов. Последнее, однако, ничуть не затрагивает те компоненты, чья структура до этого момента оставалась устойчивой и неизменной, а именно: присахарский и восточно-азиатский (появились при K=3), северо-европейский (появился при K=4), северо-африканский (появился при K=6).

| Если с путаницей в цветах у отдельных компонентов до этого момента можно было жить, то при K=9 разбираться в ней становится невыносимо. После тщательного сравнения этой диаграммы с предыдущей можно выявить, что светло-оранжевый (южно-азиатский) компонент стал синим, а светло-голубой (средиземноморский) разделился на два: зелёный (условно-баски) и красный (условно-сардинцы). Поскольку доли южно-азиатского и северо-европейского (оранжевый) компонентов остались неизменными по всем популяциям, то появляется возможность проследить критерий разделения средиземноморцев. Видно, что граница проходит между двумя отчётливыми полюсами:атлантическим и восточно-средиземноморским, поскольку первый практически не встречается в восточной части региона (Малая Азия, Ближний Восток, Балканы, Кавказ, запад Азии, везде доминирует красный), а второй — в западной (всё атлантическое побережье от Испании до Норвегии). При этом в Италии в значительной мере встречаются оба, но доминирует восточно-средиземноморский красный. ![]() Диаграмма при K=10 интересна тем, что на ней впервые проявляется различие между северо-восточными европейцами: русскими, белорусами, литовцами и поляками — с одной стороны; немцами, скандинавами, британцами и другими северо-западными европейцами— с другой. Однако, характер изменений по сравнению с K=9, а именно — сохранение структуры северо-восточных народов, которое особенно наглядно проявляется у литовцев и чувашей, даёт серьёзные основания предполагать, что признаком северо-западных европейцев выступает не единый исходный компонент, а свойственная для них общая по своей структуре комбинация компонентов. Другими словами, различие между северо-западными и северо-восточными европейцами реально существует, но причины различия не одинаковы: у первых — это доминирование общего очень древнего компонента, у вторых — сложившаяся на определённом этапе характерная структура генофонда. За пределами северо-европейских популяций любопытно распространение характерных для них признаков среди других народов. Так, соотношение северо-восточного и северо-западного компонентов в некоторых популяциях следующее: греки — 1.2, индусы — 1.8, узбеки — 2.9, пакистанцы — 6.5, коренные народы севера Сибири — 14.2. Такое соотношение красноречиво подтверждает археологические заключение о древней миграции населения из Восточной Европы в евразийские степи. Другой интересной деталью является структура финской популяции, занимающей промежуточное положение между скандинавами, славянами и балтами. Она показывает, что финны: а) формировались на сходной с северо-восточными европеоидами основе (авторитетно подтверждается антропологией), б) испытали значительное влияние со стороны скандинавов, в) несут малый (около 5%), но ощутимый восточно-азиатский компонент.Как любой материал из области популяционной генетики, рассмотренные выше данные не привязываются к каким бы то ни было строгим временным датировкам, однако дают серьёзные возможности анализа последовательности событий. В качестве наглядного резюме можно построить диаграмму выделения и формирования компонентов по ходу увеличения кластеров. Полный комплект результатов от Dienekes Pontikos: состав популяций, диаграммы. Другие записи в этом направлении доступны по тегам или по списку: — Структура генофонда Швеции; — Антропология и приход земледелия в Европу; — Генетика о древнем населении Европы, мтДНК; — Веское слово генетики о происхождении западных европейцев; — Антропология древних балтов; — Финно-угры ли русские?http://drfaust-spb.livejournal.com/137312.html |
