Каждый человек в среднем имет 50-100 мутаций, связанных с наследственными заболеваниями. Это один из выводов, сделанных после первого этапа участниками проекта «1000 геномов».
Ученые объявили о завершении пилотного этапа проекта «1000 геномов». Цель проекта, начатого в 2008 году -- описать изменчивость человеческой ДНК в разных популяциях. За пилотный этап ученые провели полное или частичное секвенирование геномов около 800 человек и описали множество новых генетических вариаций, а также количественно оценили, в какой степени мы генетически отличаемся друг от друга.
Над проектом работал огромный международный консорциум, секвенирование проводилось на базе девяти научных центров. Данные представлены Европейской молекулярно-биологической лабораторией Европейского института биоинформатики (European Molecular Biology Laboratory's European Bioinformatics Institute (EMBL-EBI) и Национальным центром биотехнологической информатики США (US National Center for Biotechnology Information (NCBI) в открытом доступена сайте.
Больше геномов – меньше точность
Цель пилотного этапа состояла в разработке и сравнении нескольких стратегий секвенирования множества геномов.
Пилотный этап включает три отдельных проекта. Первый: полностью секвенировали с малым (х2-х6) перекрытием (это означает меньшую точность данных) геном 179 человек. Из них 59 относятся к популяции йоруба в Нигерии, 60 жителей штата Юта европейского происхождения и 30 японцев. Второй: полностью секвенировали с высоким (х42) перекрытием (с высокой точностью) геном шести человек из двух семей (йоруба и потомков европейцев из Юты), каждая состоит из родителей и дочери. И третье: частично секвенировали геном 679 человек из семи популяций Африки, Европы и Азии. Для этого выбрали 8140 экзонов (кодирующих участка) из 906 генов.
Одна из главных целей биологии и медицины – понимание связи между генотипом и фенотипом: признаками организма, которые закодированы в ДНК. За годы, прошедшие после расшифровки нуклеотидной последовательности первого человеческого генома, появилось много данных о генетической изменчивости разных людей. Создана база данных по однонуклеотидному полиморфизму (SNP, точечные мутации – замены одного нуклеотида другим в данном месте), по вставкам и делециям (вырезаниям) в последовательности ДНК, по частотам различных генетических вариаций в разных популяциях (HapMap Project). Эти данные стимулировали открытие множества генов, связанных с различными заболеваниями – за пять лет нашли более тысячи таких участков. Несмотря на это, говорят ученые, до сих пор отсутствует глубокое понимание вклада генетики в фенотип человека.
Что нового узнали генетики
В ходе пилотного проекта ученые расшифровали 4,9 терабайт информации, закодированной в ДНК. Они описали 15 млн SNP, 1 млн нуклеотидных вставок и делеций, 20 тысяч бóльших вариаций строения ДНК. Их них множество ранее не описанных. Например, 8 млн новых SNP.
Полное секвенирование геномов двух семей позволило не только выявить у их членов все генетические вариации, но и проследить, как эти вариации передаются следующему поколению. Только в этой части проекта ученые нашли 5,9 млн SNP, 605 тысяч вставок и делеций и свыше 14 тысяч больших структурных вариаций. Семейный проект позволил оценить скорость возникновения новых мутаций в половых клетках – она равна примерно 10-8 на пару оснований на поколение.
Популяция африканев продемонстрировала наибольшее число вариаций (в том числе новых). У африканцев ученые нашли 63% и 44% новых SNP (в первом и третьем проектах), а среди европейцев – 33% и 22%. Это свидетельствует о большем генетическом разнообразии африканского населения.
Как сильно мы различаемся
Исследователи подсчитали, что среди индивидуальных различий генома в среднем 10-12 тысяч SNP ведут к различиям в белках, кодируемых генами. Индивидуальные различия составляют в среднем 190-210 небольших нуклеотидных вставок и делеций, 80-100 «стоп-кодонов» (сочетания нуклеотидов, останавливающих синтез белка). Выяснилось, что каждый человек имеет в среднем 250-300 вариаций, ведущих к неработающему гену. А главное -- каждый человек несет в среднем 50-100 мутаций, связанных с наследственными заболеваниями (они находятся в базе данных Gene Mutation Database (HGMD).
По словам авторов, их работа позволяет хотя бы начать разбираться в том, как формировался геном человека под влиянием естественного отбора. Оценив степень расхождения между популяциями, ученые пришли к заключению, что большинство локальных адаптаций (к местным условиям среды) возникало с изменением частоты уже существующих мутаций, а не с появлением новых. Уже сейчас полученные данные позволят точнее локализовать гены, ассоциированные с различными заболеваниями.
Полный проект «1000 геномов», который по плану должен завершиться в 2012 году, будет включать секвенирование с низким перекрытием (порядка х4) и глубокое секвенирование кодирующих участков 2500 геномов со всех континентов. Ученые ожидают, что проект позволит описать 95% изменчивости, встречающейся в популяциях с частотой не менее 1%.
Статья с изложением результатов пилотного этапа опубликована в последнем выпуске Nature.