Эти мутации могут быть ключом к пониманию того, как развиваются некоторые вредные условия

Группа исследователей под руководством биоинформатика из Калифорнийского университета в Сан-Диего разработала метод, помогающий определить, могут ли определенные трудноизучаемые мутации в геноме человека, называемые короткими тандемными повторами или микросателлитами, быть вовлечены во вредные условия.

Команда, в которую также входят ученые из Нью-Йоркского центра генома, Гарвардского университета и Массачусетского технологического института, подробно рассказывает о своих выводах в сентябре. 11 выпуск журнала Nature Genetics.

В коротких тандемных повторах последовательности от одного до шести основных компонентов ДНК, называемых нуклеотидами, повторяются снова и снова, иногда до сотен или тысяч раз.

Эти мутации уже были задействованы примерно в 30 состояниях. Наиболее известной из них, пожалуй, является болезнь Хантингтона, которая вызывает прогрессирующее разрушение нервных клеток в головном мозге. В США от этого заболевания страдают около 30 000 человек. У всех этих людей есть более 40 копий определенного повтора. Чем больше у них копий, тем раньше они поражаются заболеванием и тем тяжелее оно протекает.

Статья в Nature Genetics является частью продолжающихся десятилетий усилий по выявлению вредных мутаций в геноме человека. Тандемные повторы часто упускаются из виду в этих усилиях, а иногда и игнорируются как "мусорная ДНК." Но исследователи во главе с Мелиссой Гимрек, доцентом Калифорнийского университета в Сан-Диего, считают, что тандемные повторы, вероятно, будут играть ключевую роль в здоровье человека и требуют тщательного изучения.

"Когда вы ищете сигналы болезни в геноме человека, вы получаете слишком много ответов. Мы ищем способ сузить эти ответы," сказал Гимрек, который работает как в Медицинской школе Калифорнийского университета в Сан-Диего, так и в Инженерной школе Джейкобса.

На следующем этапе своего исследования ученые планируют использовать свою модель для изучения геномов семей с аутичными членами.

Анализ повторов

Тандемные повторы сложно анализировать с помощью современных методов секвенирования генома. Это потому, что они обычно довольно длинные, а современные инструменты обычно смотрят только на короткие фрагменты ДНК. Кроме того, процесс амплификации ДНК для секвенирования создает больше ошибок, которые мешают.

В этой статье исследователи подробно описывают, как им удалось создать математическую модель, которая предсказывает, как часто и каким образом повторы появляются и видоизменяются в геноме человека. Гимрек и его коллеги смогли это сделать благодаря огромному количеству генетических данных, к которым у них был доступ – более 1.5 миллионов повторов из геномов 300 особей.

Исследователи основали свой новый алгоритм на методе под названием MUTEA, который они ранее разработали для точной оценки индивидуальных скоростей мутаций для тандемных повторов на Y-хромосоме. Они изменили алгоритм, чтобы он анализировал пары вариаций ДНК, называемых гаплотипами. Ключевое понимание этого метода заключается в том, что различные классы мутаций происходят через регулярные, предсказуемые интервалы времени, составляя то, что они называют молекулярными часами. Эти часы можно использовать для определения того, как часто мутации происходят в геноме.

Поиск ограничений

Затем исследователи использовали модель, чтобы рассчитать фактическую частоту мутаций и сравнить ее с ожидаемой частотой мутаций. Это то, что генетики называют принуждением. Например, области генома, в которых происходят мутации, которые происходят в раннем возрасте и приводят к тяжелым состояниям здоровья, как правило, имеют меньше мутаций в популяции, чем ожидалось случайно – генетики говорят, что они очень ограничены. Это потому, что люди, страдающие от таких состояний, как аутизм, с меньшей вероятностью передадут свои гены следующему поколению. Области генома, которые вызывают заболевания, которые возникают в более позднем возрасте, после того, как у пациентов родятся дети, такие как болезнь Хантингтона, обычно не ограничиваются.

Команда использовала свою модель для ряда различных тандемных повторов, связанных как с поздними, так и с ранними состояниями, такими как пороки развития конечностей. Модель правильно определила, что повторы, участвующие в ранних состояниях, подлежат ограничению. Они откалибровали свой метод, используя набор тандемных повторов, не связанных с конкретными условиями, которые ФБР использует для идентификации людей. Как и ожидалось, эти повторы мутируют с ожидаемой скоростью и не ограничиваются.

Гимрек и ее команда сейчас готовятся применить свою модель, чтобы найти сигналы для других состояний в геноме человека.