Как объяснили исследователи, данный комплекс предназначен для поиска в ДНК совместно встречающихся мотивов — участков, на которые «садятся» белки, управляющие считыванием закодированной в молекуле ДНК информации. Расположенные рядом мотивы, как правило, функционируют вместе, поэтому выявление таких пар позволит ученым предсказывать взаимодействия белков уже на этапе анализа последовательности ДНК, а также исследовать роль этих взаимодействий в физиологических процессах.
Работа по созданию уникального программного комплекса заняла около двух лет.
Разработка позволяет получить гораздо более детальные сведения о регуляторной роли белка на основе эксперимента по массовому секвенированию его сайтов связывания. Если ранее для заданного белка, специфично регулирующего экспрессию генов, аналогичные подходы находили с высокой достоверностью его 3-5 партнеров-белков, то с помощью новой разработки учнееы находят 10-15.
Миллионы клеток организма синтезируют белки, которые непрерывно работают: переносят кислород, защищают от вторжения чужеродных агентов, сокращают и расслабляют мышечные волокна и выполняют массу других функций. Сведения о том, где и когда должны выполняться эти действия, зашифрованы в молекуле ДНК, причем информация записана при помощи всего четырех «букв» — нуклеотидов. Нуклеотиды объединяются в «слова» — гены, и каждый ген несет в себе сведения о белке, который может с него синтезироваться. Структуру и функцию клетки определяет уникальная комбинация белков, и какой ей быть «решают» регуляторные элементы ДНК. Их структурные единицы: короткие последовательности «букв»-нуклеотидов или мотивы — опознаются белками-регуляторами (транскрипционными факторами), что приводит к запуску или, наоборот, блокированию процесса считывания генетической информации.
Чтобы найти все мотивы определенного белка-регулятора в геноме, используется дорогостоящий эксперимент, который называется ChIP-seq. Важно, что белки-регуляторы никогда не работают в одиночку: активность и специфичность каждого модулируется многочисленными партнерскими белками-регуляторами, и результат работы мотива зачастую определяется именно этими взаимодействиями. Поиск же потенциальных партнеров, как правило, сопряжен с проведением дополнительных ChIP-seq экспериментов, что многократно повышает стоимость исследования. Именно эту проблему с успехом решает новый программный комплекс.
Новосибирские ученые получили патент на свою программу, она готова к практическому применению. В последние несколько лет появились и продолжают пополняться открытые базы, насчитывающие уже несколько десятков тысяч ChIP-seq экспериментов для разнообразных типов тканей, клеток и для разных белков-регуляторов. Алгоритм сибирских ученых может использоваться для поиска новых партнеров уже известных белков-регуляторов, ключевых для выполнения важных физиологических функций организма, например, иммунного ответа.
Работа выполнялась при поддержке Российского фонда фундаментальных исследований.