Базы данных | Федеральный исследовательский центр «Фундаментальные основы биотехнологии»

Федеральный исследовательский центр «Фундаментальные основы биотехнологии» РАН обладает уникальными базами данных.

База данных «Database of Periodic DNA Regions in Major Genomes»
База данных содержит информацию о районах с различными тапами периодичности в разнообразных геномах. Для геномов эукариот эти районы в среднем занимают ~8% от генома (http://victoria.biengi.ac.ru/cgi-bin/indelper/index.cgi). Создана сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).

База данных потенциальных мутаций типа сдвиг рамки считывания в cds
База данных содержит информацию о потенциальных мутациях типа сдвиг рамки считывания в разнообразных cds из эукариотических геномов. В среднем около 23% cds содержит такие мутации (http://victoria.biengi.ac.ru/cgi-bin/frameshift/index.cgi). Создана сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).

Web-сайт для поиска потенциальных мутаций типа сдвиг рамки считывания в cds
Сервер дает возможность найти потенциальные мутации типа сдвиг рамки считывания в любых cds (http://victoria.biengi.ac.ru/fsfinder/). Создан сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).

База данных потенциальных промоторных последовательностей
База данных находится по адресу: http://victoria.biengi.ac.ru/cgi-bin/dbPPS/index.cgi
База данных содержит более 390 тысяч потенциальных промоторов в геноме латука посевного (lactuca sativa), более 825 тысяч потенциальных промоторов в геноме перца стручкового (capsicum annuum) и более 3 миллионов потенциальных промоторов в геноме человека разумного (homo sapiens). Создание базы данных стало возможным только потому, что разработан новый математический метод создания множественного выравнивания нуклеотидных последовательностей.
Областью возможного применения является биотехнология и генетическая инженерия.
Аналогичных баз данных не существует. Это связано с тем, то выявление промоторных последовательностей всеми ранее разработанными математическими алгоритмами невозможно. Создана сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).
Связанные статьи: https://doi.org/10.3390/sym13060917, https://doi.org/10.3390/biology11081117, https://doi.org/10.3390/plants12203573,
https://doi.org/10.3390/ijms241612561

База данных по SINE повторам из генома риса
База данных находится по адресу: http://victoria.biengi.ac.ru/sinerice/
База данных содержит десятки тысяч новых и известных SINE повторов из 45 различных семейств. Создание базы данных стало возможным только потому, что разработан новый математический метод создания множественного выравнивания нуклеотидных последовательностей.
Областью возможного применения является биотехнология и генетическая инженерия.
Аналогичных баз данных для генома риса не существует. Это связано с тем, что обнаружение новых не известных ранее SINE последовательностей всеми ранее разработанными математическими алгоритмами невозможно. Создана сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.)

Web-сайт для постоения и оценки статистической значимости множественных выравниваний последовательностей ДНК, РНК и белков методом MAHDS
Сервис позволяет строить множественные выравнивания последовательностей ДНК, РНК и белков методом MAHDS, а также оценивать статистическую значимость произвольных множественных выравниваний. Особенность метода MAHDS заключается в его способности строить статистически значимые выравнивания слабо гомологичных последовательностей, подобие которых другими методами не обнаруживается (http://victoria.biengi.ac.ru/mahds).Создан сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).
Связанные статьи: https://doi.org/10.3390/genes12020135, https://doi.org/10.3390/ijms23073764

Web-сайт для поиска дисперсных повторов в геномах IP методом
Сервис позволяет находить дисперсные повторы длиной от 100 до 800 оснований в последовательностях ДНК длиной от 500000 до 20000000 оснований с помощью IP метода (http://victoria.biengi.ac.ru/shddr). Особенностью IP метода является его способность обнаруживать de-novo дисперсные повторы, имеющие малую степень подобия. Создан сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).
Связанные статьи: https://doi.org/10.3390/ijms241310964

База данных тандемных повторов в геноме перца стручкового (capsicum annuum)
База данных содержит более 900 тысяч тандемных повторов длиной от 2 до 200 оснований обнаруженные с помощью метода mRPWM в геноме перца стручкового (capsicum annuum (http://victoria.biengi.ac.ru/capsicum_tr). Метод mRPWM позволяет найти значительно больше повторов, чем другие известные методы, за счёт того что mRPWM может обнаруживать в том числе и сильно дивергированные повторы. Создана сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).
Связанные статьи: https://doi.org/10.1093/dnares/dsad007

База данных дисперсных повторов в геномах растений
База данных содержит 117050 дисперсных повторов 35 классов в геноме Arabidopsis thaliana, 2524971 дисперсных повторов 26 классов в геноме Capsicum annuum, 330328 дисперсных повторов 35 классов в геноме Daucus carota, 388615 дисперсных повторов 30 классов в геноме Oryza sativa, 2419867 дисперсных повторов 54 классов в геноме Zea mays. Дисперсные повторы были найдены при помощи IP метода, основанного на оптимизации позиционно-весовых матриц и применении двухмерного динамического программирования, который позволяет обнаруживать повторы, имеющие слабое подобие.
Метод подробно описан в публикациях: https://doi.org/10.3390/ijms241310964 и https://doi.org/10.3390/ijms25084441.
База данных создана сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).