Федеральный исследовательский центр «Фундаментальные основы биотехнологии» РАН обладает уникальными базами данных.
- База данных «Database of Periodic DNA Regions in Major Genomes»
База данных содержит информацию о районах с различными тапами периодичности в разнообразных геномах. Для геномов эукариот эти районы в среднем занимают ~8% от генома (http://victoria.biengi.ac.ru/cgi-bin/indelper/index.cgi). Создана сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).
- База данных потенциальных мутаций типа сдвиг рамки считывания в cds
База данных содержит информацию о потенциальных мутациях типа сдвиг рамки считывания в разнообразных cds из эукариотических геномов. В среднем около 23% cds содержит такие мутации (http://victoria.biengi.ac.ru/cgi-bin/frameshift/index.cgi). Создана сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).
- Web-сайт для поиска потенциальных мутаций типа сдвиг рамки считывания в cds
Сервер дает возможность найти потенциальные мутации типа сдвиг рамки считывания в любых cds (http://victoria.biengi.ac.ru/fsfinder/). Создан сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).
- База данных потенциальных промоторных последовательностей
База данных находится по адресу: http://victoria.biengi.ac.ru/cgi-bin/dbPPS/index.cgi
База данных содержит более 390 тысяч потенциальных промоторов в геноме латука посевного (lactuca sativa), более 825 тысяч потенциальных промоторов в геноме перца стручкового (capsicum annuum) и более 3 миллионов потенциальных промоторов в геноме человека разумного (homo sapiens). Создание базы данных стало возможным только потому, что разработан новый математический метод создания множественного выравнивания нуклеотидных последовательностей.
Областью возможного применения является биотехнология и генетическая инженерия.
Аналогичных баз данных не существует. Это связано с тем, то выявление промоторных последовательностей всеми ранее разработанными математическими алгоритмами невозможно. Создана сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).
Связанные статьи: https://doi.org/10.3390/sym13060917, https://doi.org/10.3390/biology11081117, https://doi.org/10.3390/plants12203573,
https://doi.org/10.3390/ijms241612561
- База данных по SINE повторам из генома риса
База данных находится по адресу: http://victoria.biengi.ac.ru/sinerice/
База данных содержит десятки тысяч новых и известных SINE повторов из 45 различных семейств. Создание базы данных стало возможным только потому, что разработан новый математический метод создания множественного выравнивания нуклеотидных последовательностей.
Областью возможного применения является биотехнология и генетическая инженерия.
Аналогичных баз данных для генома риса не существует. Это связано с тем, что обнаружение новых не известных ранее SINE последовательностей всеми ранее разработанными математическими алгоритмами невозможно. Создана сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.)
- Web-сайт для постоения и оценки статистической значимости множественных выравниваний последовательностей ДНК, РНК и белков методом MAHDS
Сервис позволяет строить множественные выравнивания последовательностей ДНК, РНК и белков методом MAHDS, а также оценивать статистическую значимость произвольных множественных выравниваний. Особенность метода MAHDS заключается в его способности строить статистически значимые выравнивания слабо гомологичных последовательностей, подобие которых другими методами не обнаруживается (http://victoria.biengi.ac.ru/mahds).Создан сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).
Связанные статьи: https://doi.org/10.3390/genes12020135, https://doi.org/10.3390/ijms23073764
- Web-сайт для поиска дисперсных повторов в геномах IP методом
Сервис позволяет находить дисперсные повторы длиной от 100 до 800 оснований в последовательностях ДНК длиной от 500000 до 20000000 оснований с помощью IP метода (http://victoria.biengi.ac.ru/shddr). Особенностью IP метода является его способность обнаруживать de-novo дисперсные повторы, имеющие малую степень подобия. Создан сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).
Связанные статьи: https://doi.org/10.3390/ijms241310964
- База данных тандемных повторов в геноме перца стручкового (capsicum annuum)
База данных содержит более 900 тысяч тандемных повторов длиной от 2 до 200 оснований обнаруженные с помощью метода mRPWM в геноме перца стручкового (capsicum annuum (http://victoria.biengi.ac.ru/capsicum_tr). Метод mRPWM позволяет найти значительно больше повторов, чем другие известные методы, за счёт того что mRPWM может обнаруживать в том числе и сильно дивергированные повторы. Создана сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).
Связанные статьи: https://doi.org/10.1093/dnares/dsad007
- База данных дисперсных повторов в геномах растений
База данных содержит 117050 дисперсных повторов 35 классов в геноме Arabidopsis thaliana, 2524971 дисперсных повторов 26 классов в геноме Capsicum annuum, 330328 дисперсных повторов 35 классов в геноме Daucus carota, 388615 дисперсных повторов 30 классов в геноме Oryza sativa, 2419867 дисперсных повторов 54 классов в геноме Zea mays. Дисперсные повторы были найдены при помощи IP метода, основанного на оптимизации позиционно-весовых матриц и применении двухмерного динамического программирования, который позволяет обнаруживать повторы, имеющие слабое подобие.
Метод подробно описан в публикациях: https://doi.org/10.3390/ijms241310964 и https://doi.org/10.3390/ijms25084441.
База данных создана сотрудниками группы математического анализа последовательностей ДНК и белков (Руководитель: д.б.н. Коротков Е.В.).