[RBDLW98 logo]


  • Организаторы
  • Поддержка
  • Оргкомитет
  • Регистрация
  • Стоимость участия
  • Перевод
  • Пресс-релиз
  • Программа
  • English pages
  • Российско-британский семинар
    "Электронные библиотеки"

    Тезисы


    Электронная библиотека знаний для аннотации геномной ДНК

    М.П.Пономаренко, Ю.В.Пономаренко, А.С.Фролов, А.В.Кочетов, Ф.А.Колпаков, Н.А.Колчанов (Институт цитологии и генетики СО РАН), Н.Л. Подколодный (Институт вычислительной математики и математической геофизики СО РАН)

    ГЕНОМ ЧЕЛОВЕКА - крупнейший всемирный научный проект. Аннотация геномной ДНК - предсказание неизвестных генов, регуляторных районов и сигналов с целью планирования экспериментов по их идентификации. Это требует применения знаний о строении генов, регуляторных районов, сигналов, о молекулярных механизмов их работы, о генных сетях координации работы генов в процессах жизнедеятельности организмов.

    Массив даже самых необходимых таких знаний настолько велик и разнороден, что его невозможно ни "держать в голове", ни издать в виде "Руководства по неизвестным генам". Поэтому справочно-поисковая оптимизация разнородных потоков управления и данных электронной библиотеки представляется наиболее адекватной аннотации геномной ДНК.

    Наша электронная библиотека для аннотации геномной ДНК основана на новом методе документирования молекулярно-генетических знаний. Его суть в представлении каждого элементарного знания в виде активного приложения, производящего соответствующий элементарный алгоритмический шаг анализа ДНК. Так, знание о характерном сигнале, предшествующем стартам некоторой группы изофункциональных генов, представляется в виде программы для распознавания такого сигнала в геномной ДНК с целью предсказания неизвестных генов этой группы. Существенно, что программная документация (URL, описание, контрольные примеры) собирается в полнотекстовую базу данных, справочно-поисковые средства которой оптимизируют поток управления знаниями-программами по мере возникновения необходимости каждого из них в процессе аннотации геномной ДНК.

    Текущая версия нашей электронной библиотеки знаний для аннотации геномной ДНК включает семь основных баз таких знаний: GeneNet - генные сети координации генов (10 знаний-сетей); Activity - активность функциональных сигналов геномной ДНК (49 знаний-программ); Features - конформационные и физико-химические особенности сигналов (1402 знаний-программ); Matrix - частотные сигналы в геномной ДНК (567 знаний-программ); Consensus - эволюционно-консервативные сигналы (66 знаний-программ), LeaderRNA - сигналы "частого/редкого" использования генов (99 знаний-программ). Эти знания являются общедоступными, http://wwwmgs.bionet.nsc.ru/systems/geneexpress/.

    Работа поддержана грантами РФФИ 98-07-90126, 98-07-91078 и 99-07-90203.