[RBDLW98 logo]


  • Организаторы
  • Поддержка
  • Оргкомитет
  • Регистрация
  • Стоимость участия
  • Перевод
  • Пресс-релиз
  • Программа
  • English pages
  • Российско-британский семинар
    "Электронные библиотеки"

    Тезисы


    Смысловой поиск и индексирование текстовой информации в электронных библиотеках: информационная технология "ключи от текста"

    М.Г. Крейнес (Московская медицинская академия им. И.М. Сеченова, МСЦНИТ)

    Существующие объемы текстовой информации в электронной форме делают абсолютно нереальным личное знакомство человека с каждым текстом. Это определяет исключительную актуальность разработки информационных технологий, практически не требующих участия специалиста на этапе поиска необходимой информации и ее смысловой классификации. Традиционные методы информационного поиска по ключевым словам часто не приводят к отбору интересных текстов и отсеву неинтересных. Причина этого кроется не только в сложности для человека формирования в виде небольшого по объему списка слов адекватного его желаниям поискового образа. Недостаточно эффективно само использование в качестве критерия отбора информации просто наличия в ней определенных слов, включенных в поисковый образ. Проблематичен и альтернативный подход - априорная не ориентированная на конкретного пользователя смысловая индексация текстов, среди которых выполняется поиск.

    Для преодоления рассмотренных трудностей мы предложили и используем оригинальные алгоритмы вычислительного синтеза смыслового образа текста. Основной особенностью этих алгоритмов является то, что они не используют информацию о смысле и значении слов, в частности нет нужды в смысловых тезаурусах. Предлагаемые алгоритмы в ходе формальной процедуры выделяют своеобразное "семантическое поле" - множество слов, наиболее сильно связанных по смыслу в конкретном анализируемом тексте, на основании сопоставления анализируемого текста с представительной для предметной области совокупностью текстов.

    На сегодня нами реализована информационная технология интеллектуального смыслового поиска в информационных ресурсах на естественных языках без обязательного предварительного индексирования, автоматической смысловой индексации, классификации и аннотирования текстовой информации, как средство анализа и создания информационных ресурсов для глобальных телекоммуникационных сетей.

    Основными особенностями предлагаемого подхода являются полнота и точность смыслового поиска и классификации информации и возможность описания сферы интересов пользователя в виде примеров интересных ему текстов. Информационная технология КЛЮЧИ ОТ ТЕКСТА ориентирована на конечных пользователей и провайдеров информационных услуг в глобальных и локальных телекоммуникационных сетях.