[RBDLW98 logo]


  • Организаторы
  • Поддержка
  • Оргкомитет
  • Регистрация
  • Стоимость участия
  • Перевод
  • Пресс-релиз
  • Программа
  • English pages
  • Российско-британский семинар
    "Электронные библиотеки"

    Тезисы


    Метаданные и первые результаты каталогизации Интернет

    М.Е. Шварцман (Российская государственная библиотека)

    В России в настоящее существует ряд каталогов ресурсов Интернет, однако они не полны, не точны да и в принципе они не могут быть таковыми, поскольку Интернет постоянно меняется. Поэтому любой каталог без надежного механизма корректировки устаревает в момент его создания.

    В рамках проекта "Создание систематического каталога российских ресурсов Интернет", поддержанного Российским фондом фундаментальных исследований, создателям ресурсов предлагается надежный, общедоступный механизм получения стандартного описания его собственного ресурса, которое должно хранится в самом ресурсе.

    Создателю ресурса остается только поддерживать в актуальном состоянии описание ресурса в самом ресурсе. При наличии такого описания возможно создание программы-робота, которая без участия человека будет просматривать весь Интернет или его часть, находить новые или измененные ресурсы, выбирать из ресурсов описания, подготовленные создателями и размещать их в создаваемом каталоге. Таким образом, мы обеспечим актуальность каталога, а его полнота будет зависеть от создателей ресурсов.

    К настоящему времени внедрена технология каталогизации ресурсов Интернет, разработано типовое программное обеспечение для ведения базы данных, подготовлены формат описания ресурсов Интернет и инструкции пользователям. Выявлены проблемы, требующие дальнейшей разработки.

    Одним из важнейших направлений должна являться работа по внедрению в российской зоне Интернет метаданных, как инструмента описания ресурсов. Каталогизирование ресурсов Интернет силами участников проекта - необходимое условие успешного продолжения проекта, но недостаточное. Для создания каталога нужно, чтобы все создатели ресурсов Интернет при разработке своих HTML страниц использовали поля формата Dublin Core Metadata Element Set в заголовке ресурсов. Разработанное в рамках проекта программное обеспечение, размещенное на сервере http://www.rsl.ru/dc, позволяет минимизировать затраты труда разработчиков ресурсов и выдает им описание в формате Dublin Core Metadata Element Set после заполнения несложной формы.

    Вторым важным направлением деятельности должна стать работа по внедрению URN - универсального номера ресурса. Отсутствие такого идентификатора сильно затрудняет процесс каталогизации, поскольку большое количество одинаковых по содержанию ресурсов (зеркальные, с другой кодировкой и т.п.) имеют разные URL и для каталогизатора практически невозможно избежать дублирования при описании таких ресурсов.