[ Russian ] [ English ]

Поиск информационных ресурсов на основе библиографического описания с помощью технологий OpenURL и SFX

Хохлов Александр Юрьевич,
Российская государственная библиотека, ВМиК МГУ,
alex@lib.msu.ru

В настоящее время пользователи все чаще используют Интернет для получения необходимой справочной и научной информации. Интернет предоставляет очень дешевую и очень эффективную среду для передачи данных. Поэтому многие издательства начали выпускать электронные версии своих журналов и книг, а также появились и исключительно электронные издания, которые не имеют печатных аналогов.

Библиотеки как традиционные институты по аккумуляции научной информации и обслуживанию пользователей также широко используют Интернет. Все началось с электронных каталогов, позволяющих производить поиск и заказ нужного издания. Однако сейчас обязательной частью работы библиотек является также комплектование электронными изданиями. Это экономит место в помещениях хранения библиотеки и позволяет существенно расширить территорию и качество обслуживания читателей библиотеки - пользователь может прочитать необходимые издания, не выходя из дома.

Однако, как и с комплектованием традиционных изданий, покупка доступа к электронным изданиям не может осуществляться с каждым издательством по отдельности - слишком уж их много. На эту потребность рынок прореагировал появлением так называемых "полнотекстовых агрегаторов" (Full Text Aggregators) - агентств, служащих посредниками между многими электронными издательствами и библиотекой. Происходит также слияние различных издательств и формирование крупных единых мировых электронных агентств.

Все это порождает ситуацию, в которой библиотека подписывается на различные крупные пакеты электронной подписки, которые покрывают ее потребности. Однако электронные журналы в такой ситуации зачастую существуют в мире сразу в нескольких копиях: одна, очевидно, хранится у издательства, а остальные - в агрегаторах и других посредниках. Доступ у библиотеки, как правило, есть только к одному источнику, причем этот источник сильно зависит от тех пакетов подписки, которые использует данная библиотека.

Теперь представим ситуацию, что пользователь библиотеки использует одну из реферативных баз данных и находит нужную ему статью. Или при прочтении другой статьи пользователь видит интересную ссылку в списке литературы. Ему желательно получить полный текст статьи, но гиперссылка, если и существует, то, как правило, ведет на копию в издательстве соответствующего журнала. Текущее же местоположение пользователя (если он находится в зале Интернет в одной из библиотек), позволяет ему получить эту копию, но из других источников.

Таким образом, появляется проблема "подходящей копии" (appropriate copy), о которой и пойдет речь в данном докладе. Будет рассказано про стандарты OpenURL и технологию SFX (Special Effects for Libraries), которые были созданы для решения проблемы "подходящей копии", а также для предоставления пользователю смежных релевантных услуг, таких как заказ копии в службе электронной доставки и проверка наличия печатной копии в ближайшей традиционной библиотеке. OpenURL является стандартом записи в URL библиографической информации о документе, передаваемой из одной информационной системы в другую. SFX является серверной технологией, которая позволяет принять библиографическую информацию по стандарту OpenURL, аутентифицировать обращающегося пользователя и, используя заранее подготовленную таблицу электронных журналов и их местоположений, предоставить ссылки именно в те электронные хранилища документов, в которых пользователь может получить копию документа.

Основной темой данного доклада будет рассказ о подходе к использованию протокола поиска и извлечения информации Z39.50 и поискового механизма Google в реализации сервера SFX. Некоторые полнотекстовые агрегаторы, такие как НЭБ РФФИ или EBSCO, пока не позволяют сформировать URL по метаданным статьи, который сразу открывает полный текст необходимого документа. Поэтому для создания ссылки на статью предлагается использовать уже поддерживаемый в этих агентствах протокол поиска и извлечения библиографической информации Z39.50: в каталоге будет произведен поиск статьи и читатель будет переадресован на тот адрес, который будет возвращен в результатах поиска. В случае бесплатных журналов, в которых не ведется каталог аналитической росписи статей, создать ссылку на полный текст документа помогает Google: зная адрес журнала и метаданные статьи можно сформировать запрос на поиск релевантных документов только на заданном веб-сайте. Первые результаты (если они есть) с большой вероятностью являются ссылками на полный текст искомой статьи. Таким образом, использование протокола Z39.50 и стандартных средств полнотекстового поиска информации в Интернет позволяет существенно расширить возможности и повысить гибкость сервера SFX по обслуживанию большего количества разнородных хранилищ документов.

В заключение в докладе будет показана действующая реализация предлагаемых подходов, которые были воплощены в общедоступном портале поиска библиотечной информации "Сигла" (http://www.sigla.ru).

Литература:

  1. Robertson, Wendy C., and Paul A. Soderdahl. 2004. Everything You Always Wanted to Know About SFX But Were Afraid to Ask. Serials Librarian 47 (1/2). Copyright 2004 by The Haworth Press, Inc., Birmingham, N.Y. (http://staffweb.lib.uiowa.edu/psoderdahl/papers/sfx.pdf)
  2. The OpenURL Framework for Context-Sensitive Services (http://www.niso.org/committees/committee_ax.html)
  3. The Digital Object Identifier System (http://www.doi.org)
  4. OpenURL and CrossRef. (http://www.crossref.org/03libraries/16openurl.html)
  5. ANSI/NISO Z39.50 - 2003 Information Retrieval : Application Service Definition & Protocol Specification (http://www.niso.org/standards/resources/Z39-50-2003.pdf)
Supported by Synthesis Group