Preview

Наука и научная информация

Расширенный поиск

ОРГАНИЗАЦИЯ ЕДИНОЙ ТОЧКИ ДОСТУПА К РЕСУРСАМ БИБЛИОТЕКИ: ПОИСК ВАРИАНТОВ РЕАЛИЗАЦИИ

https://doi.org/10.24108/2658-3143-2018-1-1-60-66

Содержание

Перейти к:

Аннотация

Рассматривается проблема организации на библиотечных сайтах единого интерфейса поиска во всей совокупности ресурсов, которые библиотека может предоставить своим пользователям. Показано, что в современной библиотеке пользователям часто приходится иметь дело с несколькими интерфейсами для поиска в традиционных печатных ресурсах, в собственной электронной библиотеке и в ряде лицензионных ресурсов, каждый из которых размещен на своей платформе. Описываются поисковые сервисы discovery (web scale discovery services), возникшие в последнее десятилетие, как лучшее решение для организации единой точки доступа к разнородным библиотечным ресурсам. Анализируются их компоненты, достоинства и некоторые недостатки: неполнота индексируемого контента, потери на этапе передачи данных от контент-провайдеров и сложность настройки базы знаний сервиса для отражения всего репертуара ресурсов, доступных библиотеке. Подчеркиваются проблемы учета в глобальных сервисах локальной продукции местных издательств, а также невозможность тонкой настройки базы знаний на уровне отдельных статей открытого доступа. Рассматривается специфика российских сервисов discovery. Делается вывод о том, что для российских научных библиотек, предоставляющих доступ к обширным коллекциям лицензионных ресурсов, среди которых много зарубежных, в качестве основного поискового сервиса необходимо использовать глобальные сервисы discovery для успешной реализации своей миссии.

Для цитирования:


Литвинова Н.Н. ОРГАНИЗАЦИЯ ЕДИНОЙ ТОЧКИ ДОСТУПА К РЕСУРСАМ БИБЛИОТЕКИ: ПОИСК ВАРИАНТОВ РЕАЛИЗАЦИИ. Наука и научная информация. 2018;1(1):60-66. https://doi.org/10.24108/2658-3143-2018-1-1-60-66

For citation:


Litvinova N.N. ONE-STOP ACCESS POINT TO LIBRARY RESOURCES: IN SEARCH OF REALIZATION. Scholarly Research and Information. 2018;1(1):60-66. (In Russ.) https://doi.org/10.24108/2658-3143-2018-1-1-60-66

1. Введение и обзор литературы

За последние 30–40 лет ресурсы библиотек пре­терпели существенные изменения в связи с бурным развитием информационных технологий. Снача­ла библиотеки имели дело с электронными доку­ментами, которые были сходны с традиционными печатными документами, по крайней мере, в том, что они либо поступали на физических носителях (компакт-дисках), либо в виде файлов для разме­щения на библиотечных серверах. Благодаря этому они полностью контролировались библиотеками, что позволяло успешно решать некоторые пробле­мы в их описании для справочно- поискового ап­парата и в учете их как части библиотечного фон­да. В 1990-е годы библиотеки начали оформлять в доступ (лицензировать) новый вид электронных ресурсов, размещенных на технических средствах других организаций: издательств, агрегаторов, научных обществ и других контент- провайдеров. Такие лицензионные ресурсы (ЛР) библиотеки не контролировали: их состав мог изменяться на про­тяжении периода лицензирования, а включенные в них документы содержали готовые библиогра­фические записи с метаданными, по которым мож­но было вести поиск через интерфейсы контент- провайдеров.

Создалась ситуация, при которой пользователи библиотек, войдя на библиотечный сайт, были вы­нуждены искать нужные документы, пользуясь це­лым рядом различных окон поиска:

  • в электронном каталоге, раскрывающем в ос­новном традиционный печатный фонд;
  • в электронном каталоге электронной библио­теки (ЭБ); в некоторых организациях описания объектов ЭБ включили в единый электронный каталог библиотеки, обеспечив аналитическую роспись статей и частей документов;
  • в окнах поиска во множестве лицензионных ресурсов;
  • в глобальных поисковых сервисах интернета, через которые можно найти большое количе­ство документов в свободном доступе.

Такая ситуация привела к значительному отто­ку пользователей с библиотечных сайтов в сторо­ну глобальных поисковых сервисов Google, Yandex и подобных, с тревогой отмеченному в ряде ис­следований [1, 2]. Для формирования единого по­искового пространства для разнородных ресурсов библиотек в начале 2010-х годов были разработаны сервисы discovery (см., например, [3, 4]). В настоя­щее время они широко используются в библиоте­ках всего мира. Четыре наиболее известных ком­мерческих сервиса discovery Summon (ProQuest), EBSCO discovery service (Ebsco Industries), Primo (Ex Libris) и WorldCat Discovery Service (OCLC) использу­ются в сотнях зарубежных библиотек и в десятках крупных библиотек России. Описания этих сервисов можно найти на сайтах компаний-разработчиков, приведенных в скобках после названий сервисов.

2. Сервисы discovery как реализация единого поискового окна

Успешное функционирование сервиса discovery обеспечивают три важных компонента:

  • индекс сервиса — собранный и проиндексиро­ванный контент большого количества ресур­сов, как непосредственно контролируемых би­блиотекой, так и сетевых удаленных ресурсов (СУР), имеющихся в доступе, лицензионном или свободном;
  • структурированная база знаний о потенциаль­но доступных библиотекам сетевых удаленных ресурсах;
  • определитель ссылок (link resolver) — про­граммный продукт, который устанавливает связь между описанием документа в выдаче сервиса discovery на запрос (источником) и пол­ным текстом этого документа на платформе контент-провайдера (целью) с учетом доступ­ности ресурсов в данной библиотеке, зафикси­рованной ее сотрудниками в базе знаний.

Для интеграции электронного каталога библи­отеки в индекс сервиса discovery важно, чтобы он был реализован на программном обеспечении, со­вместимом с сервисом discovery; желательно также, чтобы в ЭК использовался MARC-подобный формат. Если эти условия выполнены, интеграция прохо­дит довольно легко, и в дальнейшем обновление индекса осуществляется в полуавтоматическом ре­жиме. Гораздо сложнее ситуация с интеграцией се­тевых удаленных ресурсов. Она происходит через настройку базы знаний, реализуемую в несколько последовательных шагов:

  • выбор в базе знаний провайдеров и коллек­ций, к которым имеет доступ библиотека;
  • выбор в коллекциях изданий, актуальных для библиотеки, и актуальных периодов до­ступа к ним;
  • в случае необходимости — подгрузка назва­ний изданий для коллекций, не включенных в базу знаний.

Правильная настройка базы знаний обеспечи­вает ссылки из результатов поиска на те докумен­ты, к которым у данной библиотеки есть доступ на уровне полных текстов. Эти ссылки реализуются с помощью определителя ссылок (link resolver). Ос­новная модель работы определителя ссылок — че­рез стандарт OpenURL [5], то есть сравнением мета­данных библиографических записей в результатах поиска с метаданными полнотекстовых докумен­тов в доступных ресурсах. Именно наличие ссылок только на доступный контент определяет преиму­щество сервисов discovery перед обычными поис­ковыми сервисами Google (Google Scholar), Yandex и другими, в которых ссылки никак не маркирова­ны — и пользователь не знает, откроется ли для него полный текст.

Настройка базы знаний в библиотеке, которая лицензирует большое количество разнообразных ресурсов, а также стремится интегрировать в ре­сурсную базу поиска важные для нее коллекции от­крытого доступа, — сложный и трудоемкий процесс. Он имеет постоянный характер, поскольку сетевые удаленные ресурсы очень изменчивы как по составу лицензируемых коллекций, так и по их наполнению.

Библиотеки возлагают большие надежды на внедрение сервисов discovery. Правильно настро­енные, они действительно обеспечивают удобный поиск из одной точки в большинстве ресурсов, доступных пользователям библиотеки. Благода­ря этому в последние годы наблюдается рост по­пулярности библиотечных сайтов как отправной точки для тематического поиска документов, отме­ченный, в частности, в глобальном исследовании компании Simon Inger Consulting [6]. Однако серви­сы discovery не свободны от недостатков, которые не позволяют рассматривать их как универсальное решение, обеспечивающее исчерпывающие ре­зультаты поиска.

Главным недостатком discovery-сервисов явля­ется невозможность обеспечить полноту индекси­руемого контента. Глобальные сервисы сотрудни­чают с тысячами контент-провайдеров по всему миру, но не могут обеспечить полный охват так на­зываемых локальных издателей, особенно если их продукция издается не на английском языке, тем более — с использованием алфавитов, отличных от латинского. Этот недостаток имеет большое значе­ние для российских библиотек. Поэтому в послед­ние годы они целенаправленно работают с коман­дой EBSCO discovery service, самого популярного в России, и добились включения в индекс сервиса более десятка популярных российских ресурсов.

Менее очевидные недостатки контентного напол­нения индексов discovery обнаруживаются на де­тальном уровне прописывания доступного контен­та библиотеками. Нередко в базе знаний продукция издательств представлена в недостаточно струк­турированном виде, например в ней не выделены тематические коллекции. Библиотеки, подписавши­еся на такие коллекции, вынуждены выбирать из­дания из общего списка. Неразрешимой пока про­блемой является отражение доступности отдельных структурных элементов (в основном, статей) в изда­ниях, которые как целое библиотеке недоступны.

Эффективность функционирования систем discovery в библиотеках, проблемы, возникающие при их внедрении и использовании, рассматрива­лись в ряде публикаций [7–10] как на уровне опыта отдельных библиотек, так и в сопоставлении ре­зультатов по нескольким сервисам и нескольким вариантам внедрения. Наиболее исчерпывающим исследованием сопоставительного характера яв­ляется, на наш взгляд, статья группы авторов, представляющих издательство Institute of Electrical and Electronics Engineers (IEEE) [11]. Заметим, что корректная работа сервисов discovery, обеспечи­вающая максимально удобный путь пользователя от запроса до издательского контента, заботит не только библиотекарей, но и представителей изда­тельского сообщества: любые осложнения на этом пути могут привести к оттоку пользователей с их сайтов и поиску иных вариантов получения кон­тента, не исключающих и пиратских. Об этом гово­рит, в частности, популярность SciHub.

Авторы из IEEE проанализировали потери из­дательского контента на пути к библиотечным пользователям через сервисы discovery и поте-ри пользователей при поиске. В сотрудничестве с разработчиками четырех основных сервисов discovery, которым IEEE поставляет свой контент, и с четырьмя группами библиотек, внедрившими эти сервисы, они определили количество полных текстов IEEE, доступных пользователям этих библи­отек в соответствии с их настройками базы знаний. Библиотеки были отобраны таким образом, чтобы их подписка на ресурсы IEEE совпадала: всем 22 библиотекам были доступны журналы, материалы конференций и стандарты за одинаковый период. Результаты представлены на рис. 1.

 

 

Рис. 1. Сравнение количества доступных полных текстов IEEE в четырех группах библиотек

Fig. 1. Comparison of available IEEE full texts in four library groups

 

 

Необходимые пояснения к рисунку:

а)   сервисы discovery анонимны, они обозначаются буквами A, B, C и D;

б)  красная горизонтальная линия показывает ко­личество библиографических записей (мета­данных) и полных текстов, которые IEEE выло­жило по ftp для каждого из четырех сервисов discovery: около 3,4 миллиона;

в)   вертикальные столбцы показывают количество библиографических записей на полнотексто­вые документы IEEE, доступные для поиска че­рез discovery пользователям библиотек;

г)   библиографические записи на документы IEEE могут поступать не только от издателя, но и из реферативно-библиографических баз данных; при выдаче на запрос дублирование записей устраняется, но не полностью, поэтому может иметь место даже превышение этого количества записей в выдаче над количеством реально по­ставленных полных текстов, как в первом столб­це «зеленой группы» библиотек.

О чем говорят данные, представленные на ри­сунке? Во-первых, ни один из сервисов discovery не включил в свой индекс всех записей, предо­ставленных издателем: большинство столбцов не достигают красной линии, а единственный случай превышения объясняется дублированием записей. Во-вторых, данные первых трех групп говорят о том, что библиотеки, пользующиеся одним и тем же сер­висом, предоставляют своим пользователям раз­личное количество записей, доступных для поиска; небольшое различие можно объяснить разницей в количестве дублирующихся записей, но разли­чие в разы явно говорит об ошибках в настройках библиотеками доступных издательских продуктов: как выяснилось, в нескольких из них не был пропи­сан доступ к коллекциям материалов конференций и/или стандартов. В-третьих, низкие результаты всех библиотек группы D свидетельствуют о том, что у сервиса D самые большие проблемы с вклю­чением в свой индекс библиографических записей издателя; такие проблемы могут быть обусловлены техническими сбоями, несогласованностью фор­матов и другими причинами. Во всех случаях изда­тельство работает с сервисами, чтобы обеспечить максимальную полноту предоставления своего контента пользователям библиотек.

В 2016 году библиотекари университета штата Вермонт провели анкетирование руководителей справочно-библиографических служб 56 библи­отек университетов США, Канады и Великобрита­нии с целью выяснить различные аспекты внедре­ния, поддержки и функционирования сервисов discovery [12]. Особое внимание было уделено оцен­ке результатов внедрения, степени удовлетворен­ности или неудовлетворенности ими и причинам, которые вызвали воодушевление от успеха или разочарование из-за неожиданно слабых резуль­татов. Оценка в целом высокая: 45 % опрошенных оценили результат внедрения как положительный и 26 % — как в основном положительный.

Вывод, который сделали исследователи, прост: чтобы внедрение было успешным, необходимо сформировать специальную команду, которая со­средоточится на этапе внедрения, а затем — на под­держке сервиса: актуализации доступных ресурсов и входящих в них изданий, внедрении новых оп­ций, организации обучения пользователей и об­ратной связи с ними. Этот вывод может показаться очевидным только на первый взгляд. На деле за ним стоит глубокий анализ опыта коллективов на­учных библиотек. Выбирая сервис discovery и воз­лагая на него большие надежды, подкрепленные рекламными выступлениями представителей ком­паний-разработчиков, сотрудники библиотек не­редко не представляют реальный объем работы, необходимой для успешного внедрения и функ­ционирования этих достаточно сложных сервисов. Компания-разработчик обеспечивает поддержку и первичную настройку сервиса, но эта настрой­ка базируется на списке ресурсов, доступных дан­ной библиотеке, и не может учитывать все детали подписки на контент: доступные периоды, иногда прерывистые, сохранение архивных прав в случае прекращения доступа, локальные ресурсы и многое другое. Проработка этих тонких настроек целиком зависит от библиотеки, так же как и эффективное обучение и поддержка пользователей. Респонден­ты, негативно оценившие результаты внедрения, честно признали, что не уделили достаточного внимания всем аспектам реализации сервиса.

Сказанное выше особенно актуально для рос­сийских библиотек. Они должны с особым внима­нием отнестись к специфическим проблемам уче­та российского контента в сервисах discovery. Как было сказано выше, за последние годы состоялось включение многих научно значимых российских ре­сурсов, по крайней мере, в индекс EBSCO Discovery Service (EDS). Но проблемы остаются. Для ряда ре­сурсов перечни доступных изданий недостаточно структурированы. Библиотеки, подписанные на не­большие тематические пакеты, не могут прописать их как таковые в базе знаний и вынуждены выбирать доступные издания из общей коллекции, содержа­щей тысячи и десятки тысяч названий. Еще более серьезной проблемой является то, что российские контент-провайдеры не поддерживают ссылки на полные тексты по стандарту OpenURL, обеспечива­ющему сравнение метаданных библиографических записей в результатах поиска в сервисе discovery с метаданными полнотекстовых документов на сайтах провайдеров. В качестве альтернативы ис­пользуются специально созданные пользователь­ские ссылки (Custom Links), которые сравнивают статичные идентификаторы записей. Любая смена идентификатора у контент-провайдера, которая не сразу сообщается в сервис discovery или вообще не сообщается, влечет за собой отказ в доступе к до­кументу. Сейчас во всем мире набирает популяр­ность работа ссылок на основе сравнения DOI. Но большинство документов в российских ресурсах не содержит DOI — и проблема ссылок остается.

Проблема точности отражения доступного кон­тента в базе знаний сервиса discovery проявилась в последнее десятилетие в новом аспекте. В БЗ мож­но отразить доступность только на уровне изданий: книг, журналов, их томов и выпусков. Доступность отдельных статей в так называемых гибридных журналах, публикующих в открытом доступе ста­тьи, за работу с которыми издательство получило оплату (Article Processing Charge), прописать невоз­можно. В результате пользователи не видят в ре­зультатах поиска индикации доступности статей из гибридных журналов, которые не входят в подписку библиотеки. Приходится открывать детальные опи­сания статей и надеяться на то, что специальные браузерные расширения Unpaywall или Open Access Button покажут наличие статьи в открытом доступе.

Особая тема в использовании сервисов discovery в России — российские разработки подобных сер­висов, активно предлагаемые на библиотечном рынке. Их кардинальное отличие от глобальных сервисов discovery заключается в том, что они не используют базу знаний — и библиотеки не на­страивают ее самостоятельно под свою подписку. Разработчики таких сервисов, по сути, берут на себя всю настройку доступного контента по зака­зу конкретной библиотеки, взаимодействуя с кон­тент-провайдерами и получая от них информацию о ее подписках. Такой подход, в принципе, возмо­жен, хотя, безусловно, он должен подкрепляться соответствующими трехсторонними соглашения­ми, позволяющими передавать данные о подписке. Однако представляется, что его реализация имеет ряд недостатков, а именно:

  • не все издатели, особенно зарубежные, согла­сятся на такой индивидуальный режим постав­ки данных;
  • данные о подписанных изданиях и периодах доступа в коллекциях очень изменчивы; есть сомнения, что они будут оперативно отражать­ся при такой схеме взаимодействия;
  • библиотека лишается контроля прописывания доступного контента, а обнаружить ошибки в нем только на основании анализа выдачи на запросы крайне сложно.

Тем не менее, если подписка библиотеки про­исходит в основном за счет российских ресурсов, использование российских сервисов discovery мо­жет быть приемлемым решением для нее, особен­но если учесть их низкую стоимость в сравнении с глобальными сервисами.

3. Обсуждение. Выводы

Увеличивающиеся с каждым годом сложность и многообразие контента, которым необходимо обслуживать библиотечных пользователей, не по­зволяют реализовать идеальную единую точку до­ступа для поиска всей необходимой информации. В то же время можно рекомендовать некоторые решения, обеспечивающие удовлетворительный уровень обслуживания пользователей в современ­ных условиях.

  1. Для российских научных библиотек, предо­ставляющих доступ к обширным коллекци­ям СУР, среди которых много зарубежных, в качестве основного поискового сервиса рекомендуется использование глобальных сервисов discovery: EBSCO Discovery Service (EBSCO Industries), Primo (Ex Libris), Summon (Proquest), WorldCat Discovery (OCLC).
  2. Для библиотек, использующих ограниченное количество СУР, среди которых преобладают российские, использование глобальных сер­висов discovery нецелесообразно. Основной точкой доступа для их пользователей может стать единый каталог, отражающий фонд на физических носителях и собственную элек­тронную библиотеку; дополнительными точ­ками доступа могут быть специализирован­ные поисковые сервисы российских СУР.
  3. Для всех типов библиотек необходимы до­полнительные сервисы поиска в электронных ресурсах, не охватываемых контентом основ­ной точки доступа: ресурсах открытого досту­па, ресурсах библиотек-партнеров и других.

Список литературы

1. Schonfeld R.C. Does discovery still happen in the library. Roles and Strategies for a Shifting Reality. New York: Ithaka S+R; 2015. URL: https://www.lib.umd.edu/binaries/content/assets/public/architecturelibrary/sr_briefing_discovery_20140924_0.pdf

2. Gauder B. Perceptions of Libraries, 2010: Context and Community. A Report to the OCLC Membership. OCLC Online Computer Library Center, Inc.; 2011. URL: https://www.oclc.org/en/reports/2010perceptions.html

3. Breeding M. The future of library resource discovery. NISO Whitepapers. Baltimore: NISO; 2015. URL: https://www.niso.org/publications/future-library-resource-discovery

4. Литвинова Н.Н. Проблемы внедрения поисковых сервисов типа Discovery в библиотеках. Библиотековедение, 2013;6:41–45.

5. The OpenURL Framework for Context-Sensitive Services, ANSI/NISO Z39.88-2004 (R2010). Bethesda, MD: NISO; 2004 (reaffirmed 2010). URL: https://www.niso.org/publications/z3988-2004-r2010- openurl-framework-context-sensitive-services

6. Gardner T., Inger S. How Readers Discover Content in Scholarly Publications: Trends in Behaviour from 2005–2015. Abingdon, United Kingdom: Renew Training; 2016. URL: http://www.simoningerconsulting.com/how_readers_ discover.html

7. Bradley A.L. Addressing a Discovery Tool’s Shortcomings with a Supplemental Health Sciences-Specific Federated Search Engine. Journal of Electronic Resources in Medical Libraries. 2017;14(3–4):101–113. https://doi.org/10.1080/15424 065.2017.1368425

8. Bull S., Craft E., Dodds A. Evaluation of a Resource Discovery Service: FindIt@Bham. New Review of Academic Librarianship. 2014;20(2):137–166. https://doi.org/10.1080/13614533.2014.897238

9. Guajardo R., Brett K., Young F. The evolution of discovery systems in academic libraries: A case study at the University of Houston libraries. Journal of Electronic Resources Librarianship. 2017;29(1):16–23. https://doi.org/10.1080/1941126X.2017.1270097

10. Jantzi L., Richard J., Wong S. Managing Discovery and Linking Services. The Serials Librarian. 2016;70(1–4):184–197. https://doi.org/10.1080/0361526X.20161153331

11. Zhu J., Kelley J. Collaborating to Reduce Content Gaps in Discovery: What Publishers, Discovery Service Providers, and Libraries Can Do to Close the Gaps. Science & Technology Libraries. 2015;34(4):315–328. https://doi.org/10.1080/0194262X.2015.1102677

12. Nichols A.F., Crist E., Sherriff G., Allison M. What Does It Take to Make Discovery a Success? A Survey of Discovery Tool Adoption, Instruction, and Evaluation Among Academic Libraries. Journal of Web Librarianship. 2017;11(2):85–104. https://doi.org/10.1080/19322909.2017.1284632


Об авторе

Н. Н. Литвинова
Некоммерческое партнерство «Национальный электронно-информационный консорциум»; Российская государственная библиотека
Россия

канд. филол. наук, эксперт, ул. Летниковская, д. 4, стр. 5, офис 2.4, г. Москва, 116114;

главный библиотекарь, ул. Воздвиженка, д. 3/5, г. Москва, 190019



Рецензия

Для цитирования:


Литвинова Н.Н. ОРГАНИЗАЦИЯ ЕДИНОЙ ТОЧКИ ДОСТУПА К РЕСУРСАМ БИБЛИОТЕКИ: ПОИСК ВАРИАНТОВ РЕАЛИЗАЦИИ. Наука и научная информация. 2018;1(1):60-66. https://doi.org/10.24108/2658-3143-2018-1-1-60-66

For citation:


Litvinova N.N. ONE-STOP ACCESS POINT TO LIBRARY RESOURCES: IN SEARCH OF REALIZATION. Scholarly Research and Information. 2018;1(1):60-66. (In Russ.) https://doi.org/10.24108/2658-3143-2018-1-1-60-66

Просмотров: 4673


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2658-3143 (Online)