Перейти к:
ОРГАНИЗАЦИЯ ЕДИНОЙ ТОЧКИ ДОСТУПА К РЕСУРСАМ БИБЛИОТЕКИ: ПОИСК ВАРИАНТОВ РЕАЛИЗАЦИИ
https://doi.org/10.24108/2658-3143-2018-1-1-60-66
Аннотация
Ключевые слова
Для цитирования:
Литвинова Н.Н. ОРГАНИЗАЦИЯ ЕДИНОЙ ТОЧКИ ДОСТУПА К РЕСУРСАМ БИБЛИОТЕКИ: ПОИСК ВАРИАНТОВ РЕАЛИЗАЦИИ. Наука и научная информация. 2018;1(1):60-66. https://doi.org/10.24108/2658-3143-2018-1-1-60-66
For citation:
Litvinova N.N. ONE-STOP ACCESS POINT TO LIBRARY RESOURCES: IN SEARCH OF REALIZATION. Scholarly Research and Information. 2018;1(1):60-66. (In Russ.) https://doi.org/10.24108/2658-3143-2018-1-1-60-66
1. Введение и обзор литературы
За последние 30–40 лет ресурсы библиотек претерпели существенные изменения в связи с бурным развитием информационных технологий. Сначала библиотеки имели дело с электронными документами, которые были сходны с традиционными печатными документами, по крайней мере, в том, что они либо поступали на физических носителях (компакт-дисках), либо в виде файлов для размещения на библиотечных серверах. Благодаря этому они полностью контролировались библиотеками, что позволяло успешно решать некоторые проблемы в их описании для справочно- поискового аппарата и в учете их как части библиотечного фонда. В 1990-е годы библиотеки начали оформлять в доступ (лицензировать) новый вид электронных ресурсов, размещенных на технических средствах других организаций: издательств, агрегаторов, научных обществ и других контент- провайдеров. Такие лицензионные ресурсы (ЛР) библиотеки не контролировали: их состав мог изменяться на протяжении периода лицензирования, а включенные в них документы содержали готовые библиографические записи с метаданными, по которым можно было вести поиск через интерфейсы контент- провайдеров.
Создалась ситуация, при которой пользователи библиотек, войдя на библиотечный сайт, были вынуждены искать нужные документы, пользуясь целым рядом различных окон поиска:
- в электронном каталоге, раскрывающем в основном традиционный печатный фонд;
- в электронном каталоге электронной библиотеки (ЭБ); в некоторых организациях описания объектов ЭБ включили в единый электронный каталог библиотеки, обеспечив аналитическую роспись статей и частей документов;
- в окнах поиска во множестве лицензионных ресурсов;
- в глобальных поисковых сервисах интернета, через которые можно найти большое количество документов в свободном доступе.
Такая ситуация привела к значительному оттоку пользователей с библиотечных сайтов в сторону глобальных поисковых сервисов Google, Yandex и подобных, с тревогой отмеченному в ряде исследований [1, 2]. Для формирования единого поискового пространства для разнородных ресурсов библиотек в начале 2010-х годов были разработаны сервисы discovery (см., например, [3, 4]). В настоящее время они широко используются в библиотеках всего мира. Четыре наиболее известных коммерческих сервиса discovery Summon (ProQuest), EBSCO discovery service (Ebsco Industries), Primo (Ex Libris) и WorldCat Discovery Service (OCLC) используются в сотнях зарубежных библиотек и в десятках крупных библиотек России. Описания этих сервисов можно найти на сайтах компаний-разработчиков, приведенных в скобках после названий сервисов.
2. Сервисы discovery как реализация единого поискового окна
Успешное функционирование сервиса discovery обеспечивают три важных компонента:
- индекс сервиса — собранный и проиндексированный контент большого количества ресурсов, как непосредственно контролируемых библиотекой, так и сетевых удаленных ресурсов (СУР), имеющихся в доступе, лицензионном или свободном;
- структурированная база знаний о потенциально доступных библиотекам сетевых удаленных ресурсах;
- определитель ссылок (link resolver) — программный продукт, который устанавливает связь между описанием документа в выдаче сервиса discovery на запрос (источником) и полным текстом этого документа на платформе контент-провайдера (целью) с учетом доступности ресурсов в данной библиотеке, зафиксированной ее сотрудниками в базе знаний.
Для интеграции электронного каталога библиотеки в индекс сервиса discovery важно, чтобы он был реализован на программном обеспечении, совместимом с сервисом discovery; желательно также, чтобы в ЭК использовался MARC-подобный формат. Если эти условия выполнены, интеграция проходит довольно легко, и в дальнейшем обновление индекса осуществляется в полуавтоматическом режиме. Гораздо сложнее ситуация с интеграцией сетевых удаленных ресурсов. Она происходит через настройку базы знаний, реализуемую в несколько последовательных шагов:
- выбор в базе знаний провайдеров и коллекций, к которым имеет доступ библиотека;
- выбор в коллекциях изданий, актуальных для библиотеки, и актуальных периодов доступа к ним;
- в случае необходимости — подгрузка названий изданий для коллекций, не включенных в базу знаний.
Правильная настройка базы знаний обеспечивает ссылки из результатов поиска на те документы, к которым у данной библиотеки есть доступ на уровне полных текстов. Эти ссылки реализуются с помощью определителя ссылок (link resolver). Основная модель работы определителя ссылок — через стандарт OpenURL [5], то есть сравнением метаданных библиографических записей в результатах поиска с метаданными полнотекстовых документов в доступных ресурсах. Именно наличие ссылок только на доступный контент определяет преимущество сервисов discovery перед обычными поисковыми сервисами Google (Google Scholar), Yandex и другими, в которых ссылки никак не маркированы — и пользователь не знает, откроется ли для него полный текст.
Настройка базы знаний в библиотеке, которая лицензирует большое количество разнообразных ресурсов, а также стремится интегрировать в ресурсную базу поиска важные для нее коллекции открытого доступа, — сложный и трудоемкий процесс. Он имеет постоянный характер, поскольку сетевые удаленные ресурсы очень изменчивы как по составу лицензируемых коллекций, так и по их наполнению.
Библиотеки возлагают большие надежды на внедрение сервисов discovery. Правильно настроенные, они действительно обеспечивают удобный поиск из одной точки в большинстве ресурсов, доступных пользователям библиотеки. Благодаря этому в последние годы наблюдается рост популярности библиотечных сайтов как отправной точки для тематического поиска документов, отмеченный, в частности, в глобальном исследовании компании Simon Inger Consulting [6]. Однако сервисы discovery не свободны от недостатков, которые не позволяют рассматривать их как универсальное решение, обеспечивающее исчерпывающие результаты поиска.
Главным недостатком discovery-сервисов является невозможность обеспечить полноту индексируемого контента. Глобальные сервисы сотрудничают с тысячами контент-провайдеров по всему миру, но не могут обеспечить полный охват так называемых локальных издателей, особенно если их продукция издается не на английском языке, тем более — с использованием алфавитов, отличных от латинского. Этот недостаток имеет большое значение для российских библиотек. Поэтому в последние годы они целенаправленно работают с командой EBSCO discovery service, самого популярного в России, и добились включения в индекс сервиса более десятка популярных российских ресурсов.
Менее очевидные недостатки контентного наполнения индексов discovery обнаруживаются на детальном уровне прописывания доступного контента библиотеками. Нередко в базе знаний продукция издательств представлена в недостаточно структурированном виде, например в ней не выделены тематические коллекции. Библиотеки, подписавшиеся на такие коллекции, вынуждены выбирать издания из общего списка. Неразрешимой пока проблемой является отражение доступности отдельных структурных элементов (в основном, статей) в изданиях, которые как целое библиотеке недоступны.
Эффективность функционирования систем discovery в библиотеках, проблемы, возникающие при их внедрении и использовании, рассматривались в ряде публикаций [7–10] как на уровне опыта отдельных библиотек, так и в сопоставлении результатов по нескольким сервисам и нескольким вариантам внедрения. Наиболее исчерпывающим исследованием сопоставительного характера является, на наш взгляд, статья группы авторов, представляющих издательство Institute of Electrical and Electronics Engineers (IEEE) [11]. Заметим, что корректная работа сервисов discovery, обеспечивающая максимально удобный путь пользователя от запроса до издательского контента, заботит не только библиотекарей, но и представителей издательского сообщества: любые осложнения на этом пути могут привести к оттоку пользователей с их сайтов и поиску иных вариантов получения контента, не исключающих и пиратских. Об этом говорит, в частности, популярность SciHub.
Авторы из IEEE проанализировали потери издательского контента на пути к библиотечным пользователям через сервисы discovery и поте-ри пользователей при поиске. В сотрудничестве с разработчиками четырех основных сервисов discovery, которым IEEE поставляет свой контент, и с четырьмя группами библиотек, внедрившими эти сервисы, они определили количество полных текстов IEEE, доступных пользователям этих библиотек в соответствии с их настройками базы знаний. Библиотеки были отобраны таким образом, чтобы их подписка на ресурсы IEEE совпадала: всем 22 библиотекам были доступны журналы, материалы конференций и стандарты за одинаковый период. Результаты представлены на рис. 1.
Рис. 1. Сравнение количества доступных полных текстов IEEE в четырех группах библиотек
Fig. 1. Comparison of available IEEE full texts in four library groups
Необходимые пояснения к рисунку:
а) сервисы discovery анонимны, они обозначаются буквами A, B, C и D;
б) красная горизонтальная линия показывает количество библиографических записей (метаданных) и полных текстов, которые IEEE выложило по ftp для каждого из четырех сервисов discovery: около 3,4 миллиона;
в) вертикальные столбцы показывают количество библиографических записей на полнотекстовые документы IEEE, доступные для поиска через discovery пользователям библиотек;
г) библиографические записи на документы IEEE могут поступать не только от издателя, но и из реферативно-библиографических баз данных; при выдаче на запрос дублирование записей устраняется, но не полностью, поэтому может иметь место даже превышение этого количества записей в выдаче над количеством реально поставленных полных текстов, как в первом столбце «зеленой группы» библиотек.
О чем говорят данные, представленные на рисунке? Во-первых, ни один из сервисов discovery не включил в свой индекс всех записей, предоставленных издателем: большинство столбцов не достигают красной линии, а единственный случай превышения объясняется дублированием записей. Во-вторых, данные первых трех групп говорят о том, что библиотеки, пользующиеся одним и тем же сервисом, предоставляют своим пользователям различное количество записей, доступных для поиска; небольшое различие можно объяснить разницей в количестве дублирующихся записей, но различие в разы явно говорит об ошибках в настройках библиотеками доступных издательских продуктов: как выяснилось, в нескольких из них не был прописан доступ к коллекциям материалов конференций и/или стандартов. В-третьих, низкие результаты всех библиотек группы D свидетельствуют о том, что у сервиса D самые большие проблемы с включением в свой индекс библиографических записей издателя; такие проблемы могут быть обусловлены техническими сбоями, несогласованностью форматов и другими причинами. Во всех случаях издательство работает с сервисами, чтобы обеспечить максимальную полноту предоставления своего контента пользователям библиотек.
В 2016 году библиотекари университета штата Вермонт провели анкетирование руководителей справочно-библиографических служб 56 библиотек университетов США, Канады и Великобритании с целью выяснить различные аспекты внедрения, поддержки и функционирования сервисов discovery [12]. Особое внимание было уделено оценке результатов внедрения, степени удовлетворенности или неудовлетворенности ими и причинам, которые вызвали воодушевление от успеха или разочарование из-за неожиданно слабых результатов. Оценка в целом высокая: 45 % опрошенных оценили результат внедрения как положительный и 26 % — как в основном положительный.
Вывод, который сделали исследователи, прост: чтобы внедрение было успешным, необходимо сформировать специальную команду, которая сосредоточится на этапе внедрения, а затем — на поддержке сервиса: актуализации доступных ресурсов и входящих в них изданий, внедрении новых опций, организации обучения пользователей и обратной связи с ними. Этот вывод может показаться очевидным только на первый взгляд. На деле за ним стоит глубокий анализ опыта коллективов научных библиотек. Выбирая сервис discovery и возлагая на него большие надежды, подкрепленные рекламными выступлениями представителей компаний-разработчиков, сотрудники библиотек нередко не представляют реальный объем работы, необходимой для успешного внедрения и функционирования этих достаточно сложных сервисов. Компания-разработчик обеспечивает поддержку и первичную настройку сервиса, но эта настройка базируется на списке ресурсов, доступных данной библиотеке, и не может учитывать все детали подписки на контент: доступные периоды, иногда прерывистые, сохранение архивных прав в случае прекращения доступа, локальные ресурсы и многое другое. Проработка этих тонких настроек целиком зависит от библиотеки, так же как и эффективное обучение и поддержка пользователей. Респонденты, негативно оценившие результаты внедрения, честно признали, что не уделили достаточного внимания всем аспектам реализации сервиса.
Сказанное выше особенно актуально для российских библиотек. Они должны с особым вниманием отнестись к специфическим проблемам учета российского контента в сервисах discovery. Как было сказано выше, за последние годы состоялось включение многих научно значимых российских ресурсов, по крайней мере, в индекс EBSCO Discovery Service (EDS). Но проблемы остаются. Для ряда ресурсов перечни доступных изданий недостаточно структурированы. Библиотеки, подписанные на небольшие тематические пакеты, не могут прописать их как таковые в базе знаний и вынуждены выбирать доступные издания из общей коллекции, содержащей тысячи и десятки тысяч названий. Еще более серьезной проблемой является то, что российские контент-провайдеры не поддерживают ссылки на полные тексты по стандарту OpenURL, обеспечивающему сравнение метаданных библиографических записей в результатах поиска в сервисе discovery с метаданными полнотекстовых документов на сайтах провайдеров. В качестве альтернативы используются специально созданные пользовательские ссылки (Custom Links), которые сравнивают статичные идентификаторы записей. Любая смена идентификатора у контент-провайдера, которая не сразу сообщается в сервис discovery или вообще не сообщается, влечет за собой отказ в доступе к документу. Сейчас во всем мире набирает популярность работа ссылок на основе сравнения DOI. Но большинство документов в российских ресурсах не содержит DOI — и проблема ссылок остается.
Проблема точности отражения доступного контента в базе знаний сервиса discovery проявилась в последнее десятилетие в новом аспекте. В БЗ можно отразить доступность только на уровне изданий: книг, журналов, их томов и выпусков. Доступность отдельных статей в так называемых гибридных журналах, публикующих в открытом доступе статьи, за работу с которыми издательство получило оплату (Article Processing Charge), прописать невозможно. В результате пользователи не видят в результатах поиска индикации доступности статей из гибридных журналов, которые не входят в подписку библиотеки. Приходится открывать детальные описания статей и надеяться на то, что специальные браузерные расширения Unpaywall или Open Access Button покажут наличие статьи в открытом доступе.
Особая тема в использовании сервисов discovery в России — российские разработки подобных сервисов, активно предлагаемые на библиотечном рынке. Их кардинальное отличие от глобальных сервисов discovery заключается в том, что они не используют базу знаний — и библиотеки не настраивают ее самостоятельно под свою подписку. Разработчики таких сервисов, по сути, берут на себя всю настройку доступного контента по заказу конкретной библиотеки, взаимодействуя с контент-провайдерами и получая от них информацию о ее подписках. Такой подход, в принципе, возможен, хотя, безусловно, он должен подкрепляться соответствующими трехсторонними соглашениями, позволяющими передавать данные о подписке. Однако представляется, что его реализация имеет ряд недостатков, а именно:
- не все издатели, особенно зарубежные, согласятся на такой индивидуальный режим поставки данных;
- данные о подписанных изданиях и периодах доступа в коллекциях очень изменчивы; есть сомнения, что они будут оперативно отражаться при такой схеме взаимодействия;
- библиотека лишается контроля прописывания доступного контента, а обнаружить ошибки в нем только на основании анализа выдачи на запросы крайне сложно.
Тем не менее, если подписка библиотеки происходит в основном за счет российских ресурсов, использование российских сервисов discovery может быть приемлемым решением для нее, особенно если учесть их низкую стоимость в сравнении с глобальными сервисами.
3. Обсуждение. Выводы
Увеличивающиеся с каждым годом сложность и многообразие контента, которым необходимо обслуживать библиотечных пользователей, не позволяют реализовать идеальную единую точку доступа для поиска всей необходимой информации. В то же время можно рекомендовать некоторые решения, обеспечивающие удовлетворительный уровень обслуживания пользователей в современных условиях.
- Для российских научных библиотек, предоставляющих доступ к обширным коллекциям СУР, среди которых много зарубежных, в качестве основного поискового сервиса рекомендуется использование глобальных сервисов discovery: EBSCO Discovery Service (EBSCO Industries), Primo (Ex Libris), Summon (Proquest), WorldCat Discovery (OCLC).
- Для библиотек, использующих ограниченное количество СУР, среди которых преобладают российские, использование глобальных сервисов discovery нецелесообразно. Основной точкой доступа для их пользователей может стать единый каталог, отражающий фонд на физических носителях и собственную электронную библиотеку; дополнительными точками доступа могут быть специализированные поисковые сервисы российских СУР.
- Для всех типов библиотек необходимы дополнительные сервисы поиска в электронных ресурсах, не охватываемых контентом основной точки доступа: ресурсах открытого доступа, ресурсах библиотек-партнеров и других.
Список литературы
1. Schonfeld R.C. Does discovery still happen in the library. Roles and Strategies for a Shifting Reality. New York: Ithaka S+R; 2015. URL: https://www.lib.umd.edu/binaries/content/assets/public/architecturelibrary/sr_briefing_discovery_20140924_0.pdf
2. Gauder B. Perceptions of Libraries, 2010: Context and Community. A Report to the OCLC Membership. OCLC Online Computer Library Center, Inc.; 2011. URL: https://www.oclc.org/en/reports/2010perceptions.html
3. Breeding M. The future of library resource discovery. NISO Whitepapers. Baltimore: NISO; 2015. URL: https://www.niso.org/publications/future-library-resource-discovery
4. Литвинова Н.Н. Проблемы внедрения поисковых сервисов типа Discovery в библиотеках. Библиотековедение, 2013;6:41–45.
5. The OpenURL Framework for Context-Sensitive Services, ANSI/NISO Z39.88-2004 (R2010). Bethesda, MD: NISO; 2004 (reaffirmed 2010). URL: https://www.niso.org/publications/z3988-2004-r2010- openurl-framework-context-sensitive-services
6. Gardner T., Inger S. How Readers Discover Content in Scholarly Publications: Trends in Behaviour from 2005–2015. Abingdon, United Kingdom: Renew Training; 2016. URL: http://www.simoningerconsulting.com/how_readers_ discover.html
7. Bradley A.L. Addressing a Discovery Tool’s Shortcomings with a Supplemental Health Sciences-Specific Federated Search Engine. Journal of Electronic Resources in Medical Libraries. 2017;14(3–4):101–113. https://doi.org/10.1080/15424 065.2017.1368425
8. Bull S., Craft E., Dodds A. Evaluation of a Resource Discovery Service: FindIt@Bham. New Review of Academic Librarianship. 2014;20(2):137–166. https://doi.org/10.1080/13614533.2014.897238
9. Guajardo R., Brett K., Young F. The evolution of discovery systems in academic libraries: A case study at the University of Houston libraries. Journal of Electronic Resources Librarianship. 2017;29(1):16–23. https://doi.org/10.1080/1941126X.2017.1270097
10. Jantzi L., Richard J., Wong S. Managing Discovery and Linking Services. The Serials Librarian. 2016;70(1–4):184–197. https://doi.org/10.1080/0361526X.20161153331
11. Zhu J., Kelley J. Collaborating to Reduce Content Gaps in Discovery: What Publishers, Discovery Service Providers, and Libraries Can Do to Close the Gaps. Science & Technology Libraries. 2015;34(4):315–328. https://doi.org/10.1080/0194262X.2015.1102677
12. Nichols A.F., Crist E., Sherriff G., Allison M. What Does It Take to Make Discovery a Success? A Survey of Discovery Tool Adoption, Instruction, and Evaluation Among Academic Libraries. Journal of Web Librarianship. 2017;11(2):85–104. https://doi.org/10.1080/19322909.2017.1284632
Об авторе
Н. Н. ЛитвиноваРоссия
канд. филол. наук, эксперт, ул. Летниковская, д. 4, стр. 5, офис 2.4, г. Москва, 116114;
главный библиотекарь, ул. Воздвиженка, д. 3/5, г. Москва, 190019
Рецензия
Для цитирования:
Литвинова Н.Н. ОРГАНИЗАЦИЯ ЕДИНОЙ ТОЧКИ ДОСТУПА К РЕСУРСАМ БИБЛИОТЕКИ: ПОИСК ВАРИАНТОВ РЕАЛИЗАЦИИ. Наука и научная информация. 2018;1(1):60-66. https://doi.org/10.24108/2658-3143-2018-1-1-60-66
For citation:
Litvinova N.N. ONE-STOP ACCESS POINT TO LIBRARY RESOURCES: IN SEARCH OF REALIZATION. Scholarly Research and Information. 2018;1(1):60-66. (In Russ.) https://doi.org/10.24108/2658-3143-2018-1-1-60-66