Перейти к:
СБОР И АНАЛИЗ СТАТИСТИКИ ИСПОЛЬЗОВАНИЯ ЭЛЕКТРОННЫХ РЕСУРСОВ ПО COUNTER 5
https://doi.org/10.24108/2658-3143-2019-2-3-157-166
Аннотация
Ключевые слова
Для цитирования:
Литвинова Н.Н. СБОР И АНАЛИЗ СТАТИСТИКИ ИСПОЛЬЗОВАНИЯ ЭЛЕКТРОННЫХ РЕСУРСОВ ПО COUNTER 5. Наука и научная информация. 2019;2(3):157-166. https://doi.org/10.24108/2658-3143-2019-2-3-157-166
For citation:
Litvinova N.N. COLLECTION AND ANALYSIS OF ELECTRONIC RESOURCE USAGE STATISTICS ACCORDING TO COUNTER 5. Scholarly Research and Information. 2019;2(3):157-166. (In Russ.) https://doi.org/10.24108/2658-3143-2019-2-3-157-166
-
Введение
С начала 90-х годов прошлого века, когда библиотеки начали активно использовать лицензионные электронные ресурсы (ЭР), встал вопрос о том, как измерять это использование. Традиционные единицы библиотечной статистики, такие как книговыдача, не подходили: во-первых, единицы использования были другими (не физически выданные книги, журналы, рукописи и подобные документы, а выгруженные статьи, библиографические записи, книги и/или главы из книг), во-вторых, фиксация использования происходила не в библиотеках, а на серверах контент-провайдеров: издателей и агрегаторов. Проблема выработки новых согласованных метрик и стандартизованных форм отчетов, которые контент-провайдеры обязались предоставлять библиотекам-пользователям, решалась совместными усилиями западного библиотечного и издательского сообщества. В результате в 2002 году была создана организация COUNTER (Counting Online Usage of NeTworked Electronic Resources), а в 2003 году появился практический кодекс (code of practice) COUNTER, который фактически стал стандартом индустрии электронных ресурсов. Сейчас более сотни контент-провайдеров по всему миру соблюдают этот стандарт, пройдя процедуру аудита в COUNTER. Это крупнейшие мировые издательства и агрегаторы электронной научной информации. Многие локальные издатели, не проходя формально аудит, тем не менее придерживаются правил и процедур генерации статистических отчетов, описанных на сайте COUNTER (https://www.projectcounter.org/) и заявляют о себе не как о COUNTER compliant (соответствующие стандарту), а как о COUNTER conformant (придерживающиеся стандарта).
C 2003 по 2018 год были последовательно введены в действие 4 версии COUNTER, широко освещавшиеся в профессиональной литературе [1-7]. Появление новых версий диктовалось логикой развития электронных ресурсов и требованиями библиотек к отражению в статистических отчетах важных аспектов использования ЭР. В первой версии были введены отчеты по использованию наиболее распространенных в то время электронных продуктов: реферативно-библиографических баз данных и журналов. В последующих версиях COUNTER появились отчеты по использованию электронных книг и мультимедиа, а также отражение в отчетах режима доступа (платные или открытые документы), разбивка использования по годам выхода журналов и другие параметры. Все нововведения отражались в новых фиксированных типах отчетов: Journal Report 1a — для статистики использования журнального архива, лицензированного библиотекой, который включает журналы за определенный период; Journal Report GOA — для статистики использования статей свободного доступа и подобные. В результате количество отчетов умножалось, достигнув к 2016 году почти тридцати, но при этом они не удовлетворяли полностью меняющиеся потребности библиотек. Например, если библиотека хотела иметь данные об использовании статей свободного доступа из архива, у нее не было возможности получить их в существующей системе. Поэтому при разработке пятой версии COUNTER была поставлена задача концептуальной переработки принципов организации данных и формируемых из них статистических отчетов. Решению этой задачи посвящен ряд публикаций [8-11].
-
Концептуальная модель COUNTER 5
Принципиально новое решение, на котором строится логика и архитектура COUNTER 5 — выделение ограниченного перечня объектов, для которых определяются основные метрики; объекты имеют ряд атрибутов, допускающих свободное комбинирование. В этой ситуации у библиотекарей вполне резонно возникает ассоциация с переходом от громоздкой и жесткой иерархической классификации к фасетной, которая позволяет комбинировать разные признаки объектов.
2.1. Объекты
Разработчиками стандарта выделены 4 типа объектов, использование которых измеряется и отражается в статистических отчетах: Platform, Database, Title и Item. Каждый из них определяется в словаре (Glossary, Appendix A) и сопровождается примерами. Следует оговорить, что здесь и далее будут использоваться в основном англоязычные термины из текста стандарта, поскольку для многих из них пока нет устоявшихся русскоязычных аналогов. И если на уровне основных объектов термины «platform» и «database» имеют соответствующие привычные русские термины «платформа» и «база данных», то для «title» и «item» таких соответствий нет. В контексте COUNTER 5 эти термины используются в следующих значениях:
- Title— для обозначения аналогов традиционных библиотечных изданий: журналов, книг, отчетов и подобных;
- Item— для обозначения конечных единиц контента, к которым возможно непосредственное обращение пользователей: чтение, просмотр, выгрузка; это статьи, главы, библиографические записи, аннотации, списки использованной литературы и подобные.
Для этих типов объектов в COUNTER 5 предлагается четыре типа статистических отчетов, которые называются Master Reports и для которых можно задавать наборы желаемых параметров и выбирать нужные метрики. Эти отчеты перечислены ниже.
Platform Master Report — для вывода данных об использовании платформы, на которой могут размещаться несколько различных баз данных.
Database Master Report — для данных об использовании баз данных: реферативно-библиографических, полнотекстовых и смешанных.
Title Master Report — для данных об использовании аналогов традиционных библиотечных изданий: журналов, книг, отчетов и подобных.
Item Master Report — для данных об использовании более дробных объектов: статей, глав, разделов, аннотаций и других.
2.2. Метрики
Следующий элемент модели — метрики, то есть единицы измерения использования соответствующих объектов. Предложено использовать 12 метрик, которые можно объединить в группы по содержанию и принципу применимости к различным объектам.
Для объектов Platform и Database основная метрика — «searches», запросы. Запросы дифференцируются в зависимости от того, адресованы ли они платформе целиком (searches_ platform), то есть всему контенту, размещенному на платформе, или отдельным базам данных (БД). Для последних выделяются три типа поисков в зависимости от метода ведения поиска: человеком, целенаправленно обратившимся к базе данных (searches_regular), федеративным (распределенным) поиском в нескольких БД (searches_federated) или сервисом типа discovery по единому индексу из одного интерфейса (searches_automated).
6 метрик, относящихся к объектам типа Item, группируются по следующим признакам.
- По способу действий с объектом противопоставляются метрики типа «investigation» (изучение, ознакомление) и «request» (выгрузка, требование). Первая метрика — шире, она подразумевает изучение объекта на всех уровнях, то есть обращение к его детальному описанию (аннотации, списку литературы), активацию ссылок от объекта и, наконец, открытие полного текста или мультимедиа. Последнее действие подпадает под категорию «request». Для «investigations» и «requests» подсчитываются общее количество действий с объектами (total_item_investigations, total_item_requests) и количество действий с уникальными объектами (unique_item_ investigations, unique_item_requests). Это означает, что любые действия пользователя с объектом во время открытой им сессии будут суммироваться для подсчета в метрике типа «total», а в метрике типа «unique» это будет считаться одним обращением к объекту. Важность противопоставления «total — unique» очевидна для метрики типа «investigation», поскольку обращений к детальным элементам описания объекта часто больше одного. Но это противопоставление не менее важно и для метрики типа request, поскольку выгрузки объекта могут быть в различных форматах: html, pdf и их модификациях.
- По причине отказа в доступе к единице контента (Item) выделяются две метрики: «no_ license» для подсчета попыток выгрузки объекта, не входящего в подписку организации пользователя, и «limit_exceeded» для подсчета попыток выгрузки, отвергнутых из-за превышения лицензионного лимита одновременного обращения пользователей к ресурсу.
Для объектов типа Title применяются две метрики, аналогичные метрикам первого типа для уникальных объектов типа «Item»: «unique_ title_investigations» и «unique_title_requests».
Метрики для объектов типа Item и Title используются и в отчетах для объектов типов Platform и Database для демонстрации суммарного использования в этих объектах их наполнения: журналов, книг, отчетов, библиографических записей, аннотаций и других элементов.
2.3. Атрибуты
Применение атрибутов позволяет детализировать объекты по различным признакам и получать статистику использования подгрупп объектов, объединенных заданными значениями атрибутов. COUNTER 5 вводит 5 категорий атрибутов.
- Data_type — типы данных, заданные списком. Список включает как традиционные типы (книга, журнал, отчет), так и актуальные в последние годы мультимедиа, наборы данных (datasets), объекты репозиториев (repositoryitems) и другие, в том числе «other» для обозначения типов, не подпадающих под имеющиеся элементы списка.
- Section_type — атрибут, позволяющий детализировать данные по типам составных частей, на которые разбит объект типа Title. Его применение актуально для оценки использования книжных коллекций, которые представляют контент либо в виде книги целиком, либо в виде совокупности глав и разделов.
- Access_type характеризует режим доступа к документам на момент его публикации. Согласовано использование трех фиксированных значений этого атрибута: «controlled» (доступ предоставляется только подписчикам), «OA gold» (свободный доступ как к документам из полностью открытых изданий, так и из гибридных) и «other_free_to_read» (другие варианты свободного доступа). Последний атрибут применяется только для репозиториев.
- Access_method — метод доступа: «regular» (регулярный, то есть доступ пользователя-человека через стандартные опции интерфейса) и «TDM» (textanddatamining, то есть анализ текстов специальными программными средствами, позволяющими анализировать большие объемы текстовой информации с целью выявления семантических связей, статистических характеристик и других свойств текстов).
- Year_of_publication (YOP) — четырехсимвольный год издания документа; если он неизвестен, ставится «0001», если документ еще не вышел (articleinpress) — «9999».
3. Данные статистических отчетов Counter 5 в сравнении с отчетами предыдущей версии: проблемы интерпретации и сравнения
Как ясно из описания концептуальной модели COUNTER 5, она является достаточно абстрактной на уровне объектов и метрик. Их названия нейтральны, то есть не привязаны, как раньше, к определенным видам документов и определенным вариантам использования. Конкретизация происходит только на этапе выбора атрибутов для формирования желаемого статистического отчета. Свобода выбора параметров отчетов не может эффективно использоваться без понимания того, какие атрибуты доступны и каким целям анализа они могут служить.
Разработчики стандарта постарались не оставить пользователей один на один с проблемой выбора и предусмотрели несколько типов отчетов, формируемых на основе отчетов Master с фиксированным набором метрик и атрибутов, полезных в типовых ситуациях анализа использования лицензионных ресурсов. Ниже мы кратко рассмотрим возможности генерации и анализа отчетов для каждого из четырех типов объектов. Детально изучить их можно на сайте COUNTER, странице, посвященной отчетам COUNTER 5: https://www. proiectcounter.org/code-of-practice-five-sections/4- 1-usage-reports/.
3.1. Platform — возможности и типовые отчеты
Отчеты по использованию платформы предоставляют самые общие данные по суммарной активности пользователей организации на определенной платформе, например Science Direct. Такой отчет имеет смысл использовать, если в доступе организации — более одной базы данных на платформе. Рекомендованный набор из семи метрик для отчета Platform Master Report (PR) включает «searches_platform», две пары метрик типа «investigations» и «requests» для Item и пара метрик типа «unique investigations» и «unique requests» для Title. Применимые атрибуты — «Data_type» и «Access_method».
Стандартный отчет PR_P1 оставляет только четыре метрики: «searches_platform», «total_item_ requests», «unique_item_requests» и «unique_title_ requests».
Использование атрибута «Data_type» в отчете PR позволяет дифференцировать использование по типам документов, которые можно вынести в отдельный столбец, сформировав сводную таблицу Excel, как показано в таблице 1.
Data Type |
Searches_Platform |
Total_Item_ Investigations |
Unique_Item_ Investigations |
Total_Item_ Requests |
Unique_Item_ Requests |
Unique_Title_ Investigations |
Unique_Title_ Requests |
---|---|---|---|---|---|---|---|
Book |
|
447 |
376 |
283 |
237 |
95 |
48 |
Journal |
|
2871 |
1745 |
2627 |
1599 |
|
|
Platform |
785 |
|
|
|
|
|
|
Totals |
785 |
3318 |
2121 |
2910 |
1836 |
95 |
48 |
Рис. 1. Статистический отчет Platform Master Report для платформы Science Direct с семью типами метрик и атрибутом «Data_type»
Fig. 1. Platform Master Report for Science Direct platform including 7 metric types and Data_type attribute
Прокомментируем разницу в значениях метрик типов «Total» и «Unique». Во всех случаях первые существенно превосходят вторые, что понятно: изучение одного уникального объекта часто предполагает обращение к нескольким элементам его описания, включая просмотр полного текста в формате html с последующей выгрузкой его в предпочтительном формате хранения, чаще всего в pdf. Какую из метрик считать основной для оценки эффективности использования ресурса, в том числе экономической? Этот вопрос не имеет однозначного ответа, все зависит от цели анализа. Для расчета стоимости выгрузки из полнотекстовых журнальных ресурсов разработчики COUNTER 5 рекомендуют в качестве основной метрики «unique_item_requests»; именно она показывает количество выгрузок статей как содержательных объектов, абстрагируясь от различных форматов представления контента. Как было отмечено в литературе [12], разница в интерфейсах издателей приводит к тому, что пользователи иногда имеют возможность перейти к полному тексту статьи в pdf непосредственно от содержания выпуска журнала или результатов поиска, а иногда — только открыв предварительно полный текст в формате html. В последнем случае количество выгрузок в COUNTER 4 считалось равным двум; в COUNTER 5 будет учтено две выгрузки по метрике «total_item_requests» и только одна — по метрике «unique_item_requests». Как следствие, показатели использования по новому стандарту снизятся по сравнению с данными предыдущего года, сгенерированными по COUNTER 4, а значит, снизится и рассчитанная экономическая эффективность подписки. В то же время сопоставимым останется показатель «total_item_requests».
Сложнее обстоит дело с оценкой использования книжных коллекций. Если журнальные коллекции организованы у западных контент-провайдеров единообразно, как базы данных статей, то книги — по-разному: у одних — как базы данных глав (разделов) с индивидуальными метаданными, у других — как базы данных полных текстов книг. Соответственно статистика использования книг до сих пор несопоставима даже у тех контент-провайдеров, которые соблюдают стандарт COUNTER: у одних она представлена количеством обращений к главам из книг, у других — количеством обращений к книгам. Разработчики COUNTER 5 предложили решение проблемы сопоставимости статистики использования книг на уровне метрик «title_requests». Теперь издатели, представляющие книги в виде совокупности глав, будут подсчитывать количество обращений к книгам за время одной пользовательской сессии и суммировать их. Ясно, что этот статистический показатель существенно снизится по сравнению с прошлогодним. В то же время сопоставимым останется показатель «total_item_requests».
3.2. Database — возможности и типовые отчеты
Для объекта Database предусмотрено три типа отчета: главный (Master), имеющий обозначение DR, и два стандартных: DR_D1 и DR_D2.
DR предоставляет возможность выбрать для генерации отчета 11 метрик из 12 (исключение составляет лишь «searches_platform», неприменимая на уровне базы данных) и атрибуты «Data_type» и «Access_method»; по умолчанию включаются данные для всех видов «Access_type». В таблице 2 представлен фрагмент отчета DR, преобразованный в сводку по типам метрик, показывающий использование в Российской государственной библиотеке (РГБ) баз данных на платформе компании EBSCO Industries; жирным шрифтом выделены названия полнотекстовых БД.
DR_D1 — стандартный отчет, включающий данные только для объектов, не предоставленных в свободный доступ (Access_type — regular). Предустановленный набор метрик включает три вида поисков и две метрики по использованию Items: Total_item_investigations и Total_item_requests.
Database |
Searches_ Automated |
Searches_ Regular |
Total_Item_ Investigations |
Total_ Item_ Requests |
Unique_Item_ Investigations |
Unique_ Item_ Requests |
Unique_Title_ Investigations |
Unique_ Title_ Requests |
---|---|---|---|---|---|---|---|---|
Academic Search Complete |
2 693 964 |
3267 |
2467 |
1291 |
1854 |
1139 |
2 |
2 |
Art & Architecture Source |
2 693 814 |
2502 |
377 |
179 |
251 |
144 |
1 |
1 |
Business Source Complete |
2 693 908 |
2789 |
1474 |
743 |
1010 |
638 |
16 |
15 |
Inspec |
2 675 4 84 |
2518 |
629 |
|
545 |
|
11 |
|
Library, Information |
|
|
|
|
|
|
|
|
Science & Technology |
2 693 824 |
2526 |
141 |
|
117 |
|
|
|
Abstracts |
|
|
|
|
|
|
|
|
MEDLINE |
2 693 851 |
2456 |
230 |
|
192 |
|
|
|
Newspaper Source |
2 693 778 |
2688 |
270 |
144 |
129 |
116 |
|
|
Рис. 2. Сводный отчет по использованию баз данных компании EBSCO Industries (фрагмент); жирным шрифтом выделены названия полнотекстовых БД
Fig. 2. Pivot report for EBSCO Industries databases (fragment); full text database names are in bold
DR_D2 — стандартный отчет по отказам в доступе к объектам (items) базы данных.
Оценка эффективности использования полнотекстовых баз данных базируется на количестве выгрузок полных текстов, как было сказано выше. Для реферативно-библиографических БД, где полные тексты отсутствуют, для этих целей обычно привлекаются два параметра: количество запросов, адресованных БД, и количество обращений к детальным записям, то есть, в терминах COUNTER 5, «investigations». Встает вопрос, какие именно метрики типов «searches» и «investigations» следует использовать? По «investigations» есть рекомендация разработчиков опираться на суммарные значения, то есть на «total_item_investigations». Они показывают, насколько востребованы пользователями различные опции изучения записи, в том числе ссылки для перехода к полным текстам. Что касается метрик запросов, то тут все зависит от организации использования ресурса в конкретной организации. Если пользователь целенаправленно выбирает нужную базу данных, то о ее востребованности можно судить по значению «searches_regular», если же используется федеративный (распределенный) поиск в нескольких БД, одновременно или по умолчанию отмечены несколько БД, как это сделано в РГБ, то использовать количество проведенных поисков нецелесообразно.
3.3. Title — возможности и типовые отчеты
Отчеты для объекта типа Title — наиболее интересные с точки зрения содержательного анализа использования репертуара подписки. Они предоставляют статистическую информацию на уровне конкретных изданий: журналов, книг, диссертаций, отчетов и других. С их помощью можно получить ответы на вопросы о том, какие издания наиболее востребованы, насколько равномерно распределяется спрос на издания, входящие в подписной ресурс, как меняется этот спрос во времени. Поскольку статистические отчеты содержат уникальные идентификаторы изданий (ISSN, ISBN), их можно дополнить характеристиками изданий из других баз данных, например тематикой, и выполнить важнейший анализ структуры тематического спроса.
Для объектов типа Title предусмотрено восемь типов отчетов: обобщенный Title Master Report (TR) и две группы стандартных отчетов для журналов (обозначаются TR_J) и книг (TR_B). Title Master Report позволяет сгенерировать отчет с 8 метриками (всеми, кроме метрик поиска) и полным набором атрибутов.
В таблице 3 показан небольшой фрагмент отчета TR с полным набором метрик и атрибутов для изданий на платформе Wiley Online Library. Для того чтобы рисунок уложился в страницу, из фрагмента удалены столбцы Platform, Publisher, DOI и внутренние идентификаторы изданий Wiley. На основе таких данных можно конструировать любые отчеты с нужными комбинациями атрибутов и метрик. В частности, отчет по использованию журнальных статей свободного и платного доступа по годам выхода журналов; его фрагмент для периода с 2011 года показан в таблице 4 (напомним, что обозначение года 9999 означает «article in press»). Видно, что использование статей свободного доступа в выпусках журналов последних лет возрастает. Как было сказано ранее, получить такие данные в рамках COUNTER 4 было невозможно.
Title |
ISBN |
Print_ISSN |
Online_ISSN |
Data_Type |
Section_Type |
YOP |
Access_Type |
Metric_Type |
Reporting_Period_Total |
---|---|---|---|---|---|---|---|---|---|
Anthropology Today |
|
0268-540X |
1467-8322 |
Journal |
Article |
2011 |
Controlled |
Total_Item_Investigations |
3 |
Anthropology Today |
|
0268-540X |
1467-8322 |
Journal |
Article |
2011 |
Controlled |
Total_Item_Requests |
1 |
Anthropology Today |
|
0268-540X |
1467-8322 |
Journal |
Article |
2011 |
Controlled |
Unique_Item_Investigations |
1 |
Anthropology Today |
|
0268-540X |
1467-8322 |
Journal |
Article |
2011 |
Controlled |
Unique_ltem_Requests |
1 |
Antipode |
|
0066-4812 |
1467-8330 |
Journal |
Article |
2010 |
Controlled |
Total_Item_Investigations |
3 |
Antipode |
|
0066-4812 |
1467-8330 |
Journal |
Article |
2010 |
Controlled |
Total_Item_Requests |
2 |
Antipode |
|
0066-4812 |
1467-8330 |
Journal |
Article |
2010 |
Controlled |
Unique_Item_Investigations |
1 |
Antipode |
|
0066-4812 |
1467-8330 |
Journal |
Article |
2010 |
Controlled |
Unique_ltem_Requests |
1 |
Antipode |
|
0066-4812 |
1467-8330 |
Journal |
Article |
2017 |
Controlled |
Total_Item_Investigations |
4 |
Antipode |
|
0066-4812 |
1467-8330 |
Journal |
Article |
2017 |
Controlled |
Total_ltem_Requests |
1 |
Antipode |
|
0066-4812 |
1467-8330 |
Journal |
Article |
2017 |
Controlled |
Unique_Item_Investigations |
1 |
Antipode |
|
0066-4812 |
1467-8330 |
Journal |
Article |
2017 |
Controlled |
Unique_Item_Requests |
1 |
Applied Multivariate Data Analysis, Second Edition |
978-1-118- 8748-6 |
|
|
Book |
Chapter |
2001 |
Controlled |
No_License |
1 |
Applied Multivariate Data Analysis, Second Edition |
978-1-118- 88748-6 |
|
|
Book |
Chapter |
2001 |
Controlled |
Total_Item_Investigations |
1 |
Applied Multivariate Data Analysis, Second Edition |
978-1-118- 88748-6 |
|
|
Book |
Chapter |
2001 |
Controlled |
Unique_Item_Investigations |
1 |
Applied Multivariate Data Analysis, Second Edition |
978-1-118-88748-6 |
|
|
Book |
Book |
2001 |
Controlled |
Uniquee_Title_Investigations |
1 |
Puc. 3. Фрагмент отчета TR с полным набором метрик и атрибутов
Fig. 3. TR report including complete set of metrics and attributes
Access Type — Metrics |
2011 |
2012 |
2013 |
2014 |
2015 |
2016 |
2017 |
2018 |
2019 |
9999 |
---|---|---|---|---|---|---|---|---|---|---|
Controlled |
|
|||||||||
Total_Item_Investigations |
26 |
28 |
21 |
26 |
29 |
38 |
55 |
72 |
24 |
36 |
Total_Item_Requests |
26 |
27 |
21 |
23 |
29 |
37 |
54 |
69 |
23 |
31 |
Unique_Item_Investigations |
26 |
28 |
21 |
26 |
29 |
38 |
55 |
72 |
24 |
36 |
Unique_Item_Requests |
26 |
27 |
21 |
23 |
29 |
37 |
54 |
69 |
23 |
31 |
OA_Gold |
|
|||||||||
Total_Item_Investigations |
2 |
3 |
1 |
8 |
1 |
3 |
6 |
25 |
21 |
6 |
Total_Item_Requests |
1 |
3 |
1 |
8 |
1 |
3 |
6 |
25 |
19 |
6 |
Unique_Item_Investigations |
2 |
3 |
1 |
8 |
1 |
3 |
6 |
25 |
21 |
6 |
Unique_Item_Requests |
1 |
3 |
1 |
8 |
1 |
3 |
6 |
25 |
19 |
6 |
Рис. 4. Сводные данные по использованию статей свободного и платного доступа в журналах издательства Wiley в РГБ за 4 месяца 2019 года с разбивкой по годам выпуска
Fig. 4. Pivot data on article usage (both controlled and OA_gold) for Wiley journal collection split by year of publication in RSL (four months period)
Стандартные отчеты с предустановленными значениями метрик и атрибутов предложены для решения относительно простых и часто встречающихся задач анализа статистики: TR_JR1 и TR_ BR1 — для генерации данных по использованию объектов, не предоставленных в свободный доступ; TRJR2 и TR_BR2 — для анализа отказов в доступе; TR_ JR3 и TR_BR3 — для анализа использования объектов по типам доступа и JR4 — для представления статистики использования журналов по годам их выхода.
3.4. Item — возможности и типовые отчеты
Отчеты для объектов типа Item предлагаются только для ресурсов с определенными типами контента, в которых обычно содержатся более дробные единицы, чем аналоги традиционных изданий, то есть статьи (не объединенные в выпуски и тома журналов), отдельные главы из книг, мультимедиа и подобные. К таким ресурсам относятся репозитории (в том числе репозитории наборов данных), мультимедиа и научные социальные сети.
Предусмотрено 3 типа отчетов: обобщенный отчет IR (Master) с максимальным набором атрибутов и два стандартных отчета с предустановленными параметрами: IR_A1 для статей и IR_M1 для мультимедиа.
Следует отметить, что значение репозиториев, научных сетей и мультимедиа в последние годы возрастает, однако практика предоставления стандартизованных отчетов для них только начинает утверждаться [13].
-
За рамками COUNTER
Стандарт COUNTER дает возможность организациям-пользователям получать надежную и сопоставимую статистику использования лицензионных ресурсов. Как отмечалось во введении, большинство крупных издателей и агрегаторов научного контента западных стран соблюдают этот стандарт. Но есть множество региональных игроков издательского рынка, которые если и предоставляют статистику использования своих ресурсов, то генерируют ее по собственным внутренним правилам. Такова ситуация на российском рынке: ни один российский контент-провайдер не проходил аудит COUNTER. И хотя некоторые из них заявляют, что их статистические отчеты соответствуют правилам COUNTER, это вызывает обоснованные сомнения.
Эта ситуация вызывает серьезную обеспокоенность организаций-пользователей, поскольку они не могут суммировать все данные по использованию ресурсов: для них применяются разные метрики. Например, издатели электронных книг могут давать статистику в количестве просмотренных страниц. С утверждением в России понимания лицензионных ресурсов как части библиотечного фонда [14, 15] и ввода в формы статистических отчетов о деятельности организаций показателей использования электронных ресурсов (например, в форме 6-НК) эта обеспокоенность возросла.
Представляется, что новая концептуальная модель COUNTER 5 может служить основой для разработки российским издательским сообществом единых правил генерации статистики, согласованных с COUNTER 5.
-
Обсуждение. Выводы
Стандарт COUNTER 5 кардинальным образом переработан по сравнению с предыдущими четырьмя версиями. Основа переработки — новая концептуальная модель, абстрагирующаяся от конкретных вариантов реализации электронных ресурсов и предлагающая четыре обобщенных типа объектов, для которых вводятся новые метрики и применимые атрибуты и их значения, заданные фиксированными списками. Ввод в действие нового стандарта расширит возможности организаций, пользующихся лицензионными электронными ресурсами, для выполнения количественного и качественного (содержательного) анализа подписного контента.
Столь существенная переработка привела к ряду важных следствий, которые необходимо учитывать организациям-пользователям лицензионных ресурсов.
- COUNTER 5 введен в действие с 1 января 2019 года. Это значит, что январскую статистику использования контент-провайдеры должны были предоставить в феврале в новом стандарте (сохраняя параллельно отчеты в COUNTER 4). Однако далеко не все смогли выполнить это требование; даже многие из тех, кто уже генерирует отчеты в новом формате, пока не прошли аудит COUNTER, на который отводится 6 месяцев. Это означает, что в данных отчетов первого-второго кварталов 2019 года возможны изменения, внесенные постфактум, тем более что некоторые корректировки в стандарт вносились уже после его официальной публикации.
- Использование новых метрик повлияет на сопоставимость статистики использования ресурсов с данными прошлых лет. По предварительным оценкам, она уменьшится примерно в полтора раза для журналов и в несколько раз — для книг.
- Новая концептуальная модель, на наш взгляд, более удобна для использования ее принципов региональными контент-провайдерами. Организациям-пользователям следует инициировать обсуждение с ними возможности генерации соответствующих статистических отчетов.
Список литературы
1. Shepherd P.T. COUNTER: from conception to compliance. Learned Publishing. 2003;16(3):201–205. https://doi.org/10.1087/095315103322110996
2. Shepherd P.T. COUNTER: towards reliable vendor usage statistics. Vine. 2004;34(4):184–189. https://doi.org/10.1108/03055720410570975
3. Shepherd P.T. COUNTER 2005: a new Code of Practice and new applications of COUNTER usage statistics. Learned Publishing. 2005;18(4):287–293. https://doi.org/10.1087/095315105774648762
4. Pesch O. Ensuring consistent usage statistics, Part 1: Project COUNTER. The Serials Librarian. 2006;50(1–2):147–161. https://doi.org/10.1300/J123v50n01_14
5. Kraemer A. Ensuring consistent usage statistics, part 2: working with use data for electronic journals. The Serials Librarian. 2006;50(1–2):163–172. https://doi.org/10.1300/J123v50n01_15
6. Baker G., Read E.J. Vendor-supplied usage data for electronic resources: a survey of academic libraries. Learned Publishing. 2008;21(1):48–57. https://doi.org/10.1087/095315108X247276
7. Welker J. Counting on COUNTER: The Current State of E-Resource Usage Data in Libraries. Computers in Libraries. 2012;32(9):6–11.
8. Pesch O. COUNTER Release 5: What’s New and What It Means to Libraries. The Serials Librarian. 2017;73(3–4):195–207. https://doi.org/10.1080/0361 526X.2017.1391153
9. Tenopir C., Christian L., Anderson R., Estelle L., Allard S., Nicholas D. Beyond the download: Issues in developing a secondary usage calculator. Qualitative and Quantitative Methods in Libraries. 2017;5(2):365–377.
10. Estelle L. COUNTER: Release 5 of the Code of Practice. Performance Measurement and Metrics. 2017;18(3):180–186. https://doi.org/10.1108/pmm10-2017-0048
11. Osterman A., Estelle L., Pesch O. COUNTER: Consistency, Clarity, Simplification, and Continuous Maintenance. Purdue e-Pubs. 2017. https://doi.org/10.5703/1288284316678
12. Davis P.M., Price J.S. eJournal interface can influence usage statistics: implications for libraries, publishers, and Project COUNTER. Journal of the American Society for Information Science and Technology. 2006;57(9):1243–1248. https://doi.org/10.1002/asi.20405 13. Needham P., Stone G. IRUS-UK: making scholarly statistics count in UK repositories. Insight. 2012;25(3):262–266. https://doi.org/10.1629/2048-7754.25.3.262
13. Литвинова Н.Н. Эволюция представлений о фондах библиотек под влиянием электронной среды. Библиотековедение. 2016;1(1):25–31. 15. Литвинова Н.Н., Хахалева Н.И. Учет электронных сетевых удаленных документов в библиотеках. Библиотековедение. 2014;1:35–41.
Об авторе
Н. Н. ЛитвиноваРоссия
канд. филол. наук, эксперт, ул. Летниковская, 4, стр. 5, офис 2.4, г. Москва, 115114;
главный библиотекарь, ул. Воздвиженка, 3/5, г. Москва, 190019
Рецензия
Для цитирования:
Литвинова Н.Н. СБОР И АНАЛИЗ СТАТИСТИКИ ИСПОЛЬЗОВАНИЯ ЭЛЕКТРОННЫХ РЕСУРСОВ ПО COUNTER 5. Наука и научная информация. 2019;2(3):157-166. https://doi.org/10.24108/2658-3143-2019-2-3-157-166
For citation:
Litvinova N.N. COLLECTION AND ANALYSIS OF ELECTRONIC RESOURCE USAGE STATISTICS ACCORDING TO COUNTER 5. Scholarly Research and Information. 2019;2(3):157-166. (In Russ.) https://doi.org/10.24108/2658-3143-2019-2-3-157-166