Preview

Наука и научная информация

Расширенный поиск

СБОР И АНАЛИЗ СТАТИСТИКИ ИСПОЛЬЗОВАНИЯ ЭЛЕКТРОННЫХ РЕСУРСОВ ПО COUNTER 5

https://doi.org/10.24108/2658-3143-2019-2-3-157-166

Полный текст:

Аннотация

В статье рассматривается развитие проекта COUNTER, являющегося стандартом де-факто предоставления статистических данных об использовании лицензионных электронных ресурсов. Показано, какие проблемы его организации привели к серьезной переработке стандарта с 2016 по 2018 год для ввода в действие пятой версии COUNTER. Описана трехкомпонентная структура модели «объекты — метрики — атрибуты». Продемонстрированы новые возможности генерации статистических отчетов, позволяющие свободно комбинировать различные атрибуты и метрики для измеряемых объектов. Описаны и прокомментированы стандартизованные отчеты, вводимые новым стандартом. Проанализированы изменения в данных об использовании, связанные с вводом в действие новых метрик. Подчеркнута важность согласованных параметров генерации статистики контент-провайдерами, не предоставляющими отчеты в соответствии со стандартом COUNTER.

Для цитирования:


Литвинова Н.Н. СБОР И АНАЛИЗ СТАТИСТИКИ ИСПОЛЬЗОВАНИЯ ЭЛЕКТРОННЫХ РЕСУРСОВ ПО COUNTER 5. Наука и научная информация. 2019;2(3):157-166. https://doi.org/10.24108/2658-3143-2019-2-3-157-166

For citation:


Litvinova N.N. COLLECTION AND ANALYSIS OF ELECTRONIC RESOURCE USAGE STATISTICS ACCORDING TO COUNTER 5. Scholarly Research and Information. 2019;2(3):157-166. (In Russ.) https://doi.org/10.24108/2658-3143-2019-2-3-157-166

  1. Введение

С начала 90-х годов прошлого века, когда би­блиотеки начали активно использовать лицензи­онные электронные ресурсы (ЭР), встал вопрос о том, как измерять это использование. Традици­онные единицы библиотечной статистики, такие как книговыдача, не подходили: во-первых, еди­ницы использования были другими (не физически выданные книги, журналы, рукописи и подобные документы, а выгруженные статьи, библиографиче­ские записи, книги и/или главы из книг), во-вторых, фиксация использования происходила не в библи­отеках, а на серверах контент-провайдеров: изда­телей и агрегаторов. Проблема выработки новых согласованных метрик и стандартизованных форм отчетов, которые контент-провайдеры обязались предоставлять библиотекам-пользователям, ре­шалась совместными усилиями западного библио­течного и издательского сообщества. В результате в 2002 году была создана организация COUNTER (Counting Online Usage of NeTworked Electronic Resources), а в 2003 году появился практический кодекс (code of practice) COUNTER, который факти­чески стал стандартом индустрии электронных ре­сурсов. Сейчас более сотни контент-провайдеров по всему миру соблюдают этот стандарт, пройдя процедуру аудита в COUNTER. Это крупнейшие ми­ровые издательства и агрегаторы электронной на­учной информации. Многие локальные издатели, не проходя формально аудит, тем не менее при­держиваются правил и процедур генерации ста­тистических отчетов, описанных на сайте COUNTER (https://www.projectcounter.org/) и заявляют о себе не как о COUNTER compliant (соответствующие стан­дарту), а как о COUNTER conformant (придерживаю­щиеся стандарта).

C 2003 по 2018 год были последовательно введе­ны в действие 4 версии COUNTER, широко освещав­шиеся в профессиональной литературе [1-7]. Появ­ление новых версий диктовалось логикой развития электронных ресурсов и требованиями библио­тек к отражению в статистических отчетах важных аспектов использования ЭР. В первой версии были введены отчеты по использованию наиболее рас­пространенных в то время электронных продук­тов: реферативно-библиографических баз данных и журналов. В последующих версиях COUNTER поя­вились отчеты по использованию электронных книг и мультимедиа, а также отражение в отчетах ре­жима доступа (платные или открытые документы), разбивка использования по годам выхода журна­лов и другие параметры. Все нововведения отража­лись в новых фиксированных типах отчетов: Journal Report 1a — для статистики использования жур­нального архива, лицензированного библиотекой, который включает журналы за определенный пе­риод; Journal Report GOA — для статистики исполь­зования статей свободного доступа и подобные. В результате количество отчетов умножалось, до­стигнув к 2016 году почти тридцати, но при этом они не удовлетворяли полностью меняющиеся по­требности библиотек. Например, если библиотека хотела иметь данные об использовании статей сво­бодного доступа из архива, у нее не было возмож­ности получить их в существующей системе. Поэ­тому при разработке пятой версии COUNTER была поставлена задача концептуальной переработки принципов организации данных и формируемых из них статистических отчетов. Решению этой за­дачи посвящен ряд публикаций [8-11].

  1. Концептуальная модель COUNTER 5

Принципиально новое решение, на кото­ром строится логика и архитектура COUNTER 5 — выделение ограниченного перечня объектов, для которых определяются основные метрики; объекты имеют ряд атрибутов, допускающих сво­бодное комбинирование. В этой ситуации у библиотекарей вполне резонно возникает ассоциация с переходом от громоздкой и жесткой иерархиче­ской классификации к фасетной, которая позволя­ет комбинировать разные признаки объектов.

2.1. Объекты

Разработчиками стандарта выделены 4 типа объ­ектов, использование которых измеряется и отра­жается в статистических отчетах: Platform, Database, Title и Item. Каждый из них определяется в словаре (Glossary, Appendix A) и сопровождается примера­ми. Следует оговорить, что здесь и далее будут ис­пользоваться в основном англоязычные термины из текста стандарта, поскольку для многих из них пока нет устоявшихся русскоязычных аналогов. И если на уровне основных объектов термины «platform» и «database» имеют соответствующие привычные русские термины «платформа» и «база данных», то для «title» и «item» таких соответствий нет. В контексте COUNTER 5 эти термины использу­ются в следующих значениях:

  • Title— для обозначения аналогов традицион­ных библиотечных изданий: журналов, книг, отчетов и подобных;
  • Item— для обозначения конечных единиц кон­тента, к которым возможно непосредственное обращение пользователей: чтение, просмотр, выгрузка; это статьи, главы, библиографиче­ские записи, аннотации, списки использован­ной литературы и подобные.

Для этих типов объектов в COUNTER 5 предлага­ется четыре типа статистических отчетов, которые называются Master Reports и для которых можно задавать наборы желаемых параметров и выбирать нужные метрики. Эти отчеты перечислены ниже.

Platform Master Report — для вывода данных об использовании платформы, на которой мо­гут размещаться несколько различных баз данных.

Database Master Report — для данных об исполь­зовании баз данных: реферативно-библиографи­ческих, полнотекстовых и смешанных.

Title Master Report — для данных об использова­нии аналогов традиционных библиотечных изда­ний: журналов, книг, отчетов и подобных.

Item Master Report — для данных об использова­нии более дробных объектов: статей, глав, разде­лов, аннотаций и других.

2.2. Метрики

Следующий элемент модели — метрики, то есть единицы измерения использования соответству­ющих объектов. Предложено использовать 12 ме­трик, которые можно объединить в группы по со­держанию и принципу применимости к различным объектам.

Для объектов Platform и Database основ­ная метрика — «searches», запросы. Запросы дифференцируются в зависимости от того, адре­сованы ли они платформе целиком (searches_ platform), то есть всему контенту, размещенному на платформе, или отдельным базам данных (БД). Для последних выделяются три типа поисков в за­висимости от метода ведения поиска: человеком, целенаправленно обратившимся к базе данных (searches_regular), федеративным (распределен­ным) поиском в нескольких БД (searches_federated) или сервисом типа discovery по единому индексу из одного интерфейса (searches_automated).

6 метрик, относящихся к объектам типа Item, группируются по следующим признакам.

  1. По способу действий с объектом противо­поставляются метрики типа «investigation» (изучение, ознакомление) и «request» (вы­грузка, требование). Первая метрика — шире, она подразумевает изучение объекта на всех уровнях, то есть обращение к его детальному описанию (аннотации, списку литературы), активацию ссылок от объекта и, наконец, от­крытие полного текста или мультимедиа. По­следнее действие подпадает под категорию «request». Для «investigations» и «requests» подсчитываются общее количество дей­ствий с объектами (total_item_investigations, total_item_requests) и количество действий с уникальными объектами (unique_item_ investigations, unique_item_requests). Это оз­начает, что любые действия пользователя с объектом во время открытой им сессии будут суммироваться для подсчета в метрике типа «total», а в метрике типа «unique» это будет считаться одним обращением к объекту. Важ­ность противопоставления «total — unique» очевидна для метрики типа «investigation», поскольку обращений к детальным элемен­там описания объекта часто больше одного. Но это противопоставление не менее важно и для метрики типа request, поскольку вы­грузки объекта могут быть в различных фор­матах: html, pdf и их модификациях.
  2. По причине отказа в доступе к единице кон­тента (Item) выделяются две метрики: «no_ license» для подсчета попыток выгрузки объ­екта, не входящего в подписку организации пользователя, и «limit_exceeded» для под­счета попыток выгрузки, отвергнутых из-за превышения лицензионного лимита одно­временного обращения пользователей к ре­сурсу.

Для объектов типа Title применяются две метрики, аналогичные метрикам первого типа для уникальных объектов типа «Item»: «unique_ title_investigations» и «unique_title_requests».

Метрики для объектов типа Item и Title исполь­зуются и в отчетах для объектов типов Platform и Database для демонстрации суммарного исполь­зования в этих объектах их наполнения: журналов, книг, отчетов, библиографических записей, анно­таций и других элементов.

2.3. Атрибуты

Применение атрибутов позволяет детализиро­вать объекты по различным признакам и полу­чать статистику использования подгрупп объектов, объединенных заданными значениями атрибутов. COUNTER 5 вводит 5 категорий атрибутов.

  1. Data_type — типы данных, заданные списком. Список включает как традиционные типы (книга, журнал, отчет), так и актуальные в по­следние годы мультимедиа, наборы данных (datasets), объекты репозиториев (repositoryitems) и другие, в том числе «other» для обо­значения типов, не подпадающих под имею­щиеся элементы списка.
  2. Section_type — атрибут, позволяющий дета­лизировать данные по типам составных ча­стей, на которые разбит объект типа Title. Его применение актуально для оценки исполь­зования книжных коллекций, которые пред­ставляют контент либо в виде книги целиком, либо в виде совокупности глав и разделов.
  3. Access_type характеризует режим доступа к документам на момент его публикации. Со­гласовано использование трех фиксирован­ных значений этого атрибута: «controlled» (доступ предоставляется только подписчи­кам), «OA gold» (свободный доступ как к до­кументам из полностью открытых изданий, так и из гибридных) и «other_free_to_read» (другие варианты свободного доступа). По­следний атрибут применяется только для ре­позиториев.
  4. Access_method — метод доступа: «regular» (регулярный, то есть доступ пользователя-человека через стандартные опции ин­терфейса) и «TDM» (textanddatamining, то есть анализ текстов специальными про­граммными средствами, позволяющими анализировать большие объемы текстовой информации с целью выявления семанти­ческих связей, статистических характеристик и других свойств текстов).
  5. Year_of_publication (YOP) — четырехсимволь­ный год издания документа; если он неиз­вестен, ставится «0001», если документ еще не вышел (articleinpress) — «9999».

3. Данные статистических отчетов Counter 5 в сравнении с отчетами предыдущей версии: проблемы интерпретации и сравнения

Как ясно из описания концептуальной модели COUNTER 5, она является достаточно абстрактной на уровне объектов и метрик. Их названия ней­тральны, то есть не привязаны, как раньше, к опре­деленным видам документов и определенным вариантам использования. Конкретизация проис­ходит только на этапе выбора атрибутов для фор­мирования желаемого статистического отчета. Свобода выбора параметров отчетов не может эф­фективно использоваться без понимания того, какие атрибуты доступны и каким целям анализа они могут служить.

Разработчики стандарта постарались не оста­вить пользователей один на один с проблемой выбора и предусмотрели несколько типов отчетов, формируемых на основе отчетов Master с фикси­рованным набором метрик и атрибутов, полез­ных в типовых ситуациях анализа использования лицензионных ресурсов. Ниже мы кратко рассмо­трим возможности генерации и анализа отчетов для каждого из четырех типов объектов. Деталь­но изучить их можно на сайте COUNTER, страни­це, посвященной отчетам COUNTER 5: https://www. proiectcounter.org/code-of-practice-five-sections/4- 1-usage-reports/.

3.1. Platform — возможности и типовые отчеты

Отчеты по использованию платформы предо­ставляют самые общие данные по суммарной ак­тивности пользователей организации на опреде­ленной платформе, например Science Direct. Такой отчет имеет смысл использовать, если в доступе организации — более одной базы данных на плат­форме. Рекомендованный набор из семи метрик для отчета Platform Master Report (PR) включа­ет «searches_platform», две пары метрик типа «investigations» и «requests» для Item и пара ме­трик типа «unique investigations» и «unique requests» для Title. Применимые атрибуты — «Data_type» и «Access_method».

Стандартный отчет PR_P1 оставляет только че­тыре метрики: «searches_platform», «total_item_ requests», «unique_item_requests» и «unique_title_ requests».

Использование атрибута «Data_type» в отчете PR позволяет дифференцировать использование по типам документов, которые можно вынести в отдельный столбец, сформировав сводную та­блицу Excel, как показано в таблице 1.


Data Type

Searches_Platform

Total_Item_

Investigations

Unique_Item_

Investigations

Total_Item_

Requests

Unique_Item_

Requests

Unique_Title_

Investigations

Unique_Title_

Requests

Book

 

447

376

283

237

95

48

Journal

 

2871

1745

2627

1599

 

 

Platform

785

 

 

 

 

 

 

Totals

785

3318

2121

2910

1836

95

48

Рис. 1. Статистический отчет Platform Master Report для платформы Science Direct с семью типами метрик и атрибутом «Data_type»

Fig. 1. Platform Master Report for Science Direct platform including 7 metric types and Data_type attribute

 

Прокомментируем разницу в значениях ме­трик типов «Total» и «Unique». Во всех случаях пер­вые существенно превосходят вторые, что понят­но: изучение одного уникального объекта часто предполагает обращение к нескольким элемен­там его описания, включая просмотр полно­го текста в формате html с последующей выгруз­кой его в предпочтительном формате хранения, чаще всего в pdf. Какую из метрик считать ос­новной для оценки эффективности использова­ния ресурса, в том числе экономической? Этот во­прос не имеет однозначного ответа, все зависит от цели анализа. Для расчета стоимости выгрузки из полнотекстовых журнальных ресурсов разра­ботчики COUNTER 5 рекомендуют в качестве основ­ной метрики «unique_item_requests»; именно она показывает количество выгрузок статей как со­держательных объектов, абстрагируясь от различ­ных форматов представления контента. Как было отмечено в литературе [12], разница в интерфей­сах издателей приводит к тому, что пользователи иногда имеют возможность перейти к полному тек­сту статьи в pdf непосредственно от содержания выпуска журнала или результатов поиска, а ино­гда — только открыв предварительно полный текст в формате html. В последнем случае количество выгрузок в COUNTER 4 считалось равным двум; в COUNTER 5 будет учтено две выгрузки по метрике «total_item_requests» и только одна — по метрике «unique_item_requests». Как следствие, показате­ли использования по новому стандарту снизятся по сравнению с данными предыдущего года, сге­нерированными по COUNTER 4, а значит, снизит­ся и рассчитанная экономическая эффективность подписки. В то же время сопоставимым останется показатель «total_item_requests».

Сложнее обстоит дело с оценкой использова­ния книжных коллекций. Если журнальные кол­лекции организованы у западных контент-про­вайдеров единообразно, как базы данных статей, то книги — по-разному: у одних — как базы дан­ных глав (разделов) с индивидуальными метадан­ными, у других — как базы данных полных текстов книг. Соответственно статистика использования книг до сих пор несопоставима даже у тех кон­тент-провайдеров, которые соблюдают стандарт COUNTER: у одних она представлена количеством обращений к главам из книг, у других — коли­чеством обращений к книгам. Разработчики COUNTER 5 предложили решение проблемы со­поставимости статистики использования книг на уровне метрик «title_requests». Теперь изда­тели, представляющие книги в виде совокупно­сти глав, будут подсчитывать количество обраще­ний к книгам за время одной пользовательской сессии и суммировать их. Ясно, что этот статистиче­ский показатель существенно снизится по сравне­нию с прошлогодним. В то же время сопоставимым останется показатель «total_item_requests».

3.2. Database — возможности и типовые отчеты

Для объекта Database предусмотрено три типа отчета: главный (Master), имеющий обозначение DR, и два стандартных: DR_D1 и DR_D2.

DR предоставляет возможность выбрать для ге­нерации отчета 11 метрик из 12 (исключение состав­ляет лишь «searches_platform», неприменимая на уровне базы данных) и атрибуты «Data_type» и «Access_method»; по умолчанию включаются данные для всех видов «Access_type». В табли­це 2 представлен фрагмент отчета DR, преобразо­ванный в сводку по типам метрик, показывающий использование в Российской государственной би­блиотеке (РГБ) баз данных на платформе компании EBSCO Industries; жирным шрифтом выделены на­звания полнотекстовых БД.

DR_D1 — стандартный отчет, включающий дан­ные только для объектов, не предоставленных в свободный доступ (Access_type — regular). Преду­становленный набор метрик включает три вида поисков и две метрики по использованию Items: Total_item_investigations и Total_item_requests.


Database

Searches_

Automated

Searches_

Regular

Total_Item_

Investigations

Total_

Item_

Requests

Unique_Item_

Investigations

Unique_

Item_

Requests

Unique_Title_

Investigations

Unique_

Title_

Requests

Academic Search Complete

2 693 964

3267

2467

1291

1854

1139

2

2

Art & Architecture Source

2 693 814

2502

377

179

251

144

1

1

Business Source Complete

2 693 908

2789

1474

743

1010

638

16

15

Inspec

2 675 4 84

2518

629

 

545

 

11

 

Library, Information

 

 

 

 

 

 

 

 

Science & Technology

2 693 824

2526

141

 

117

 

 

 

Abstracts

 

 

 

 

 

 

 

 

MEDLINE

2 693 851

2456

230

 

192

 

 

 

Newspaper Source

2 693 778

2688

270

144

129

116

 

 

Рис. 2. Сводный отчет по использованию баз данных компании EBSCO Industries (фрагмент); жирным шрифтом выделены на­звания полнотекстовых БД

Fig. 2. Pivot report for EBSCO Industries databases (fragment); full text database names are in bold

 

DR_D2 — стандартный отчет по отказам в доступе к объектам (items) базы данных.

Оценка эффективности использования полно­текстовых баз данных базируется на количестве выгрузок полных текстов, как было сказано выше. Для реферативно-библиографических БД, где полные тексты отсутствуют, для этих целей обычно привлекаются два параметра: количество запросов, адресованных БД, и количество обращений к де­тальным записям, то есть, в терминах COUNTER 5, «investigations». Встает вопрос, какие именно ме­трики типов «searches» и «investigations» следует использовать? По «investigations» есть рекомен­дация разработчиков опираться на суммарные значения, то есть на «total_item_investigations». Они показывают, насколько востребованы поль­зователями различные опции изучения за­писи, в том числе ссылки для перехода к пол­ным текстам. Что касается метрик запросов, то тут все зависит от организации использования ресур­са в конкретной организации. Если пользователь целенаправленно выбирает нужную базу данных, то о ее востребованности можно судить по значе­нию «searches_regular», если же используется фе­деративный (распределенный) поиск в несколь­ких БД, одновременно или по умолчанию отмечены несколько БД, как это сделано в РГБ, то использо­вать количество проведенных поисков нецелесо­образно.

3.3. Title — возможности и типовые отчеты

Отчеты для объекта типа Title — наиболее инте­ресные с точки зрения содержательного анализа использования репертуара подписки. Они предо­ставляют статистическую информацию на уровне конкретных изданий: журналов, книг, диссертаций, отчетов и других. С их помощью можно получить ответы на вопросы о том, какие издания наиболее востребованы, насколько равномерно распределя­ется спрос на издания, входящие в подписной ре­сурс, как меняется этот спрос во времени. Поскольку статистические отчеты содержат уникальные иден­тификаторы изданий (ISSN, ISBN), их можно допол­нить характеристиками изданий из других баз дан­ных, например тематикой, и выполнить важнейший анализ структуры тематического спроса.

Для объектов типа Title предусмотрено во­семь типов отчетов: обобщенный Title Master Report (TR) и две группы стандартных отчетов для журна­лов (обозначаются TR_J) и книг (TR_B). Title Master Report позволяет сгенерировать отчет с 8 метрика­ми (всеми, кроме метрик поиска) и полным набо­ром атрибутов.

В таблице 3 показан небольшой фрагмент отче­та TR с полным набором метрик и атрибутов для из­даний на платформе Wiley Online Library. Для того чтобы рисунок уложился в страницу, из фрагмен­та удалены столбцы Platform, Publisher, DOI и вну­тренние идентификаторы изданий Wiley. На ос­нове таких данных можно конструировать любые отчеты с нужными комбинациями атрибутов и ме­трик. В частности, отчет по использованию жур­нальных статей свободного и платного доступа по годам выхода журналов; его фрагмент для пе­риода с 2011 года показан в таблице 4 (напомним, что обозначение года 9999 означает «article in press»). Видно, что использование статей свобод­ного доступа в выпусках журналов последних лет возрастает. Как было сказано ранее, получить та­кие данные в рамках COUNTER 4 было невозможно.

Title

ISBN

Print_ISSN

Online_ISSN

Data_Type

Section_Type

YOP

Access_Type

Metric_Type

Reporting_Period_Total

Anthropology Today

 

0268-540X

1467-8322

Journal

Article

2011

Controlled

Total_Item_Investigations

3

Anthropology Today

 

0268-540X

1467-8322

Journal

Article

2011

Controlled

Total_Item_Requests

1

Anthropology Today

 

0268-540X

1467-8322

Journal

Article

2011

Controlled

Unique_Item_Investigations

1

Anthropology Today

 

0268-540X

1467-8322

Journal

Article

2011

Controlled

Unique_ltem_Requests

1

Antipode

 

0066-4812

1467-8330

Journal

Article

2010

Controlled

Total_Item_Investigations

3

Antipode

 

0066-4812

1467-8330

Journal

Article

2010

Controlled

Total_Item_Requests

2

Antipode

 

0066-4812

1467-8330

Journal

Article

2010

Controlled

Unique_Item_Investigations

1

Antipode

 

0066-4812

1467-8330

Journal

Article

2010

Controlled

Unique_ltem_Requests

1

Antipode

 

0066-4812

1467-8330

Journal

Article

2017

Controlled

Total_Item_Investigations

4

Antipode

 

0066-4812

1467-8330

Journal

Article

2017

Controlled

Total_ltem_Requests

1

Antipode

 

0066-4812

1467-8330

Journal

Article

2017

Controlled

Unique_Item_Investigations

1

Antipode

 

0066-4812

1467-8330

Journal

Article

2017

Controlled

Unique_Item_Requests

1

Applied Multivariate Data Analysis, Second Edition

978-1-118- 8748-6

 

 

Book

Chapter

2001

Controlled

No_License

1

Applied Multivariate Data Analysis, Second Edition

978-1-118- 88748-6

 

 

Book

Chapter

2001

Controlled

Total_Item_Investigations

1

Applied Multivariate Data Analysis, Second Edition

978-1-118- 88748-6

 

 

Book

Chapter

2001

Controlled

Unique_Item_Investigations

1

Applied Multivariate Data Analysis, Second Edition

978-1-118-88748-6

 

 

Book

Book

2001

Controlled

Uniquee_Title_Investigations

1

Puc. 3. Фрагмент отчета TR с полным набором метрик и атрибутов

Fig. 3. TR report including complete set of metrics and attributes

 


Access Type — Metrics

2011

2012

2013

2014

2015

2016

2017

2018

2019

9999

Controlled

 

Total_Item_Investigations

26

28

21

26

29

38

55

72

24

36

Total_Item_Requests

26

27

21

23

29

37

54

69

23

31

Unique_Item_Investigations

26

28

21

26

29

38

55

72

24

36

Unique_Item_Requests

26

27

21

23

29

37

54

69

23

31

OA_Gold

 

Total_Item_Investigations

2

3

1

8

1

3

6

25

21

6

Total_Item_Requests

1

3

1

8

1

3

6

25

19

6

Unique_Item_Investigations

2

3

1

8

1

3

6

25

21

6

Unique_Item_Requests

1

3

1

8

1

3

6

25

19

6

Рис. 4. Сводные данные по использованию статей свободного и платного доступа в журналах издательства Wiley в РГБ за 4 месяца 2019 года с разбивкой по годам выпуска

Fig. 4. Pivot data on article usage (both controlled and OA_gold) for Wiley journal collection split by year of publication in RSL (four months period)

 

Стандартные отчеты с предустановленны­ми значениями метрик и атрибутов предложены для решения относительно простых и часто встре­чающихся задач анализа статистики: TR_JR1 и TR_ BR1 — для генерации данных по использованию объектов, не предоставленных в свободный доступ; TRJR2 и TR_BR2 — для анализа отказов в доступе; TR_ JR3 и TR_BR3 — для анализа использования объектов по типам доступа и JR4 — для представления стати­стики использования журналов по годам их выхода.

3.4. Item — возможности и типовые отчеты

Отчеты для объектов типа Item предлагают­ся только для ресурсов с определенными типа­ми контента, в которых обычно содержатся бо­лее дробные единицы, чем аналоги традиционных изданий, то есть статьи (не объединенные в выпу­ски и тома журналов), отдельные главы из книг, мультимедиа и подобные. К таким ресурсам отно­сятся репозитории (в том числе репозитории на­боров данных), мультимедиа и научные социаль­ные сети.

Предусмотрено 3 типа отчетов: обобщенный от­чет IR (Master) с максимальным набором атрибутов и два стандартных отчета с предустановленными параметрами: IR_A1 для статей и IR_M1 для мульти­медиа.

Следует отметить, что значение репозиториев, научных сетей и мультимедиа в последние годы возрастает, однако практика предоставления стан­дартизованных отчетов для них только начинает утверждаться [13].

  1. За рамками COUNTER

Стандарт COUNTER дает возможность организациям-пользователям получать надежную и со­поставимую статистику использования лицензи­онных ресурсов. Как отмечалось во введении, большинство крупных издателей и агрегаторов научного контента западных стран соблюдают этот стандарт. Но есть множество региональных игро­ков издательского рынка, которые если и предо­ставляют статистику использования своих ресур­сов, то генерируют ее по собственным внутренним правилам. Такова ситуация на российском рынке: ни один российский контент-провайдер не про­ходил аудит COUNTER. И хотя некоторые из них заявляют, что их статистические отчеты соответ­ствуют правилам COUNTER, это вызывает обосно­ванные сомнения.

Эта ситуация вызывает серьезную обеспоко­енность организаций-пользователей, поскольку они не могут суммировать все данные по исполь­зованию ресурсов: для них применяются раз­ные метрики. Например, издатели электронных книг могут давать статистику в количестве про­смотренных страниц. С утверждением в России понимания лицензионных ресурсов как части би­блиотечного фонда [14, 15] и ввода в формы ста­тистических отчетов о деятельности организаций показателей использования электронных ресур­сов (например, в форме 6-НК) эта обеспокоенность возросла.

Представляется, что новая концептуальная мо­дель COUNTER 5 может служить основой для разра­ботки российским издательским сообществом еди­ных правил генерации статистики, согласованных с COUNTER 5.

  1. Обсуждение. Выводы

Стандарт COUNTER 5 кардинальным образом переработан по сравнению с предыдущими че­тырьмя версиями. Основа переработки — новая концептуальная модель, абстрагирующаяся от кон­кретных вариантов реализации электронных ре­сурсов и предлагающая четыре обобщенных типа объектов, для которых вводятся новые метрики и применимые атрибуты и их значения, заданные фиксированными списками. Ввод в действие ново­го стандарта расширит возможности организаций, пользующихся лицензионными электронными ре­сурсами, для выполнения количественного и каче­ственного (содержательного) анализа подписного контента.

Столь существенная переработка привела к ряду важных следствий, которые необходимо учитывать организациям-пользователям лицензионных ре­сурсов.

  1. COUNTER 5 введен в действие с 1 января 2019 года. Это значит, что январскую статистику использо­вания контент-провайдеры должны были предо­ставить в феврале в новом стандарте (сохраняя параллельно отчеты в COUNTER 4). Однако далеко не все смогли выполнить это требование; даже мно­гие из тех, кто уже генерирует отчеты в новом фор­мате, пока не прошли аудит COUNTER, на который отводится 6 месяцев. Это означает, что в данных отчетов первого-второго кварталов 2019 года воз­можны изменения, внесенные постфактум, тем бо­лее что некоторые корректировки в стандарт вно­сились уже после его официальной публикации.
  2. Использование новых метрик повлияет на со­поставимость статистики использования ресурсов с данными прошлых лет. По предварительным оценкам, она уменьшится примерно в полтора раза для журналов и в несколько раз — для книг.
  3. Новая концептуальная модель, на наш взгляд, более удобна для использования ее принци­пов региональными контент-провайдерами. Организациям-пользователям следует инициировать обсуждение с ними возможности генерации соот­ветствующих статистических отчетов.

Об авторе

Н. Н. Литвинова
Некоммерческое партнерство «Национальный электронно-информационный консорциум» (НЭИКОН); Российская государственная библиотека
Россия

канд. филол. наук, эксперт, ул. Летниковская, 4, стр. 5, офис 2.4, г. Москва, 115114;

главный библиотекарь, ул. Воздвиженка, 3/5, г. Москва, 190019



Список литературы

1. Shepherd P.T. COUNTER: from conception to compliance. Learned Publishing. 2003;16(3):201–205. https://doi.org/10.1087/095315103322110996

2. Shepherd P.T. COUNTER: towards reliable vendor usage statistics. Vine. 2004;34(4):184–189. https://doi.org/10.1108/03055720410570975

3. Shepherd P.T. COUNTER 2005: a new Code of Practice and new applications of COUNTER usage statistics. Learned Publishing. 2005;18(4):287–293. https://doi.org/10.1087/095315105774648762

4. Pesch O. Ensuring consistent usage statistics, Part 1: Project COUNTER. The Serials Librarian. 2006;50(1–2):147–161. https://doi.org/10.1300/J123v50n01_14

5. Kraemer A. Ensuring consistent usage statistics, part 2: working with use data for electronic journals. The Serials Librarian. 2006;50(1–2):163–172. https://doi.org/10.1300/J123v50n01_15

6. Baker G., Read E.J. Vendor-supplied usage data for electronic resources: a survey of academic libraries. Learned Publishing. 2008;21(1):48–57. https://doi.org/10.1087/095315108X247276

7. Welker J. Counting on COUNTER: The Current State of E-Resource Usage Data in Libraries. Computers in Libraries. 2012;32(9):6–11.

8. Pesch O. COUNTER Release 5: What’s New and What It Means to Libraries. The Serials Librarian. 2017;73(3–4):195–207. https://doi.org/10.1080/0361 526X.2017.1391153

9. Tenopir C., Christian L., Anderson R., Estelle L., Allard S., Nicholas D. Beyond the download: Issues in developing a secondary usage calculator. Qualitative and Quantitative Methods in Libraries. 2017;5(2):365–377.

10. Estelle L. COUNTER: Release 5 of the Code of Practice. Performance Measurement and Metrics. 2017;18(3):180–186. https://doi.org/10.1108/pmm10-2017-0048

11. Osterman A., Estelle L., Pesch O. COUNTER: Consistency, Clarity, Simplification, and Continuous Maintenance. Purdue e-Pubs. 2017. https://doi.org/10.5703/1288284316678

12. Davis P.M., Price J.S. eJournal interface can influence usage statistics: implications for libraries, publishers, and Project COUNTER. Journal of the American Society for Information Science and Technology. 2006;57(9):1243–1248. https://doi.org/10.1002/asi.20405 13. Needham P., Stone G. IRUS-UK: making scholarly statistics count in UK repositories. Insight. 2012;25(3):262–266. https://doi.org/10.1629/2048-7754.25.3.262

13. Литвинова Н.Н. Эволюция представлений о фондах библиотек под влиянием электронной среды. Библиотековедение. 2016;1(1):25–31. 15. Литвинова Н.Н., Хахалева Н.И. Учет электронных сетевых удаленных документов в библиотеках. Библиотековедение. 2014;1:35–41.


Для цитирования:


Литвинова Н.Н. СБОР И АНАЛИЗ СТАТИСТИКИ ИСПОЛЬЗОВАНИЯ ЭЛЕКТРОННЫХ РЕСУРСОВ ПО COUNTER 5. Наука и научная информация. 2019;2(3):157-166. https://doi.org/10.24108/2658-3143-2019-2-3-157-166

For citation:


Litvinova N.N. COLLECTION AND ANALYSIS OF ELECTRONIC RESOURCE USAGE STATISTICS ACCORDING TO COUNTER 5. Scholarly Research and Information. 2019;2(3):157-166. (In Russ.) https://doi.org/10.24108/2658-3143-2019-2-3-157-166

Просмотров: 81


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2658-3143 (Online)