Денис Юрьевич Большаков, кандидат технических наук, начальник отдела научно-технических изданий и специальных проектов, Российская Федерация, 121471, г. Москва, ул. Верейская, д. 41
Рассматривается подход к определению предельного количества статей, подаваемых российскими авторами в научные журналы. Основу подхода составляют оценка всей аудитории, заинтересованной в публикации в научных журналах, допущение, что каждый автор только единолично проводит исследование и готовит публикацию в научный журнал, а также учёт показателя соавторства научных статей как включение коллег в исследование автора. Для проведения исследования используются данные Росстата, Высшей школы экономики и Научной электронной библиотеки для выявления всех заинтересованных в публикации авторов. Этот показатель мультипликативно увеличивается на значение коэффициента соавторства. Количество статей, публикуемых авторами за год, предлагается взять случайным образом и на этом основании построить вероятностное распределение предельного количества статей по всем авторам. Для построения распределения используется метод Монте-Карло, а для анализа аппарат теории вероятностей и линейной алгебры. Проведен сравнительный анализ полученных результатов с данными Научной электронной библиотеки. В ходе работы выявлено, что при годовом количестве статей более одной распределение предельного количества статей от российской аудитории может быть аппроксимировано нормальным распределением, все параметры которого определяются максимальным годовым количеством статей, объемом аудитории и показателем соавторства. Из данного факта может быть получено предельное количество статей по любому разрезу (группы специальностей, конкретной специальности). Рассмотрены примеры нахождения распределения предельного количества статей. Результаты исследования могут быть использованы для корректировки научной политики организации или вуза по исследуемым направлениям деятельности и служить ориентиром для необходимого количества публикаций по отраслям науки.
The paper deals with an approach to finding the ultimate number of papers Russian authors deliver to scientific journals. The approach is based on an assessment of the entire audience interested in publications in scientific journals, an assumption that each author personally pursues a research and writes a paper for the scientific journal, as well as an account for the co-authorship indicator, i.e. the involvement of colleagues into the research performed by the author. The research employs data by Rosstat, Higher School of Economics and Scientific Electronic Library to reveal all the authors interested in publication. This indicator is then multiplied by a value of co-authorship. The number of papers the authors publish per year is recommended to be taken as a random value, to be used later as a basis for building a probabilistic distribution of the ultimate number of papers among all authors. The distribution is built by the Monte Carlo method, and the analysis employs the apparatus of the probability theory and linear algebra. The obtained data and data from the Scientific electronic library have been exposed to comparative analysis. The work revealed that for the annual amount of more than one article the distribution of the number of papers received from the Russian audience can be approximated by a normal distribution, with all its parameters depending on maximum annual number of papers, scope of audience and co-authorship indicator. This gives the ultimate number of papers for any section (group of disciplines or a particular discipline). The article considers the examples of obtaining the distribution for the ultimate number of papers. The results can be used for correcting the research policy of an organization or an institute of higher education in the directions of activity being researched, and can serve as a guide to the necessary number of papers in various fields of science.
Для старта любого, не только научного журнала, нужно, чтобы сложились две составляющие:
Если второй пункт хорошо исследован, то оценка существующей читательской и авторской аудитории может катастрофически сказаться на журнале, так как её размер может оказаться настолько малым, что журнал не выдержит конкуренции среди аналогичных или близких по тематике изданий. В настоящем исследовании оценивается только авторская аудитория, так как читательская намного шире, и она потенциально может быть заинтересована в публикации научных статей, но не нуждается в ней.
Вопрос предельно достижимого потока числа статей в научные журналы позволит сравнивать текущий уровень статей с потенциальным. Знание количества потенциально достижимого количества статей позволяет применять методы по управлению потоком статей в журнал [
Очевидно, что публикационная активность определяется двумя факторами: объемом аудитории авторов и необходимого количества статей в период времени. Если первый фактор может быть оценен явно, то второй фактор связан с вероятностным распределением и может быть определен вероятностными методами [
Следует отметить, что вопросы публикационной активности и ранее рассматривались в исследованиях [6–9], но вопрос предельной активности, именно оценки сверху, как потенциально достижимой, не встречается в литературе.
Цель настоящей работы — определить предельную публикационную активность авторов, измеренную в статьях, подаваемых в научные журналы.
В работе [
В работе [
где Kотр — отношение количества исследователей в данной отрасли науки к количеству исследователей по всем отраслям науки;
Nспец журнала — количество специальностей, по которым журнал может публиковать статьи (может быть взято из действующего Перечня ВАК);
Nспец направления — общее количество специальностей в направлении;
Nнауч. раб., Nпрепод. , Nаспирант — общее количество научных сотрудников, преподавателей вузов и аспирантов по данным Росстата и ВШЭ.
Коэффициент Kотр, показывающий отношение количества исследователей в разных отраслях науки, может быть получен из данных Росстата по всем исследователям России (см. табл. 1)
Следует отметить, что коэффициент Kотр для аспирантов тоже может быть рассчитан по данными Росстата, и его значение отличается от коэффициента для исследователей (см. табл. 2).
По преподавателям данных Росстата нет, поэтому воспользуемся данными Высшей школы экономики [
Используя данные из табл. 1–3, оценим аудиторию научных журналов по отраслям науки. Для этого воспользуемся данными по специальностям ВАК. В настоящее время в соответствии с приказом Минобрнауки России от 21 февраля 2021 г. № 118 их всего 351 [
Полагая распределение по специальностям равномерным, оценим аудитории научного журнала по одной специальности. Данные приведены в табл. 4.
Следует отметить, что деление между общественными и гуманитарными науками более условно, чем между техническими и естественными, поэтому в оценке потенциальной этих отраслей науки аудитории может быть значительный разброс.
Данные табл. 4 позволяют:
Данные из табл. 1–4 можно использовать для оценки предельного количества научных статей от российской аудитории. Предположим, что аспирантам, исследователям и преподавателям нужно в год публиковать одну статью. Также предположим для предельного случая, что каждый аспирант, исследователь или преподаватель пишет статью без соавторов. В этом случае предельный поток статей в научные журналы от российских авторов это числа, приведенные в табл. 5.
Как видно из табл. 5, потенциальное количество статей российских научных авторов составляет 677 тыс. штук в год. С учетом потенциально возможной нецелевой аудитории это количество может быть увеличено на 30 % (до 1 млн статей в год). Однако данные в табл. 5 приведены только для одной статьи в год для каждого вида аудитории. В настоящее время в России количество статей устанавливается либо местными распорядительными документами организации, либо не устанавливается вообще.
Обязательно следует отметить, что наука не делается в одиночку, поэтому статьи чаще всего публикуются в соавторстве. Для оценки коэффициента соавторства проанализированы первые пятьсот журналов из рейтинга Science Index за 2020 год. Всего журналов в данном рейтинге 4249, поэтому ошибка определения среднего количества авторов в статьях за 2020 год по всем журналам при уровне значимости 0,05 составила 4 % [
Из табл. 6 видно, что среднее число авторов в статье для разных отраслей знаний меняется. Например, для медицины этот показатель составляет 4,4, для общественных наук (экономика, право, политология, социология и т.д.) близок к 2, для естественных наук (химия, физика биология) чуть больше 3.
Имея объем аудитории, можно оценить публикационную активность по авторам следующим образом. Пусть для всех видов аудитории имеются квоты по количеству статей в год. Например, в год нужно до двух статей. Допустим, по гуманитарным наукам аспиранту нужна одна статья, а преподавателю две. А по техническим наукам и аспиранту и преподавателю нужно две статьи в год. Очевидно, что предельное значение будет представлять собой распределение, которое зависит от того, сколько статей какой аудитории нужно представлять в год. Для определения этого распределения воспользуемся известным методом Монте-Карло [
где KiСО — средний коэффициент соавторства из табл. 6 для шести отраслей наук,
Niнауч. раб., Niпрепод., Niаспирант — объем аудитории для шести отраслей наук,
nij — целое случайное число (в моделировании принимает значение от 1 до nmax), которое характеризует количество статей, необходимых для подачи в научные журналы в год для разных типов аудиторий.
Графики вероятностного распределения функции (2) при nmax от 2 до 6 статей приведены на рис. 1. Графики получены в Excel. Количество испытаний методом Монте-Карло каждого распределения составило 105. Ошибка в определении параметров распределения в этом случае составляет 0,6 % [
Из рис. 1 можно сделать несколько выводов.
1) Кривые на рис. 1 аппроксимируются нормальным распределением (гипотезы о нормальном распределении выборок проверены и сходятся при уровне значимости 0,05).
2) Кривые имеют между собой явную зависимость, а так как нормальное распределение определяется только двумя параметрами — математическим ожиданием и среднеквадратическим отклонением, то, имея оценку этих параметров, можно применить вышеприведенный подход к любым данным без проведения моделирования.
График зависимости среднего и СКО от количества подаваемых статей в научную периодику в год приведен на рис. 2.
Из рис. 2 видно, что линия тренда, построенная средствами Excel, идеально аппроксимирует полученные зависимости роста среднего значения и среднеквадратического отклонения, поэтому дальнейшие результаты могут быть получены без использования метода Монте-Карло.
Из простейших алгебраических преобразований линейных уравнений рис. 2, решая две системы с двумя неизвестными и округляя результаты до целых чисел, можно получить, что
где N — объем аудитории;
kСА — среднее количество соавторов статьи из таблицы 6 по всем отраслям наук (kСА =2,82).
Далее, учитывая правило трех сигм [
В табл. 7 даны предельные значения публикационной активности для разных типов аудиторий и разных для них коэффициентов kСА, построенные по формуле (3). Предельное количество статей в табл. 7 означает, что каждый аспирант, преподаватель или научный сотрудник пишет в год ровно то количество статей, которое указано в шапке таблицы, а общее число умножается на коэффициент соавторства в предположении, что каждый не только пишет статью сам, но и участвует в написании статей коллег.
Используя данные из табл. 7 и тренд на уменьшение авторов научных журналов, описанный в работе [
Как видно из рис. 3 по данным elibrary.ru, максимальное реальное количество статей превышает 4,5 млн, но в статистике не указано, учитывались ли в загрузке архивные выпуски научных журналов и загрузки статей странами СНГ. Из анализа графиков на рис. 3 можно сделать вывод, что данные по результативности российских авторов не так уж и далеки от предельных. Например, при обязательном требовании всей аудитории в 6 статей в год предельное количество статей составляет 11 млн штук в год, что в 2,3 раза больше, чем максимальное значение по данным elibrary.ru на 2019 год.
Из графика на рис. 3 можно сделать и обратный вывод. Имея данные о количестве аудитории и составе авторского коллектива, можно подсчитать количество статей, публикуемых в расчёте на одного ученого. Если взять средние числа из графика на рис. 3 по данным elibrary.ru, получается около 2,5 млн. Эти 2,5 млн статей, поделенные на произведение размера аудитории российских ученых (в 0,6 млн) с количеством соавторов в статье (2,82), дают результат 1,4 статьи в год на каждого российского учёного.
Из приведенных выше рассуждений можно получить распределение предельного количества статей по любой тематике или любой специальности. Например, на рис. 4 приведена плотность вероятности для nmax = 2 двух групп специальностей в отрасли естественных наук.
Из рис. 4 можно сделать вывод, что максимальное количество статей по группам специальностей «Математика» дает максимальный разброс предельного количества статей от 16 до 94 тыс. статей в год, а по группам специальностей «Механика» от 10 до 70 тыс. статей в год.
Вполне закономерен вопрос: если существует предел сверху, то можно ли использовать данные моделирования для оценки предела снизу или оценке среднего значения. Например, из графиков на рис. 4 можно сделать вывод, что среднее значение статей по механике и математике в год составляет 42,1 и 52,2 тыс. соответственно, а почти невозможное минимальное количество составляет для механики 10 тыс., а для математики 16 тыс. К сожалению, нельзя, так как приведенный в статье подход учитывает всю аудиторию, при этом нельзя утверждать, что вся аудитория ведет научные исследования, хоть и состоит из исследователей. Поэтому предложенный аппарат можно использовать только для оценки сверху.
Таблица 1. Распределение исследователей по научным направлениям по данным Росстата (данные за 2020 год)Table 1. Distribution of researchers in various scientific fields, according to Rosstat data (for the year 2020)
Наименование отрасли науки / Field of science | Количество / Quantity | Kотр , % Kfield, % |
Гуманитарные / Humanitarian | 12 326 | 4 |
Естественные / Natural | 80 966 | 23 |
Медицинские / Medical | 14 584 | 4 |
Общественные / Social | 20 076 | 6 |
Сельскохозяйственные /Agricultural | 14 584 | 4 |
Технические / Engineering | 208 994 | 60 |
Итого | 351 530 | 100 |
Таблица 2. Распределение аспирантов по научным направлениям по данным Росстата (данные за 2020 год)Table 2. Distribution of post-graduate students in various scientific fields, according to Rosstat data (for the year 2020)
Наименование отрасли науки / Field of science | Количество / Quantity | Kотр , % Kfield, % |
Гуманитарные / Humanitarian | 3 510 | 4 |
Естественные / Natural | 14 918 | 17 |
Медицинские / Medical | 7 898 | 9 |
Общественные / Social | 36 855 | 42 |
Сельскохозяйственные / Agricultural | 3 510 | 4 |
Технические / Engineering | 21 938 | 25 |
Итого | 88 629 | 100 |
Таблица 3. Распределение преподавателей по научным направлениям по данным ВШЭ и расчетам автора (данные за 2019/20 учебный год)Table 3. Distribution of university professors in various scientific fields, according to HSE data and calculations of the author (for 2019/20 academic year)
Наименование отрасли науки / Field of science | Количество / Quantity | Kотр , % Kfield, % |
Гуманитарные / Humanitarian | 10 223 | 4 |
Естественные / Natural | 25 287 | 11 |
Медицинские / Medical | 16 944 | 7 |
Общественные / Social | 108 560 | 46 |
Сельскохозяйственные / Agricultural | 9 524 | 4 |
Технические / Engineering | 66 741 | 28 |
Итого | 237 279 | 100 |
Таблица 4. Количество потенциально заинтересованных в журнале авторов по одной специальности ВАКTable 4. Authors potentially interested in the journal and representing one HAC discipline
Наименование отрасли науки / Field of science | Количествоспециальностей /Number of disciplines | Объем аудитории по одной специальности /Scope of audience for one discipline | Итого / Total | ||
Аспиранты / Post-graduate students | Исследователи / Researchers | Преподаватели / University professors | |||
Гуманитарные / Humanitarian | 47 | 75 | 262 | 218 | 554 |
Естественные / Natural | 96 | 155 | 843 | 263 | 1 262 |
Медицинские / Medical | 52 | 152 | 280 | 326 | 758 |
Общественные / Social | 27 | 1 365 | 744 | 4 021 | 6 129 |
Сельскохозяйственные / Agricultural | 17 | 206 | 858 | 560 | 1 625 |
Технические / Engineering | 112 | 196 | 1 866 | 596 | 2 658 |
Таблица 5. Потенциальный объем статей в разрезе аудитории в годTable 5. Potential scope of papers in terms of audience per year
Наименование отрасли науки / Field of science | Потенциальный объем статей от аудитории /Potential scope of papers from the audience | Итого / Total | ||
Аспиранты /Post-graduate students | Исследователи / Researchers | Преподаватели / University professors | ||
Гуманитарные / Humanitarian | 3 510 | 12 326 | 10 223 | 26 059 |
Естественные / Natural | 14 918 | 80 966 | 25 287 | 121 171 |
Медицинские / Medical | 7 898 | 14 584 | 16 944 | 39 426 |
Общественные / Social | 36 855 | 20 076 | 108 560 | 165 491 |
Сельскохозяйственные / Agricultural | 3 510 | 14 584 | 9 524 | 27 618 |
Технические / Engineering | 21 938 | 208 994 | 66 741 | 297 673 |
Итого | 677 438 |
Таблица 6. Область наук, отрасль науки и среднее количество авторов в статьеTable 6. Field of science, branch of science and average number of authors per paper
Отрасль наук / Field of science | Область науки / Branch of science | Среднее количество авторов в статье / Average number of authors per paper |
Гуманитарные / Humanitarian | История | 1,5 |
Литература | 1,35 | |
Науковедение | 1,9 | |
Политология | 1,49 | |
Психология | 2,28 | |
Философия | 1,63 | |
Языкознание | 1,37 | |
Среднее | 1,65 | |
Естественные / Natural | Астрономия | 3,2 |
Биология | 4 | |
География | 2,98 | |
Геология | 3,35 | |
Геофизика | 3,17 | |
Математика | 2,11 | |
Механика | 2,4 | |
Физика | 4,02 | |
Химия | 4,45 | |
Экология | 3,5 | |
Среднее | 3,32 | |
Медицинские / Medical | Медицина | 4,40 |
Отрасль наук / Field of science | Область науки / Branch of science | Среднее количество авторов в статье / Average number of authors per paper |
Общественные / Social | Внутренняя торговля | 2 |
Государство и право. Юридические науки | 1,36 | |
Демография | 1,7 | |
Комплексное изучение стран и регионов | 2,05 | |
Образование | 2,7 | |
Педагогика | 1,92 | |
Социология | 1,58 | |
Экономика | 1,82 | |
Среднее | 1,89 | |
Сельскохозяйственные / Agricultural | Сельское хозяйство | 2,91 |
Технические / Engineering | Автоматика. Вычислительная техника | 2,55 |
Информатика | 2,35 | |
Машиностроение | 3,16 | |
Металлургия | 3,7 | |
Пищевая промышленность | 2,68 | |
Связь | 2,4 | |
Строительство. Архитектура | 2,78 | |
Электроника. Радиотехника | 4,2 | |
Электротехника | 2,8 | |
Энергетика | 3,7 | |
Среднее | 3,03 | |
- | Мультидисциплинарный | 2,07 |
Среднее количество по всем отраслям* | 2,82 |
Рис. 1. Плотности вероятностей количества статей в млн шт. в годFig. 1. Densities of probable number of papers, in millions per year
Рис. 2. Зависимость математического ожидания и среднеквадратического отклонения от количества статей в годFig. 2. Mathematical expectation and root mean square error vs annual number of papers
Таблица 7. Предельное количество статей, млн шт.Table 7. Ultimate number of papers, million
Наименование отрасли науки / Field of science | Аудитория, чел / Audience, persons | kСА | Количество статей в год / Number of papers per year | |||||
1 | 2 | 3 | 4 | 5 | 6 | |||
Гуманитарные / Humanitarian | 26 059 | 1,65 | 0,1 | 0,1 | 0,1 | 0,2 | 0,2 | 0,2 |
Естественные / Natural | 121 171 | 3,32 | 0,6 | 0,9 | 1,3 | 1,6 | 2,0 | 2,3 |
Медицинские / Medical | 39 426 | 4,40 | 0,3 | 0,4 | 0,6 | 0,7 | 0,9 | 1,0 |
Общественные / Social | 165 491 | 1,89 | 0,5 | 0,7 | 1,0 | 1,3 | 1,5 | 1,8 |
Сельскохозяйственные / Agricultural | 27 618 | 2,91 | 0,1 | 0,2 | 0,3 | 0,3 | 0,4 | 0,5 |
Технические / Engineering | 297 673 | 3,03 | 1,3 | 2,1 | 2,9 | 3,7 | 4,4 | 5,2 |
Итого: | 2,9 | 4,5 | 6,1 | 7,8 | 9,4 | 11,1 |
Рис. 3. Сравнительный анализ предельного количества статей и данных elibrary.ru по годамFig. 3. Ultimate number of papers vs elibrary.ru data by years
Рис. 4. Плотность вероятности количества статей по группам специальностей: математика (6 специальностей, kСА=2,11), механика (4 специальности, kСА=2,4), тыс. шт.Fig. 4. Probability density for the number of papers in groups of disciplines: mathematics (6 disciplines, kСА = 2.11), mechanics (4 disciplines, kСА = 2.4), thd
Как показало исследование, российская наука даже с учётом уменьшения количества участников в целом показывает неплохую публикационную динамику, так как предельное значение количества научных статей не различается с данными о загружаемых статьях на платформу elibrary.ru на порядок. Реальное количество статей и оцененное предельное количество соизмеримы по порядку величины даже с учетом некоторой идеализации подхода к оценке публикационной активности.
Как уже было отмечено выше, результаты исследования могут быть применены для оценки публикационной активности исследователей в любом разрезе науки. Кроме того, выводы могут быть полезны редакторам новых научных журналов для потенциальной оценки количества статей, публикуемых по планируемому направлению, и целесообразности вложений в привлечение аудитории к сотрудничеству с журналом.
The authors declare that there are no conflicts of interest present.