В последние 10 - 15 лет для оценки результатов научной деятельности широко используется индекс цитируемости, т.е. количество ссылок в научной литературе на данную статью, на работы данного автора, на работы сотрудников данного института и т.п. Как и любая оценка, индекс цитируемости имеет ряд крупных недостатков (зависимость от обстоятельств, не имеющих отношения к уровню научной работы) и несомненных достоинств (прежде всего - беспристрастность и относительная простота оценки). Самая широкая база данных по индексу цитируемости создана американским Институтом Научной Информации (ISI). Команда Scientific.ru обработала данные ISI для большого числа (> 4000) российских ученых и сформировала пороговые списки по индексу цитируемости: авторы с общим числом цитирований больше 1000 и авторы с числом цитирований работ, опубликованных за последние 7 лет, более 100. Эти списки охватывают далеко не всю российскую науку, но по крайней мере значительную часть ее физико-математических направлений и уже дают приблизительную общую картину.
Проверить всех российских ученых на предмет индекса цитируемости - задача непосильная для маленькой инициативной группы и не только потому, что число научных работников огромно, но и по той причине, что не существует соответствующих списков. Поэтому мы были вынуждены ограничиться определенными исходными списками, которые заведомо "обогащены" высокоцитируемыми авторами. Во-первых, это списки академиков и членов-корреспондентов РАН (около 900 человек) а также, список российских авторов архива е-принтов по физике и математике, xxx.lanl.gov, за 1999 - 2000 г. Последний список был подготовлен нашей группой в 2001 году и включает около 4000 человек. Его использование, конечно, смещает результаты в пользу физ-мат наук. Такие науки как биология, химия представлены только академиками и член-коррами. Благодаря помощи геологов, геолгия представлена чуть шире.
База данных ISI содержит ссылки, сделанные в реферируемых журналах из довольно широкого списка, куда входят и основные российские научные журналы. При этом она имеет определенную глубину по времени (мы пользовались версией глубиной до 1986 г.), т.е. оработаны журналы только начиная с данного времени. Ссылки сделанные ранее, равно как и ссылки, сделанные в препринтах, трудах конференций, монографиях, не учтены. Ссылка может быть сделана на что угодно, но если цитируемый источник не относится к упомянутому выше списку или старше 1986 г. - то ссылка ассоциируется только с первым автором и теряется для остальных. Недавно появились версии ISI глубиной до 1975 и 1945 г., но мы пока не имеем доступа к этим версиям (на любую из них требуется подписка).
В данной работе мы столкнулись с рядом методических проблем, которые выливаются в систематические погрешности результатов и конкретные ошибки. Первая проблема связана с "ущемлением" соавторов, не первых в списке, для старых и нежурнальных публикаций. Поскольку во многих областях науки принят алфавитный порядок авторов, это приводит к "алфавитному смещению" результатов. Есть случаи, когда автор из-за своей "неблагоприятной" фамилии потерял более половины или даже три четверти цитированний. Другая проблема - как быть с большими авторскими коллективами? В экспериментальной физике высоких энергий, где типичное число соавторов - сотни человек и большинство из них - не из России, эта проблема заводит в тупик. Мы вообще не учитывали работы по экспериментальной физике высоких энергий, за исключением тех, что сделаны сложившимися российскими группами у себя дома. Проблема, ведущая к неизбежным ошибкам - идентификация авторов, их места работы и их принадлежности к российской науке. Последняя определялась по тому, уакзывает ли автор статьи в качестве хотя-бы одного из мест работы какой-либо российский институт в течение двух последних лет. Поскольку ISI отображает список мест работы авторов очень нечетко и не полностью, кого-то мы могли ошибочно записать в "научные эмигранты". Определенную проблему представляют вариации английской транскрипции российских фамилий, "распутывание" авторов с одинаковыми распространенными фамилиями и инициалами и практика указывать иногда только один инициал.
Результаты: в список "больше 1000 цитирований" вошли 241 человек, в список "больше 100 цитирований работ последних 7 лет" (или "активный" список, т.е. выявляющий ученых, активных в последнее время) - 373 человека. В оба списка попали 154 человека, общее число ученых, фигурирующих в списках - 460. Подавляющее большинство составляют ныне живущие ученые. Включено несколько человек, скончавшихся недавно, и Я.Б.Зельдович (10500 цитирований по ISI 1986). Лидером в "индивидуальном зачете" является математик В.И.Арнольд (Математический институт Стеклова, 10817 цитированний по ISI1986). Конкуренцию ему в нашем списке мог бы составить теорфизик А.М. Поляков (10300 по ISI1986) если бы указывал в публикациях Институт теорфизики Ландау, где числится до сих пор, реально много лет работая в Принстонском Университете (Арнольд проводит большую часть времени в России, где ведет активную научно-организационную деятельность). Далее следуютА.И.Ларкин (физика конденсированных сред, Институт Ландау), В.Е.Захаров (матфизика, Институт Ландау), И.М.Гельфанд (математика, Институт системных исследований), Л.Фаддеев(матфизика, Математический институт Стеклова, С.Петербург).
Вообще бросается в глаза доминирование теорфизиков и математиков (даже если принимать в расчет только академиков и член-корров), что не является новостью и соответствует давно сложившемуся мнению. При этом надо иметь в виду, что математиков в мире меньше, чем физиков, соответственно меньше цитирующая аудитория. Это подтверждает мнение об исключительно высоком уровне российской математической школы (точнее, школ).
Большие индивидуальные погрешности оценки, которую выражает индекс цитируемости, усредняются, когда мы берем статистику по институтам: в этом случае оценка точнее. В таблице индекса цитируемости институтов, сделанной на выборке 460 человек, вошедших в наши списки, лидирует маленький (около 100 научных сотрудников) Институт теорфизики Ландау (87598, без Полякова). Далее следует огромная система МГУ, включающая достаточно крупные подведомственные институты (58037). Третьим идет ФИАН (52413), за ним Институт Математики Стеклова (39958, Московское и С.Петербургское отделения вместе). C 5 по 8 позиции занимает группа институтов, разница между которыми меньше ошибок оценки: Институт теоретической и экспериментальной физики (27158), Институт Ядерных исследований РАН (26517), Физ-тех им. Иоффе (26416), Объединенный институт ядерных исследований, Дубна (25012). Надо отметить, что значительную часть деятельности трех из этих институтов составляет экспериментальная физика высоких энергий, которая не отражена в данных. В таблице даны результаты для 31 института с общим индексом выше 4000, дальше статистические ошибки, связанные с высоким порогом нашей выборки ученых становятся слишком велики.
Естественное направление дальнейшей работы - расширение исходных списков на дисциплины вне физики м математики. Проблема заключается в том, что, например в биологии или химии нет аналога архива е-принтов, где можно было бы довольно легко "отловить" активных авторов. Естественно, после обработки соответствующих списков поднялся бы рейтинг институтов биологического, химического и других профилей. В частности, вырос бы показатель МГУ.
Высокий индивидуальный порог выборки не очень сильно искажает результаты. Формула "80% работы делается двадцатью процентами людей" относится и к индексу цитируемости. Это искажение минимально в верхней части списка и возрастает к его концу. Существенней искажение связанное с тем, что практика публикаций е-принтов в разных институтах принята в разной степени. Расширение исходных списков позволит ликвидировать и эту систематическую ошибку.
2i.SU ©R 2015