О числе новомучеников РПЦ в XX в.
Сомин Н.В. (ПСТГУ), к.ф.-м.н.

Введение

В истории номоучеников и исповедников российских XX века остается недостаточно выясненным вопрос общего числа репрессированных православных. А вопрос этот крайне важен, поскольку достаточно точная оценка общего числа репрессированных позволит объективно представить масштабы гонений. Информация от официальных источников по этому поводу отсутствует. Поэтому сделанные до сих пор оценки [1] производились на основании косвенных соображений, отталкиваясь от общего числа священников (и монахов) в дореволюционной России и экспертных оценок. Такой подход не дает приемлемой точности.

Однако в последнее время благодаря усилиям сотрудников ПСТГУ под руководством проф. Н.Е. Емельянова была накоплена представительная база данных о новомучениках российских [2], содержащая сейчас более 35000 персон - православных клириков и активных мирян, повергшихся гонениям и содержащихся в местах заключения. Эта база позволяет провести более точные оценки общего числа репрессированных православных верующих, основанные на статистике процента уже имеющихся в базе персон при вводе новой информации.

Методика подсчета

Обозначим через N искомое общее число репрессированных верующих, а через Nb - общее число персон в базе новомучеников. Обычно ввод новой информации в базу производится в виде списков, поступающих от различных источников. При этом производится проверка: имеется ли персона из списка уже находящейся в базе, или это новая персона, для которой необходимо заводить новую запись. Это одна из важнейших фаз ввода, устраняющая дублирование информации. Отметим, что персоны, которые попали в базу дважды администраторы базы называют "двойниками" и тщательно вычищают.

Было замечено, что при вводе списков процент двойников хотя и колеблется в довольно широких пределах, но в среднем варьирует вокруг определенного числа. Это число может служить основанием для подсчета N. Если обозначить число элементов списка ввода через K, а число двойников в том списке через Kb, то при соблюдении определенных условий имеет место соотношение:

Nb/N = Kb/K.

Отсюда оценка общего числа новомучеников:

N=Nb*K/Kb. (1)

Условия, при которых соотношение с достаточной степень точности выполняется, можно свести к двум:

1) Независимость. Это означает, что процесс формирования списка не должен использовать информацию из базы данных, а осуществляться из других, независимых т базы, источников.

2) Представительность. Список должен содержать достаточное число персон - несколько тысяч. Иначе точность оценки будет неприемлемо низкой.

Суть соотношения (1) и условий 1)-2) состоит в том, что независимая выборка обладает свойством содержать такой же процент двойников в базе, как и процент всех персон в базе по отношению к общему количеству персон. Это свойство давно было замечено и оно используется социологами в методах оценки результатов выборов. Только там по Kb/K (выборка) ищется Nb/N - оценка процента голосования по всей совокупности избирателей. В нашем же случае то же соотношение (1) используется для расчета N по известным (или программно вычисляемым) Kb, K и Nb.

Сочетание обоих условий 1)-2) - достаточно редкое явление, поскольку подавляющее большинство вводимых списков достаточно коротки (не выполняется представительность) и зачастую являются дублями уже введенных списков (не выполняется независимость). Поэтому долгое время соотношение (1) было неприменимо. Наконец, в 2004 г. администрация базы получила в распоряжение большую базу данных по репрессированным, созданную обществом "Мемориал" [3]. Из этой базы специально разработанными программами был извлечен список репрессированных верующих, подавляющее большинство их которых было православными христианами. Этот список удовлетворял обоим сформулированным условиям. Действительно, он значителен по объему (тысячи позиций) и составлялся по совершенно другим источникам, чем списки, предоставляемые из епархий. Поэтому было решено использовать его для подсчетов по формуле (1). Подсчет числа двойников осуществлялся с помощью специально написанной программы, которая учитывала ФИО и год рождения.

Следует отметить, что по данной методике мы оцениваем число репрессированных, о которых мы в принципе можем получить информацию (ибо база данных может содержать лишь то, о чем в обществе сохранилась память). Этой методикой невозможно учесть новомучеников, о которых ничего не известно, например, в период гражданской войны. Однако в последующие периоды (когда число новомучеников было наибольшим) репрессии, как известно, были хорошо документированы. И потому обстоятельство отсутствия информации о некоторых новомучениках не может радикально изменить данную оценку.

Результаты подсчетов

Список Мемориала для удобства работы разбит на 19 файлов - с oq0.dcm до oqi.dcm. Для вычисления погрешности метода было проведено несколько экспериментов с базой данных по состоянию н середину 2014 г. и различными частями полного списка разной длины. Результаты экспериментов сведены в Таблицу 1.
Номер экспериментаNb (число элементов в базе данных)K (число элементов списка ввода)Используемые файлы для спискаKb (число обнаруженных двойников)N (общее число новомучеников)
1352759793oq8-oqi3228107016
2352752879oq8-oqa105097325
3352751896oqb-oqc652102578
4352752959oqd-oqf113192195
5352752160oqg-oqi596127842
Таблица 1. Результаты экспериментов по сопоставлению базы данных новомучеников и списка ввода "Мемориал".

Обсуждение экспериментов и оценка погрешности метода

Число репрессированных, получаемое по всему списку ввода представлено в 1 строке Таблицы 1 и равно 107016. Для оценки погрешности метода был применена следующая методика: весь материал был разделен на четыре части так, чтобы файлы каждой из частей не пересекались и с каждой из частей были проведены расчеты числа двойников. Это позволяет строки 2-5 рассматривать как реализации случайной величины N, распределенной по нормальному закону (число реализаций n=4). Отсюда может быть рассчитано среднее отклонение "сигма" s и максимальная оценка погрешности метода по правилу "трех сигм".


Среднее арифметическое выборок равно: Nc= 104985.
Среднеквадратическое отклонение "сигма":
s = Ö
1
_
 n
S
i=0
(N-Nc)2
n
= 13697.


Отсюда "три сигмы": 3s= 41091.
Максимальное значение числа новомучеников равно Nc+3s= 146086.

Возможна еще систематическая ошибка, обусловленная неточностью программной идентификации двойников. Выборочный ручной анализ списка двойников (около 300 случаев) показал, что программа ошибается не более чем в 3% случаев. Отсюда систематическая ошибка средней величины Nc может быть оценена не более, чем в 3000-3500 чел., что не может качественно изменить общую оценку метода.

Таким образом, можно сделать вывод, что согласно данному методу общая численность репрессированных православных верующих - около 100000 чел. + 40%. Эта оценка в 5-6 раз меньше опубликованной в [1].

Литература

  1. Емельянов Н.Е. К вопросу о числе новомучеников и исповедников Русской Православной Церкви в ХХ веке // Материалы 15-й Ежегодной Богословской конференции ПСТГУ / М. Изд-во ПСТГУ. 2005 г. Том 1. С. 265 - 271
  2. База данных по новомученикам российским. http://martyrs.pstbi.ru/bin/code.exe/frames/m/ind_oem.html/charset/ans
  3. База данных о жертвах политического террора в СССР. Компакт-диск. 3-е изд. НИПЦ "Мемориал". М.:Звенья, 2004.
28.09.14