Еще раз к вопросу о числе новомучеников российских
Сомин Н.В. (ПСТГУ), к.ф.-м.н., chri-soc@narod.ru (03/03/2018)

См.также: О числе новомучеников РПЦ в XX в. Сомин Н.В. (ПСТГУ), к.ф.-м.н.

           Общее число репрессированных за веру православных христиан является исключительно важной характеристикой гонений, обрушившихся на Церковь в XX веке. Именно оно интегрально определяет масштаб явления. Однако это число до сих пор остается дискутируемым, поскольку для его оценки применяются различные методики. Автором опубликована работа [1], в которой предложен метод подсчета, основанный на динамике наполнения Базы данных "За Христа пострадавшие". Эта База данных функционирует в ПСТГУ с 1993 г., и в настоящий момент содержит более 36 тыс. имен (в дальнейшем База). В статье [1] дано описание метода и приведена оценка общего числа репрессированных за веру. В настоящей работе описывается развитие этого метода и дается новая уточненная оценка, полученная после учета высказанных замечаний.

Об условиях корректности оценки и методике подсчетов

В работе [1] приводится основная формула для подсчета, которая имеет вид:

N=Nb*K/Kb. (1)

где: N - искомая оценка общего числа новомучеников;
Nb - количество персон в Базе;
K - количество персон в списке ввода новых персон;
Kb - количество персон из списка ввода, которые на момент ввода уже были в Базе (т.н. число "двойников").
Формула (1) имеет прозрачную интерпретацию (рис.1). При вводе некоторого списка в Базу, возникает ситуация, когда некоторые персоны из списка в Базе уже имеются. Поэтому значительный список ввода можно рассматривать как "уменьшенную копию" реального существующего соотношения между Базой и действительностью. Иначе говоря, при выполнении определенных условий в ней сохраняется отношение количеств между действительностью и Базой, т.е. N/Nb = K/Kb, откуда и следует (1). Параметры N и K (размеры Базы и списка ввода) вычисляются простым подсчетом, а параметр Kb может быть получен в ходе компьютерного эксперимента по вводу входного списка. Такой эксперимент описан в [1], причем в качестве списка ввода использовались данные из базы данных Мемориала по репрессиям в СССР [2]. Полученная в [1] оценка числа N составила 104 тыс. чел. с +- 40% отклонении от этого значения
           Для обеспечения корректности оценки необходимо, чтобы выполнялись три условия:

  1. независимость списка ввода от Базы, т.е. они должны быть получены из разных источников; иначе может случиться, что список ввода повторяет (пусть даже частично) материал, уже введенный в базу, что может привести к искажению оценки;
  2. представительность списка ввода, т.е. его размер - он должен быть не меньше нескольких тысяч; в противном случае может возникнуть сильный статистический разброс;
  3. репрезентативность и Базы и списка ввода.

           О последнем условии необходимо сказать подробнее. Под репрезентативностью понимается свойство некой выборки сохранять любые пропорциональные отношения меду подмножествами генеральной совокупности. Как База, так и список ввода являются выборками, и, следовательно, должны обладать репрезентативностью. Нарушение репрезентативности означает, что при формировании выборки совершалась систематическая ошибка ("перекос") по какому-то аспекту. Эта ошибка может исказить результаты, даже если выборка обладает большой представительностью. Например, если перекос сделан в сторону не мирян, то это означает, что мы в списке и Базе теряем часть мирян, и тогда вычисления по формуле (1) приведут к занижению N. Пропорциональность должна сохраняться и по любым другим аспектам. Ясно, что построить абсолютно репрезентативную выборку нельзя, но нужно постараться обеспечить пропорциональность для наиболее важных аспектов.
           Как показал опыт, к сожалению и База и список ввода, построенный по Базе Мемориала, создавались без учета репрезентативности - у них имеется перекос в сторону не мирян (т.е священников и монахов). Относительно Базы ПСТГУ этот перекос объясняется тем, что в списки ввода, приходящие из епархий, в первую очередь попадали именно священники и монахи - о них имелось больше всего информации. Данные же о мирянах выявлялись только во вторую очередь после более тщательного изучения следственных дел.
           Но как выяснить действительное соотношение между числами репрессированных мирян и не мирян? Это можно приближенно сделать по заранее известному репрезентативному списку, который мы будем называть "образцовым списком". Таким списком, по мнению известной исследовательницы Нины Павловны Зиминой, может служить книга: о. Алексия Скала "Церковь в узах: история Симбирско-Ульяновской епархии в советский период (1917-1991 годы)" [3]. В ней приведено описание всех связанных с новомучениками следственных дел в Симбирско-Ульяновской епархии. Исчерпывающая полнота анализа дел, изученных о. Алексием, позволяет надеяться, что этот список имеет высокую репрезентативность. Именно поэтому в данной работе он выбран в качестве образцового. Но поскольку книга "Церковь в узах" посвящена только одной епархии, то степень этой репрезентативности не следует преувеличивать ( искажения репрезентативности этой выборки . будут обнаружены на стадии экспериментов).
           В книге выявлено 896 репрессированных православных христиан, из их мирян 422; что составляет 47%, т.е. действительный процент "не мирян" составляет 53%. В Базе ПСТГУ процент мирян составляет 32%, а в списке ввода ("Мемориал") - только 18%. Это доказывает, что База и список являются нерепрезентативными выборками, и следовательно прямое вычисление N по формуле (1) может дать искаженный результат.
           Обойти эту трудность можно следующим способом. Ясно, что если оставить в Базе и списке ввода только "не мирян", то число персон в ней N будет числом "не мирян", которые по[3] составляют 53% общего числа. То есть полное число всех новомучеников Na составит N*100/53. Такой метод вычисления числа репрессированных только по какому-то подмножеству, с дальнейшей корректировкой этого числа в соответствии с долей этого подмножества в действительном пространстве новомучеников, позволяет избавляться и от других "перекосов". Базы и входного потока. В общем случае N вычисляется по формуле

N=(Nsb*Ks/Ksb)*(100/Proc) (2)

где:
- Nsb. Ks и Ksb - соответственно количество в Базе, во входном потоке и пересечении Базы и потока, но уже для некоторого подмножества (что обозначено с помощью буквой s - subset);
- Proc - доля подмножества в процентах в общем пространстве новомучеников.
           Тогда, рассчитывая N для разных подмножеств, мы можем с помощью (2) получать оценки числа новомучеников.

Результаты расчетов

Для проведения компьютерных экспериментов был модифицирован использовавшийся в [1] программный комплекс. Подсчет пересечений Базы и списка Ksb осуществлялся с помощью программы подсчета "двойников", т.е. дублей в Базе одной и той же персоны. Для сопоставления результатов с (1) в качестве входа использовался тот же самый материал -репрессированные верующие, программным путем выявленные из базы данных Мемориала [2], однако по сравнению с [1] их число было увеличено примерно вдвое. Процент Proc рассчитывался вручную по книге [3]. Для расчетов были выбраны следующие подмножества:

  1. "все новомученики"
  2. "не миряне" (священники и монахи, включая послушников, но исключая псаломщиков);
  3. все миряне;
  4. священники;
  5. председатели церковно-приходских советов и церковные старосты;
  6. псаломщики;
  7. диаконы;
Заметим, что выбор подмножеств а определенной степени произволен, ибо формула (2) должна давать приблизительно верный результат для любого подмножества. Результаты расчетов представлены в таблице.

ПН - Подмножество новомучеников,
% - Доля подмножества (по Скала [3])
Nbs (число элементов в базе данных)
Ks (число элементов списка ввода)
Ksb (число обнаруженных двойников)
Ns (общее число новомучеников в подмножестве)
N (общее число новомучеников)
   ПН                   %       Nbs     Ks      Ksb     Ns      N
1. все новомученики	100%	31785	14255	4743	95529	95529
2. "не миряне"	        53%	21206	11561	4017	61031	115152
3. все миряне	        47%	10579	2736	521	55554	118200
4. священники 	        37.5%	12960	8560	3070	36136	96362
4. старосты 	        6.2%	1357	812	148	7445	120080
6. псаломщики	        4.3%	1107	758	178	4714	109627
7. диаконы	        2.6%	1379	772	273	3899	149961

           Читать, например, четвертую строку таблицы надо читать следующим образом: всего в участвовало в эксперименте 12960 священников из Базы, входной поток содержал 8560 священников, причем из него уже содержится в Базе 3070 священников, оценка числа репрессированных священников 36136, оценка общего числа всех репрессированных за веру 96362 человека.

Обсуждение результатов

В первой строке представлены данные по всем репрессированным, что аналогично вычисленному в [1]. Небольшие расхождения объясняются лучшей наполненностью Базы по сравнению с версией 2012 года, на которой проводились обсчеты в [1]. Представляется, что наиболее достоверной является оценка по второй и третьей строкам: соответственно N=115152 чел. и 118200 чел., поскольку они были целенаправленно разработаны с целью устранение реального "перекоса" в Базе по священникам и монахам. Кроме того, тот факт, что по мирянам и "не мирянам" получены близкие результаты, говорит о репрезентативном соотношении между этими подмножествами. Таким образом, оценка числа новомучеников в данной работе составляет 115 -119 тыс. человек. Результаты строк 5, 6 и 7 дают значительный разброс оценок. Видимо, это связано с очень малыми долями (6.2%, 4.3%, 2.6%) данных подмножеств, величины которых скорее всего неточны в силу недостаточной репрезентативности образцовой выборки [3]. Особого объяснения требует несколько заниженный по сравнению с другими результат строки 4 ("священники") -96321 чел. Видимо, его можно объяснить тем, что фамилии имена, отчества и годы рождений у священников часто совпадают, и программа подсчета двойников принимает таких персон за "двойников" (хотя в действительности это разные личности), в результате чего выдается завышенное значение Nsb. Дать оценку погрешности метода представляется затруднительным - он существенно зависит от качества "образцовой выборки", которое оценить крайне проблематично. Поэтому в дальнейшем, в качестве развития метода представляется желательным получить более достоверную "образцовую выборку", репрезентативность которой выше используемой в настоящей работе.

Литература

  1. Н.В. Сомин. К вопросу о числе репрессированных за православную веру в России в XX в. //Вестник ПСТГУ, 3(64), История русской православной церкви. Москва 2015, С. 101-106.
  2. База данных о жертвах политического террора в СССР. Компакт-диск. 3-е изд. НИПЦ "Мемориал". М.: Звенья, 2004.
  3. Прот. Алексий Скала. Церковь в узах: история Симбирско-Ульяновской епархии в советский период (1917-1991 годы).- ОАО "ИПК Ульяновский Дом печати", 2007. -968 стр.