Использование компьютерных технологий в изучении средневековых нарративных источников

Процесс интеграции технических и гуманитарных дисциплин, использование количественных методов и математического моделирования в исторической науке открыло новые возможности для текстологических исследований, изучения нарративных источников. В отечественной историографии существует значительное количество не атрибутированных средневековых сочинений. В фундаментальной работе Д.С. Лихачева «Текстология» часто проскальзывает мысль, что установление автора и источников какого-либо произведения целиком зависит от таланта и языко-вого чутья исследователя. Современные методы, использование компьютерных технологий дают возможность не только находить авторов анонимных текстов, но и подтвердить эти находки комплексом убедительных доказательств.
К числу таких анонимных произведений относится и киевский «Синопсис» XVII в. Он был создан в стенах Киево-Печерской лавры. Автор «Синопсиса» неизвестен и существует несколько исторических личностей, которые могут быть признаны его авторами.
Изучая проблему авторства «Синопсиса», следует рассматривать его текст как знаковую систему, состоящую из одних и тех же элементов. Причиной отличий между разными текстами становится характер связей между этими элементами. Такие различия между текстами и определяют авторский стиль. Сейчас в лаборатории компьютерных технологий исторических исследований под руководством проф. В.В. Подгаецкого создана компьютерная программа, формирующая математические модели авторского стиля каждого из возможных авторов «Синопсиса» я самого текста «Синопсиса». В отличие от других атрибутирующих программ, она ориентирована на синтаксический, а не семантический контент-анализ. Контент-анализ применим к любому тексту, рассматриваемому как система, как упорядоченный набор элементов. Данная программа рассматривает текст как синтаксическую, а не семантическую систему. Как основной эле-мент знаковой системы принимается буква, а не какая-либо смысловая единица. Определяются статистические связи между этими элементами знаковой системы и частота встречаемости каждого символа в тексте (в процентах), а также парная встречаемость этих символов. На основе матрицы парной встречаемости буквенных символов рассчитывается энтропия текста, т.е. количественная мера его неопределенности. Индивидуальный авторский стиль обусловливает различия в уровне энтропии для каждого автора. Сравнение полученных для каждого из вероятных авторов коэффициентов энтропии с коэффициентом самого «Синопсиса» должно указать автора памятника.
В настоящий момент проводятся эксперименты с текстами известных авторов. Использованы два отрывка из работ Л.Н. Гумилева, два — Д.С. Лихачева и один — Е.В. Тарле. Полученный коэффициент энтропии совпадает для текстов, написанных одним и тем же автором, причем на него не влияет ни жанр использованного произведения, ни наличие в нем цитат, ни размеры сравниваемых отрывков. В текстах, принадлежащих перу разных авторов, коэффициент энтропии резко отличается. Тем самым подтверждается гипотеза о связи уровня энтропии и особенностей авторского стиля.
Следующим этапом работы станет определение автора киевского «Синопсиса», а в перспективе данная программа может быть применена к другим не атрибутированным текстам, в том числе, тексты раннего средневековья, в которых довольно сложно выделить особенности авторского стиля в нагромождении характерных для средневекового летописания штампов.

Тарнапольская И.О., аспірантка кафедри історіографії та джерелознавства ДДУ

Регіональне і загальне в історії: Тези міжнародної наукової конференції, присвяченої 140-річчю від дня народження Д.І. Яворницького та 90-літтю XIII Археологічного з’їзду (9 листопада 1995 р.). Дніпропетровськ, 1995. — 328 с.