Аннотация
Актуальность исследования определяется необходимостью создания лингвистических корпусов мало доступных исторических актовых источников, хранящихся в региональных архивах. Материалом для работы избран фонд Михайловского станичного атамана Государственного архива Волгоградской области [ГАВО, фонд 332, опись 1, дела 1-158, 1734-1837 гг.]. Жанровое разнообразие документов фонда обусловливает выработку критериев их жанровой параметризации, на основе которой может осуществляться метаразметка, позволяющая автоматизировать обработку всего массива источников и производить поиск лингвистической информации по их метаданным. С целью определения речевых маркеров жанра документа для его автоматического распознавания в корпусе произведена параметризация сказок середины XVIII века - документов, содержащих сведения по следственным делам. Выявлены речевые средства выражения тех параметров, которые обусловлены коммуникативной ситуацией и соотносятся с формуляром документа: название, адресант, адресат, функция, структура, характер передаваемой информации, пространственно-временная локализация документа. Показана вариативность речевого воплощения формуляра сказки. В качестве речевых маркеров жанра для метаразметки определены самоназвание документа в сочетании с указательным или притяжательным местоимением и глаголами, выражающими коммуникативное действие: сию сказку , дали сию сказку , своей сказкой сказали .