“…Как уже говорилось выше, результаты автоматизированной обработки текста были скорректированы в семантическом аспекте, на основе семантических категорий были сформированы группы лексических репрезентантов. Ранее, в работе [18], было установлено, что для документного дискурса значимым является такое свойство, как фактографичность -включение в текст единиц рефератного характера, позволяющих установить факт события. В этой связи лексемы были объединены в категории фактографического характера: «Персоналии», «Топонимы», «Год», «Дата» (названия дней, месяцев), «Национальность» для определения степени «документальности» исследуемых корпусов.…”