В этой работе мы обсудим подходы и методы решения проблемы классификации комплексов белок-ДНК. Для решения задачи предполагается использовать методы вычислительной геометрии и статистического анализа многомерных данных, а в качестве объекта исследования-два семейства факторов транскрипции и их комплексы с ДНК: гомеодомены и цинковые пальцы. Вычислены значения переменных, характеризующих геометрию нуклеотидов двойной спирали ДНК в ее комплексе с белком: «диккерсоновы параметры», двугранные углы, водородные связи и т. д. (на основе данных о 19 структурах комплексов из PDB). На первом этапе решается задача о воздействии качественного фактора-фрагмента нуклеотидной последовательности ДНК в интерфейсе белок-ДНК, имеющего 19 уровней, на переменные Shear, Stretch, Stagger, Buckle, Propeller, Opening. Результаты статистического анализа позволяют сделать вывод о том, что это влияние на Stretch, Stagger, Propeller и Opening-статистически значимо, а на Shear и Buckle-статистически не значимо. Известно, что угловой параметр, Propeller, коррелирует с гибкостью ДНК и существенно меняется при связывании гомеодомена с ДНК. Ни для одного из параметров не найдено комплекса со статистически значимым максимумом или минимумом, что указывает на консервативность влияния связывания гомеодомена на структуру ДНК. Ключевые слова: структура интерфейсов, комплексы ДНК-белок, гомеодомен, цинковый палец, классификация, многомерный статистический анализ. Classification of DNA complexes of homeodomain and zinc-finger protein families: statistical analysis of DNA structures in interfaces of homeodomain-DNA complexes