1 Саратовский государственный технический университет, 410054, Саратов, ул. Политехническая, 77 2 Санкт-Петербургский государственный университет информационных технологий, механики и оптики, 197101 Санкт-Петербург, Кронверкский пр., 49 Аннотация. Поиск сайтов начала репликации (ORI) в ДНК человека -актуальная для современной биологии проблема. Предложенный нами подход для предсказания положения ORI в человеческом геноме базируется на поиске скрытых зависимостей в последовательностях нуклеотидов при помощи метода сравнения вейвлет-спектров. Подбор параметров вейвлет-преобразования был осуществлен на основе данных о положении некоторых известных ORI в геноме человека. Применение вейвлет-преобразования с найденными параметрами для предсказания ORI в последовательностях с неизвестным расположением сайтов начала репликации и в случайных последовательностях нуклеотидов показало хорошие результаты. Результаты анализа вейвлет-спектров последовательностей нуклеотидов могут быть применены как самостоятельно в качестве индикаторов положения ORI, так и как один из факторов в различных классификаторах, таких, как байесовский классификатор, метод опорных векторов и других. В работе указаны преимущества и недостатки метода и приведены возможные пути повышения его эффективности.
Ключевые слова: вейвлет-спектр, ДНК, спектральный анализ, сайт начала репликации.
ВВЕДЕНИЕРепликация ДНК является одним из важнейших клеточных процессов, ответственных за точную передачу генетической информации в последовательных поколениях клеток. Этот процесс начинается с определенного места в последовательности ДНК, называемого сайтом начала репликации (origin of replication, ORI). Репликация ДНК может быть как однонаправленной, так и двунаправленной, что определяется характером перемещения одной или двух расходящихся вилок репликации вдоль молекулы ДНК. Инициирование ORI у эукариотов связано с фазами клеточного цикла и может сильно зависеть от расстояния и времени активации соседних ORI, от транскрипционной активности, а также от локальной структуры хроматина [1]. Следует отметить, что последовательность нуклеотидов, распознаваемая белками, инициирующими процесс репликации, существенно различается как в различных эукариотических организмах, так и в пределах одной молекулы ДНК. В одноклеточных эукариотах Saccharomyces cerevisiae ORI представлены * andrei_050724@mail.ru †