Аннотация. В статье предложен метод поиска потенциальных сдвигов рамки считывания в генах, основанный на обнаружении точек разладки в распределении частот триплетов. Оценка статистической значимости разладки проводилась с помощью метода Монте-Карло. Корректность разработанного метода была продемонстрирована на последовательностях ДНК, содержащих искусственно внесенные в последовательность вставки. На предмет присутствия точек разладки были проанализированы последовательности банка данных KEGG GENES. На уровне значимости 6% было обнаружено, что более 140 тыс. последовательностей содержат точки разладки. Была проведена классификация последовательностей, имеющих точки разладки, по полю description в банке данных KEGG GENES. Оказалось, что большое число этих последовательностей являются псевдогенами, а во многих из них ранее были выявлены сдвиги рамки считывания. Наряду с этими последовательностями точки разладки были идентифицированы в генах, кодирующих PE-PGRS, cation channel family protein, PPE family protein и многие другие белки. Обсуждается связь между наличием в последовательности ДНК точки разладки и сдвигом рамки считывания.Ключевые слова: последовательность ДНК, рамка считывания, сдвиг рамки считывания, точка разладки, метод Монте-Карло.
ВВЕДЕНИЕМутации в генах осуществляются посредством замен оснований ДНК, а также посредством вставок или делеций как отдельных оснований ДНК, так и фрагментов ДНК различной длины. Нуклеотидные замены могут приводить к аминокислотным заменам в кодируемых белках. Достаточно часто аминокислотные замены могут оказывать серьезное влияние на способность белка выполнять биологическую функцию [1]. Другой возможный вид мутаций -вставки и делеции нуклеотидов. Они происходят в генах реже замен оснований, однако являются более значимыми эволюционными событиями. При делециях или вставках оснований длины, некратной трем, происходит изменение протяженного участка аминокислотной последовательности из-за сдвига рамки считывания. Вследствие этого аминокислотная последовательность полностью меняется после позиции сдвига рамки считывания.Влияние сдвигов рамки считывания в генах на структуру и функцию белка сравнительно мало изучено. В ряде случаев они могут являться причиной наследственных болезней, так как белок, кодируемый измененной последовательностью, утрачивает свои функции. Например, было показано, что * v.m