ОБЗОР194021, Санкт-Петербург, ул. Хлопина, д. 8, к. 3; эл. почта: vyatkina@spbau.ru 2 Санкт-Петербургский государственный университет; 199034, Санкт-Петербург, Университетская наб., д. 7-9Установление первичной структуры белков и пептидов является важным этапом при изучении их свойств. В настоящее время для решения данной задачи наиболее часто используется масс-спектрометрия. Результаты масс-спектрометрических измерений могут быть интерпретированы посредством поиска в базе данных или методами de novo секвенирования. Привлекательность последних обусловлена возможностью их применения для исследования неизвестных белков, а также тех, которые не могут быть проанализированы методами геномики или транскриптомики. В данной статье предлагается краткий обзор существующих подходов к de novo секвенированию белков и пептидов и решаемых с их помощью задач, а в завершение обозначены направления и перспективы их дальнейшего развития. масс-спектру, причем его вершины порождаются пиками, а рёбра соединяют пары вершин, "отличающихся" друг от друга на массу остатка какой-либо аминокислоты (рис. 1). Каждое ребро спектрального графа помечено соответствующей аминокислотой (с точностью до замены I/L), а любой путь в этом графе определяет аминокислотную последовательность, образованную метками составляющих его рёбер. Таким образом, полная или частичная интерпретация масс-спектра сводится к нахождению в его спектральном графе оптимального или нескольких лучших (с точки зрения используемой оценочной функции) путей.На сегодняшний день наиболее мощной и часто используемой коммерческой программой, несомненно, является PEAKS [28]; из бесплатных программных инструментов уже более десяти лет пользуется популярностью PepNovo [29]. К недавним разработкам относятся метод Twister, изначально предназначенный для de novo секвенирования пептидов по наборам тандемных масс-спектров "сверху вниз" (top-down) [30][31][32], а впоследствии адаптированный к случаю данных "снизу вверх" (bottom-up) высокого разрешения [33], и Novor [34], позволяющий обрабатывать масс-спектры триптических пептидов.Идентификация масс-спектров путем поиска в базе данных традиционно считается более надежным методом определения аминокислотной последовательности, нежели de novo секвенирование. Действительно, количество потенциально возможных интерпретаций масс-спектра, которые могут быть получены из базы данных, заведомо окажется существенно меньше числа всех возможных его интерпретаций*, а, следовательно, значительно сократится и число неверных интерпретаций, что, в свою очередь, должно уменьшить риск ошибки при попытке выбрать единственный правильный вариант. Ещё одна причина заключается в недостатке методов контроля качества результатов de novo секвенирования, сопоставимых с методами оценки уровня ложноположительных результатов (False Discovery Rate, FDR), используемых при поиске в базе данных [35]. Однако технологические достижения и алгоритмические разработки последних лет обеспечили повышение надежности методов de novo секвенирования, что открывает новые перспективы для их пр...