Предложен подход к идентификации версий программного обеспечения на основе алгоритма градиентного бустинга деревьев решений. Предложено применять алгоритм CatBoost, разработанный компанией Яндекс, для решения задачи идентификации программного обеспечения операционных систем Linux с целью уменьшения числа уязвимостей системы, возникающих при установке несанкционированного программного обеспечения пользователями автоматизированных систем. Рассмотрен подход к формированию сигнатур программ и дальнейшему обучению модели классификатора CatBoostClassifier. Поставлена задача последующего распознавания идентифицируемых программ, ранее не задействованных в процессе обучения модели. Метод. Для реализации алгоритма градиентного бустинга деревьев решений использовано свободное программное обеспечение CatBoost. На его основе создана мультиклассификационная модель CatBoostClassifier. Применение этой модели позволяет идентифицировать elf-файлы тестовой выборки. Основные результаты. Выбраны параметры обучения модели классификации. Проведен эксперимент по идентификации исполняемых файлов с использованием десяти различных признаков формирования сигнатур программ. Полученные результаты сравниваются с результатами ранее разработанного авторами метода идентификации, основанного на применении статистического критерия однородности хи-квадрат при уровне значимости 0,01. Практическая значимость. Результаты работы могут быть рекомендованы специалистам по информационной безопасности для проведения аудита электронных носителей информации. Разработанный подход позволяет выявить нарушения установленной политики безопасности при обработке конфиденциальной информации. Ключевые слова машинное обучение, градиентный бустинг деревьев решений, CatBoost, идентификация исполняемых файлов, elfфайлы, информационная безопасность Благодарности Работа выполнена по теме № 0073-2018-0008.
An approach to analyzing the state of information security of industrial Internet devices and the Internet of things is described. External control systems that use side channels and allow to avoiding the consumption of computing resources of functioning devices are used. The proposed solution allows one to monitor the state of the device on-line with minimal costs for using computing resources during operation.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.