Метод поиска похожих последовательностей кода в исполняемых бинарных файлах… Юмаганов А.С., Мясников В.В. 756Компьютерная оптика, 2017, том 41, №5 Аннотация Работа посвящена решению задачи поиска похожих последовательностей кода в испол-няемых бинарных файлах. Предлагается метод решения, при котором промежуточное век-торное описание функции формируется на основе сравнения пространственного положения каждой из функциональных групп команд процессора данной функции и функций некото-рой «базисной» библиотеки. Размерность полученного таким образом вектора понижается, и полученное окончательное описание используется для осуществления поиска. Представ-лены результаты экспериментальных исследований, демонстрирующие работоспособность данного метода. Исследована эффективность данного метода в сравнении с некоторыми ра-нее известными методами поиска похожих последовательностей кода, даны рекомендации по выбору параметров разработанного метода. ЧИСЛЕННЫЕ МЕТОДЫ И АНАЛИЗ ДАННЫХ МЕТОД ПОИСКА ПОХОЖИХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ КОДА В ИСПОЛНЯЕМЫХ БИНАРНЫХ ФАЙЛАХ С ИСПОЛЬЗОВАНИЕМ БЕСПРИЗНАКОВОГО ПОДХОДАКлючевые слова: поиск, последовательность кода, беспризнаковое распознавание. ВведениеПовторное использование кода (code reuse) часто применяется программистами в процессе создания нового программного обеспечения (ПО). Согласно исследованиям [1] около 15 % функций в програм-мах с открытым исходным кодом являются повторно использованными. Такой подход позволяет разра-ботчикам нового ПО экономить время, финансовые и трудовые ресурсы на разработке программных мо-дулей, требуемый функционал которых ранее уже был реализован другими разработчиками. Однако повторное использование кода имеет некоторые не-достатки. Во-первых, повторное использование кода может нарушать лицензионное соглашение на ис-пользование ПО. Во-вторых, велик риск переноса участка кода, содержащего уязвимость или ошибку. Решение задачи поиска похожих последовательно-стей кода может быть применено и для выявления нарушений лицензионных соглашений, и для нахождения ошибок и уязвимостей ПО, и для обна-ружения вредоносного ПО.К настоящему моменту известно большое количе-ство методов поиска похожих последовательностей кода в исполняемых файлах. Одним из наиболее из-вестных является алгоритм FLIRT (Fast Library Identification and Recognition Technology) [2], исполь-зуемый для поиска библиотечных функций в дизас-семблере IDA. Он основан на сравнении шаблонов функций, которые представляют собой первые 32 байта функции с пометкой всех изменяемых байтов. Однако данный метод не предполагает идентифика-цию модифицированных функций. Другой метод, представленный в работе [3], основан на сравнении ограниченных последовательностей команд процес-сора внутри функций (k-грамм). Данный алгоритм чувствителен к некоторым видам обфускации кода (например, к вставке «мусорных» команд) и оптими-зациям компилятора.Помимо методов поиска, основанных на анализе непосредственно ассемблерного кода, существуют также алгоритмы поиска похожих последовательно-стей кода на основе сравнения графов потока управ-...
In this article a new method of nonlinear local processing of digital images, named a local order transform, is proposed and investigated. Properties of the proposed transform are determined. The relevance and efficiency of the proposed method are demonstrated for the applied problem of detecting duplicates in digital images in the case of brightness distortions.
Сравнение алгоритмов управляемой поэлементной классификации гиперспектральных изображений Кузнецов А.В., Мясников В.В. 494Компьютерная оптика, 2014, том 38, №3 Аннотация Настоящая работа посвящена решению задачи выбора наилучшего алгоритма классифи-кации гиперспектральных изображений (ГСИ). В сравнении участвуют следующие алго-ритмы: дерево решений с использованием функционала скользящего контроля, дерево ре-шений C4.5 (C5.0), байесовский классификатор, метод максимального правдоподобия, классификатор, минимизирующий СКО решения, включая частный случай -классифика-цию по сопряжённости, классификатор по спектральному углу (для эмпирического средне-го и ближайшего соседа), а также метод опорных векторов (SVM). В работе приведены ре-зультаты исследований этих алгоритмов на гиперспектральных снимках, полученных со спутника AVIRIS и в рамках проекта SpecTIR.Ключевые слова: гиперспектральное изображение, дерево решений, C5.0, Байес, ММП, СКО, классификация по сопряжённости, классификация по спектральному углу, SVM. ВведениеГиперспектральные космические снимки всё чаще используются при решении прикладных задач обра-ботки изображений [1][2][3]. Отличительной особенно-стью данного вида изображений является большое количество спектральных компонент. Так, к примеру, снимки, полученные с космического спутника EO-1 Hyperion, имеют 220 спектральных каналов, распре-делённых на частотном диапазоне от 0,4 до 2,5 мкм.В силу большого объёма данных многие известные методы анализа цифровых изображений не могут быть использованы в их существующей реализации ввиду высокой вычислительной сложности и неспособности выполнить обработку за приемлемое время. Поэтому специалистам в обработке изображений приходится вновь решать классические задачи анализа цифровых изображений, дорабатывать существующие методы, встраивать дополнительные этапы предобработки и снижения размерности признакового пространства.Наиболее важными задачами анализа цифровых ГСИ являются задачи компрессии [4], сегментации [5], неуправляемой поэлементной классификации [6], управляемой поэлементной классификации (тематиче-ского дешифрирования) [7, 8] и спектрального разложе-ния [9]. Последние две задачи для ГСИ чаще всего ста-вятся и решаются в режиме классификации отдельных отсчётов [7, 9], хотя возможны и другие постановки [8].
In this paper, we propose an algorithm for the automatic construction (design) of a computational procedure for non-linear local processing of digital signals/images. The aim of this research is to work out an image processing algorithm with a predetermined computational complexity and achieve the best quality of processing on the existing data set, while avoiding a problem of retraining or doing with less training. To achieve this aim we use a local discrete wavelet transform for a preliminary image analysis and the hierarchical regression to construct a local image processing procedure on the basis of a training dataset. Moreover, we work out a method to decide whether the training process should be completed or continued. This method is based on the functional of full cross-validation control, which allows us to construct the processing procedure with a predetermined computational complexity and veracity, and with the best quality.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.