Анализ восстановленного программного кода с использованием абстрактных синтаксических деревьев

Безопасность программного обеспечения
Авторы:
Аннотация:

В статье предлагается метод предварительной обработки фрагментов бинарных программных кодов для последующего определения их схожести с использованием методов машинного обучения. В основе метода лежит анализ псевдокода, полученного в результате декомпиляции фрагментов бинарных кодов. Анализ производится с использованием атрибутных абстрактных синтаксических деревьев. В рамках исследования произведено тестирование и сравнительный анализ эффективности разработанного метода. Данный метод позволяет повысить эффективность обнаружения функционально схожих фрагментов программного кода, по сравнению с аналогами, за счет использования семантического контекста вершин в абстрактном синтаксическом дереве.