Содержание статьи
- Требования к функции
- Компиляция WinAFL
- Поиск подходящей цели для фаззинга
- Поиск функции для фаззинга внутри программы
- Аргументы WinAFL, подводные камни
- Прокачка WinAFL — добавляем словарь
- Особенности WinAFL
- Побочные эффекты
- Дебаг-режим
- Эмуляция работы WinAFL
- Стабильность
- Набор входных файлов
- Отучаем программу ругаться
Что такое фаззинг
Если ты совсем незнаком с этой техникой поиска уязвимостей, то можешь обратиться к одной из наших вводных статей:
- «Фаззинг, фаззить, фаззер: ищем уязвимости в программах, сетевых сервисах, драйверах»
- «Luke, I am your fuzzer. Автоматизируем поиск уязвимостей в программах»
Также по теме фаззинга рекомендуем следующие статьи:
Так же как и AFL, WinAFL собирает информацию о покрытии кода. Делать это он может тремя способами:
- динамическая инструментация с помощью DynamoRIO;
- статическая инструментация с помощью Syzygy;
- трейсинг с помощью IntelPT.
Мы остановимся на классическом первом варианте как самом простом и понятном.
Фаззит WinAFL следующим образом:
- В качестве одного из аргументов ты должен передать смещение так называемой целевой функции внутри бинаря.
- WinAFL инжектится в программу и ждет, пока не начнет выполнятся целевая функция.
- WinAFL начинает записывать информацию о покрытии кода.
- Во время выхода из целевой функции WinAFL приостанавливает работу программы, подменяет входной файл, перезаписывает RIP/EIP адресом начала функции и продолжает работу.
- Когда число таких итераций достигнет некоторого максимального значения (его ты определяешь сам), WinAFL полностью перезапускает программу.
Такой подход позволяет не тратить лишнее время на запуск и инициализацию программы и значительно увеличить скорость фаззинга.
Требования к функции
Из логики работы WinAFL вытекают простые требования к целевой функции для фаззинга. Целевая функция должна:
- Открывать входной файл.
- Парсить файл и завершать свою работу максимально чисто: закрывать файл и все открытые хендлы, не менять глобальные переменные и так далее. В реальности не всегда получается найти идеальную функцию парсинга, но об этом поговорим позже.
- Выполнение должно доходить до возврата из функции, выбранной для фаззинга.
Компиляция WinAFL
В репозитории WinAFL на GitHub уже лежат скомпилированные бинари, но у меня они просто не захотели работать, поэтому для того, чтобы не пришлось разбираться с лишними проблемами, скомпилируем WinAFL вместе с самой последней версией DynamoRIO. К счастью, WinAFL относится к тем немногочисленным проектам, которые компилируются без проблем на любой машине.
- Скачай и установи Visual Studio 2019 Community Edition (при установке выбери пункт «Разработка классических приложений на C++».
- Пока у тебя устанавливается Visual Studio, скачай последний релиз DynamoRIO.
- Скачай исходники WinAFL из репозитория.
- После установки Visual Studio в меню «Пуск» у тебя появятся ярлыки для открытия командной строки Visual Studio: x86 Native Tools Command Prompt for VS 2019 и x64 Native Tools Command Prompt for VS 2019. Выбирай в соответствии с битностью программы, которую ты будешь фаззить.
-
В командной строке Visual Studio перейди в папку с исходниками WinAFL.
Для компиляции 32-битной версии выполни следующие команды:
mkdir build32cd build32cmake -G"Visual Studio 16 2019" -A Win32 .. -DDynamoRIO_DIR=..\path\to\DynamoRIO\cmake -DINTELPT=0 -DUSE_COLOR=1cmake --build . --config ReleaseДля компиляции 64-битной версии — такие:
mkdir build64cd build64cmake -G"Visual Studio 16 2019" -A x64 .. -DDynamoRIO_DIR=..\path\to\DynamoRIO\cmake -DINTELPT=0 -DUSE_COLOR=1cmake --build . --config ReleaseВ моем случае эти команды выглядят так:
cd C:\winafl_build\winafl-master\mkdir build32cd build32cmake -G"Visual Studio 16 2019" -A Win32 .. -DDynamoRIO_DIR=C:\winafl_build\DynamoRIO-Windows-8.0.18915\cmake -DINTELPT=0 -DUSE_COLOR=1cmake --build . --config Release После компиляции в папке
<
будут лежать рабочие бинари WinAFL. Скопируй их и папку с DynamoRIO на виртуалку, которую будешь использовать для фаззинга.WinAFL dir>\ build< 32/ 64>\ bin\ Release
Поиск подходящей цели для фаззинга
AFL создавался для фаззинга программ, которые парсят файлы. Хотя WinAFL можно применять для программ, использующих другие способы ввода, путь наименьшего сопротивления — это выбор цели, использующей именно файлы.
Если же тебе, как и мне, нравится дополнительный челлендж, ты можешь пофаззить сетевые программы. В этом случае тебе придется использовать custom_net_fuzzer.
из состава WinAFL либо писать свою собственную обертку.
info
К сожалению, custom_net_fuzzer
будет работать не так быстро, потому что он отправляет сетевые запросы своей цели, а на их обработку будет тратиться дополнительное время.
Однако фаззинг сетевых приложений выходит за рамки этой статьи. Оставь комментарий, если хочешь отдельную статью на эту тему.
Таким образом:
- идеальная цель работает с файлами;
- принимает путь к файлу как аргумент командной строки;
- модуль, содержащий функции, который ты хочешь пофаззить, должен быть скомпилирован не статически. В противном случае WinAFL будет инструментировать многочисленные библиотечные функции. Это не принесет дополнительного результата, но сильно замедлит фаззинг.
Удивительно, но большинство разработчиков не думают о WinAFL, когда пишут свои программы. Поэтому если твоя цель не соответствует этим критериям, то ее все равно можно при желании адаптировать к WinAFL.
Поиск функции для фаззинга внутри программы
Мы поговорили об идеальной цели, но реальная может быть от идеала далека, поэтому для примера я взял программу из старых запасов, которая собрана статически, а ее основной исполняемый файл занимает 8 Мбайт.
У нее много всяких возможностей, так что, думаю, ее будет интересно пофаззить.
Моя цель принимает на вход файлы, поэтому первое, что сделаем после загрузки бинаря в IDA Pro, — это найдем функцию CreateFileA
в импортах и посмотрим перекрестные ссылки на нее.

Мы сразу же можем увидеть, что она используется в четырех функциях. Вместо того чтобы реверсить каждую из них в статике, посмотрим в отладчике, какая именно функция вызывается для парсинга файла.
Откроем нашу программу в отладчике (я обычно использую x64dbg) и добавим аргумент к командной строке — тестовый файл. Откуда я его взял? Просто открыл программу, выставил максимальное число опций для документа и сохранил его на диск.

Дальше на вкладке Symbols выберем библиотеку kernelbase.dll и поставим точки останова на экспорты функций CreateFileA
и CreateFileW
.

Один любопытный момент. «Официально» функции CreateFile*
предоставляются библиотекой kernel32.dll. Но если посмотреть внимательнее, то это библиотека содержит только jmp на соответствующие функции kernelbase.dll.

Я предпочитаю ставить брейки именно на экспорты в соответствующей библиотеке. Это застрахует нас от случая, когда мы ошиблись и эти функции вызывает не основной исполняемый модуль (.exe), а, например, какие‑то из библиотек нашей цели. Также это полезно, если наша программа захочет вызвать функцию с помощью GetProcAddress
.
После установки брейк‑пойнтов продолжим выполнение программы и увидим, как она совершает первый вызов к CreateFileA
. Но если мы обратим внимание на аргументы, то поймем, что наша цель хочет открыть какой‑то из своих служебных файлов, не наш тестовый файл.

Продолжим выполнение программы, пока не увидим в списке аргументов путь к нашему тестовому файлу.

Перейдем на вкладку Call Stack и увидим, что CreateFileA
вызывается не из нашей программы, а из функции CFile::
библиотеки mfc42.

Так как мы только ищем функцию для фаззинга, нам нужно помнить, что она должна принимать путь к входному файлу, делать что‑то с файлом и завершать свою работу настолько чисто, насколько это возможно. Поэтому мы будем подниматься по стеку вызовов, пока не найдем подходящую функцию.
Скопируем адрес возврата из CFile::
, перейдем по нему в IDA и посмотрим на функцию. Мы сразу же увидим, что эта функция принимает два аргумента, которые далее используются как аргументы к двум вызовам CFile::
.

Судя по прототипам CFile::
из документации MSDN, наши переменные a1
и a2
— это пути к файлам. Обрати внимание, что в IDA путь к файлу передается функции CFile::
в качестве второго аргумента, так как используется thiscall
.
virtual BOOL Open( LPCTSTR lpszFileName, UINT nOpenFlags, CFileException* pError = NULL);virtual BOOL Open( LPCTSTR lpszFileName, UINT nOpenFlags, CAtlTransactionManager* pTM, CFileException* pError = NULL);
Эта функция уже выглядит очень интересно, и стоит постараться рассмотреть ее подробнее. Для этого я поставлю брейки на начало и конец функции, чтобы изучить ее аргументы и понять, что с ними происходит к концу функции.
Сделав это, перезапустим программу и увидим, что два аргумента — это пути к нашему тестовому файлу и временному файлу.

Самое время посмотреть на содержимое этих файлов. Судя по содержимому нашего тестового файла, он сжат, зашифрован или каким‑то образом закодирован.

Временный же файл просто пуст.

Выполним функцию до конца и увидим, что наш тестовый файл все еще зашифрован, а временный файл по‑прежнему пуст. Что ж, убираем точки останова с этой функции и продолжаем отслеживать вызовы CreateFileA
. Следующее обращение к CreateFileA
дает нам такой стек вызовов.

Функция, которая вызывает CFile::
, оказывается очень похожей на предыдущую. Точно так же поставим точки останова в ее начале и конце и посмотрим, что будет.

Список аргументов этой функции напоминает то, что мы уже видели.

Срабатывает брейк в конце этой функции, и во временном файле мы видим расшифрованное, а скорее даже разархивированное содержимое тестового файла.

Таким образом, эта функция разархивирует файл. Поэкспериментировав с программой, я выяснил, что она принимает на вход как сжатые, так и несжатые файлы. Нам это на руку — с помощью фаззинга несжатых файлов мы сможем добиться гораздо более полного покрытия кода и, как следствие, добраться до более интересных фич.
Посмотрим, сможем ли мы найти функцию, которая выполняет какие‑то действия с уже расшифрованным файлом.
Один из подходов к выбору функции для фаззинга — это поиск функции, которая одной из первых начинает взаимодействовать с входным файлом. Двигаясь вверх по стеку вызовов, найдем самую первую функцию, которая принимает на вход путь к тестовому файлу.

Функция для фаззинга должна выполняться до конца, поэтому ставим точку останова на конец функции, чтобы быть уверенными, что это требование выполнится, и жмем F9 в отладчике.

Также убедимся, что эта функция после возврата закрывает все открытые файлы. Для этого проверим список хендлов процесса в Process Explorer — нашего тестового файла там нет.

Видим, что наша функция соответствует требованиям WinAFL. Попробуем начать фаззить!
Продолжение доступно только участникам
Вариант 1. Присоединись к сообществу «Xakep.ru», чтобы читать все материалы на сайте
Членство в сообществе в течение указанного срока откроет тебе доступ ко ВСЕМ материалам «Хакера», позволит скачивать выпуски в PDF, отключит рекламу на сайте и увеличит личную накопительную скидку! Подробнее
Вариант 2. Открой один материал
Заинтересовала статья, но нет возможности стать членом клуба «Xakep.ru»? Тогда этот вариант для тебя! Обрати внимание: этот способ подходит только для статей, опубликованных более двух месяцев назад.
Я уже участник «Xakep.ru»