Локальный Deep Research. Совершенствуем собственный ИИ-поисковик

Содержание статьи

От «умного поиска» к полноценному исследованию
Стратегическое планирование
От теории к практике
Локальный LLM-оркестратор
Результат

Есть разные причины разворачивать ИИ‑агентов на своем железе вместо того, чтобы платить провайдеру. Сегодня посмотрим, как перейти от систем с линейными пайплайнами к автономному глубокому исследованию на основе агентов LangGraph.

info

В прошлой статье о Deep Research мы уже начали разбираться с домашними ИИ‑поисковиками и исследовательскими проектами на примере Vane, сегодня попробуем кое‑что помощнее.

Что вообще такое Deep Research и зачем он нужен? Такие системы, а их уже много, работают как личный аналитик: не просто отвечают на вопрос, а разбирают его со всех сторон, сами строят план исследования, идут в поисковики, работают с источниками, отсекают информационный мусор и собирают подробный отчет.

По сути, я только что описал алгоритм работы таких систем, но с одной оговоркой: в системах с пайплайном исследование идет линейно или, в лучшем случае, итеративно, а в более сложных системах появляется рефлексия. На каждом шаге система спрашивает себя: эти данные точно относятся к запросу пользователя? Их достаточно или нужно еще? Если ответ на любой из этих вопросов отрицательный, система меняет стратегию: пробует другие источники или меняет поисковый запрос.

В общем, это настоящий мастхев для сложных задач, когда нужно с нуля погрузиться в незнакомую тему, а времени и желания вручную просеивать сотни вкладок банально нет. (А вот для школьных рефератов или курсовых такая система, во‑первых, избыточна, а во‑вторых, детекторы текстов, написанных ИИ, тоже есть.)

Почему стоит разворачивать такую систему именно на домашнем компьютере? Плюсов хватает:

Свобода выбора: ты сам решаешь, какую модель использовать как оркестратор. Если для какой‑то задачи нужна модель без цензуры — просто скачиваешь нужные веса.
Никаких подписок и банов: твою учетную запись никто внезапно не заблокирует из‑за смены корпоративных правил, неправильного вопроса или подозрения, что ты несовершеннолетний.
Экономия (хотя с учетом стоимости железа она весьма условная): автономные агенты читают и переваривают огромные объемы текста. Тут либо брать подписку с щедрым лимитом, либо платить за токены через API, выкладывая приличные суммы за миллионы сожженных токенов. Впрочем, никто не мешает тебе подключить через API какую‑нибудь недорогую модель (только пусть это будет не DeepSeek! Что угодно, только не он!).

А еще некоторые локальные системы — в том числе та, которую мы рассмотрим сегодня, — со временем становятся умнее. Все ценные материалы, которые агент найдет в процессе работы, ты сможешь сохранить в локальной зашифрованной базе SQLCipher. Затем система векторизует данные для RAG и в ответ на будущие запросы сможет опираться на твой личный, уже проверенный архив знаний.

Разумеется, есть и минусы, и очевидный «слон в комнате» — железо. Ты наверняка в курсе нынешней ситуации с ценами на любые железки, которые можно приспособить для ИИ; в ближайшие годы лучше точно не станет. Скорость и качество работы агента упираются в мощность твоей видеокарты и — еще важнее! — объем видеопамяти. Для моделей с архитектурой MoE это ограничение можно обойти, выгрузив часть экспертов в оперативную память, но при прочих равных MoE уступает плотным аналогам.

К тому же «локальное исследование» — слегка жульническое название. Да, мозг системы и база данных работают на твоем компьютере, но для поиска свежих материалов агенту нужен свободный доступ в интернет, чтобы тащить оттуда нужные знания.

От «умного поиска» к полноценному исследованию

В прошлой статье я подробно рассказал о Vane — прекрасной замене ИИ‑поисковикам с дополнительным режимом Deep Research. Сразу скажу: Vane у меня прижился, я им регулярно пользуюсь. А вот другие продукты из той статьи — нет: GPT Researcher не подошел сразу, Deep Research от dzhng отвалился со временем — та же пайплайн‑модель, но пользоваться неудобно.

Зато в наследство у меня остался контейнер с SearXNG — очень шустрым метапоисковиком, который работает локально. Он нам пригодится для работы с Local Deep Research, но, если ты не читал прошлую статью или не установил SearXNG, не страшно: поставим его отдельно.

В чем разница между Local Deep Research, проектом разработчика LearningCircuit, о котором говорим сегодня, и Vane? Vane — прекрасная вещь, которая заменяет базовую версию Perplexity: задаешь вопрос — получаешь ответ и список релевантных ссылок. Просто, дешево и сердито. Встроенный в Vane режим Deep Research интереснее, но до полноценного аналога Deep Research из Perplexity Pro не дотягивает.

Но Local Deep Research LearningCircuit — другое дело. Если Vane просто дергает поисковик и скармливает результаты языковой модели, пусть даже в несколько итераций, то Local Deep Research (LDR) выкатывает инструменты серьезной автоматизации. В LDR ты все так же берешь любимую модель, привычный движок KoboldCpp, llama.cpp или LM Studio и поисковик SearXNG; сам LDR здесь умный аналитик: дирижирует автономными агентами и умеет проводить сложный многоступенчатый анализ.

С таким подходом проект уже не выглядит заменой бесплатной версии Perplexity — это конкурент платной подписки Perplexity Pro с ее алгоритмом пошагового глубокого поиска. Отдельно отмечу: по крайней мере на моих запросах — вполне приличный конкурент. Плюс есть полный контроль над своими базами данных: обязательное шифрование (и не вздумай потерять пароль, восстановить его не получится!).

Стратегическое планирование

Давай заглянем под капот и разберемся, как работает Local Deep Research. В ранних версиях проекта (и в большинстве аналогов — например, в уже рассмотренном Vane) использовались классические пайплайны: линейные алгоритмы вида «проанализируй запрос → сгенерируй поисковые запросы → выполни поиск → сделай выжимку». Потом, начиная с версии 1.4, разработчики внедрили ReAct Agent (стратегию MCP) — ранний вариант автономного режима, где LLM сама решала, какие инструменты использовать, через цикл рассуждений Thought → Action → Observation.

Текущая версия — стратегия LangGraph Agent, которая используется по умолчанию. В каком‑то смысле агент LangGraph работает, как живой аналитик: нейросеть сама решает, что искать, в каких специализированных базах и когда данных достаточно, чтобы собрать финальный ответ.

Движок умеет на лету переключаться между источниками. Например, если поиск через локальный SearXNG выдаст ссылки на научные статьи, агент распознает контекст и автоматически переключится на Semantic Scholar, чтобы извлечь метаданные и граф цитирований. Если тема касается медицины, агент сам займется поиском в PubMed. У системы много коннекторов: от arXiv и Wikipedia до огромной открытой базы OpenAlex. В результате агент может собрать намного больше качественных источников, чем любые пайплайновые стратегии.

По умолчанию в интерфейсе доступны пять стратегий:

- Source-Based (best for context windows under 16,000 tokens)
- Focused Iteration — Quick (minimal text output)
- Focused Iteration — Comprehensive (requires a context window over 16,000 tokens)
- MCP ReAct (agentic research, LLM chooses tools)
- LangGraph Agent (autonomous agentic research)

Продолжение доступно только участникам

Материалы из последних выпусков становятся доступны по отдельности только через два месяца после публикации. Чтобы продолжить чтение, необходимо стать участником сообщества «Xakep.ru».

Присоединяйся к сообществу «Xakep.ru»!

Членство в сообществе в течение указанного срока откроет тебе доступ ко ВСЕМ материалам «Хакера», позволит скачивать выпуски в PDF, отключит рекламу на сайте и увеличит личную накопительную скидку! Подробнее

← Ранее Парольные хранилища пользователей Dashlane скомпрометированы

Далее → Критический баг в плагине WP Maps Pro позволяет создавать аккаунты администраторов

Содержание статьи

info

От «умного поиска» к полноценному исследованию

Стратегическое планирование

Продолжение доступно только участникам

Присоединяйся к сообществу «Xakep.ru»!

1 ГОД

1 МЕСЯЦ

Подпишись на наc в Telegram!