Непрерывный мониторинг состояния корпоративной IT-инфраструктуры — одна из важнейших задач IT-департаментов. Реалии современного динамичного бизнеса требуют от них не быстрого устранения уже возникших неисправностей, а их своевременного предупреждения. Что, в свою очередь, предъявляет повышенные требования к инструментам диагностики.

Система NetScout nGeniusONE предназначена для контроля критичных бизнес-приложений в компаниях, для которых простой сервиса может стоить очень дорого. В частности, в банках, где критически важно иметь IT-инфраструктуру, работающую без перебоев. К тому же решение может отслеживать все банковские операции, включая транзакции по банковским картам, — в базе данных содержится полный набор соответствующих протоколов.

Единая панель управления программным комплексом nGeniusONE
Единая панель управления программным комплексом nGeniusONE

В теории программно-аппаратный комплекс nGeniusONE может быть использован на любых предприятиях — даже малых. Однако цены на него начинаются со 100 тысяч долларов, что накладывает естественные ограничения.

Единственное техническое требование к размещению комплекса заключается в том, что он должен «видеть» весь трафик, с которым связана работа критически важных приложений. С учетом этого логично установить его в собственный ЦОД, причем как можно ближе к ядру, и направить на него копию трафика. Хотя если пропускная способность каналов позволяет, то никаких принципиальных ограничений и тут нет.

Одно из достоинств nGeniusONE — возможность детектировать даже маленькие ошибки. Это очень важно, поскольку впоследствии они могут оказать негативное влияние на весь сервис.

В частности, при помощи этого решения администратор сети сможет выявить проблемы, возникающие при взаимодействии компонентов, когда и сервер, и приложение сами по себе работают корректно, а неприятные сюрпризы появляются при обмене данных между ними.

Контроль пакетов при этом происходит автономно, ручное вмешательство не требуется. Если возникает потенциально опасная ситуация, комплекс сам оповещает должностных лиц о деградации тех или иных сервисов. Администратору следует только указать приложения и сервисы, которые должны контролироваться, а также список получателей.

Вся картина происходящего видна на дашборде — он одновременно отображает множество показателей, что помогает находить и исправлять возникающие ошибки. Кстати, именно визуализации разработчики nGeniusONE уделили особое внимание. В частности, результаты пакетного анализа могут быть представлены в форме разноцветной диаграммы, на которой хорошо видно, каким трафиком и в каком объеме занят конкретный канал. Если на каком-либо участке возникает резкое увеличение обмена информацией, то оно сразу бросается в глаза — при необходимости можно проверить, каким элементом вызван всплеск.

Dashboard
Dashboard

Опытные системные администраторы наверняка помнят о проблеме параметра MaxCacheTTL в системе Windows Server 2008 R2. Стандартные средства мониторинга за подобными ошибками не следили, поэтому IT-подразделениям пришлось потратить слишком много времени на поиск причины, по которой обновления сервера не загружались.

При использовании nGeniusONE подобные вопросы решаются быстро. Администратору достаточно запустить DNS Monitor и выбрать запись, в которой наблюдалась активность. Инструмент позволяет вручную выбрать интересующую ошибку и перейти к анализатору сессии, который покажет, при взаимодействии каких именно узлов она возникает.

Администратор сразу увидит, что сервер отвечает ошибкой Server Failure на любые обращения с внешнего адреса. Причем локальный DNS настроен корректно и его обмен с внешними DNS-серверами происходит без ошибок. Поскольку один из запрошенных узлов наверняка окажется сервером обновлений Microsoft, то решение проблемы сразу становится очевидным — надо установить исправляющий ошибку пакет, и работа системы сразу станет корректной. Вся процедура займет максимум час, причем это сильно завышенная оценка.

Анализ сервисов при помощи nGeniusONE позволяет сразу увидеть все критические места системы
Анализ сервисов при помощи nGeniusONE позволяет сразу увидеть все критические места системы

nGeniusONE позволяет максимально точно локализовать аварийные участки. В частности, при анализе проблем в работе системы IP-телефонии поставщик услуг путем последовательного «продвижения» по интерфейсу монитора способен точно назвать узлы, в которых потери пакетов максимальны.

Опираясь на эти данные, диспетчерская служба сможет оптимизировать маршрут ремонтной бригады, исходя из решаемой тактической задачи. Он может в первую очередь направить ее на самые проблемные участки, чтобы сеть стала хотя бы просто работоспособной. Или же составить цепочку задач таким образом, чтобы за рабочий день устранить неисправности на наибольшем числе узлов.

Разумеется, это актуально не только для IP-телефонии. В базе данных комплекса nGeniusONE содержится информация о примерно тысяче различных типов протоколов, используемых в IP-сетях. Причем по умолчанию решение настроено таким образом, что анализируется и отображается текущая информация по всем протоколам, — если пользователю необходим максимум доступных данных, то он может вообще ничего не настраивать.

Благодаря глубокому пакетному анализу nGeniusONE обладает возможностью точно определить, чем загружены каналы (в том числе виртуальные), с детализацией до 1 мс и определить тип используемых протоколов. При этом полностью отпадает необходимость в использовании NetFlow или SNMP. Вся информация доступна из пакетов.

Комплекс nGeniusONE предоставляет полную информацию по каждому интерфейсу
Комплекс nGeniusONE предоставляет полную информацию по каждому интерфейсу

Иногда целесообразно указать в настройках схему того сервиса, который имеет для компании критическое значение. В этом случае Dashboard будет оперативно сигнализировать о проблемах на этих участках, не отвлекаясь на второстепенные задачи.

На практике чаще всего применяется комбинация этих методов. Администратор постоянно контролирует наиболее важные участки, а при необходимости переходит в другой раздел, где сможет детально проанализировать работу любого сервиса.

Возможность ранжировать сервисы по степени важности — еще одно достоинство nGeniusONE. Для примера можно представить нужды городских провайдеров, которые наряду с обслуживанием домохозяйств обеспечивают функционирование ключевых элементов коммунальной инфраструктуры. Очевидно, что в первую очередь им следует обеспечить постоянный мониторинг критически важной системы, а остальные сервисы будут иметь меньший приоритет.

Комплекс nGeniusONE также позволяет автоматически выстраивать карту зависимостей сервисов, что весьма полезно. Допустим, в некую систему входит десять серверов. Администратор добросовестно прописал их в настройках приложения и счел задачу выполненной. Однако, как это часто случается, он упустил из виду, что на работоспособность системы влияет сервер авторизации, который напрямую не связывался с обслуживаемой им конфигурацией. Но если авторизация не работает, то с точки зрения пользователя фактически не работает и вся система.

На основании анализа трафика nGeniusONE увидит все транзакции и автоматически добавит все недостающие компоненты. Таким образом влияние человеческого фактора сводится к минимуму — если администратор чего-то не учел, то комплекс его поправит.

Реализованный в nGeniusONE механизм пакетного анализа позволяет автоматически определить серверы и протоколы, которые взаимодействуют с анализируемым сервисом, но не имеют к нему непосредственного отношения — например, DNS, LDAP2, KERBEROS, SMB. Если система nGeniusONE при анализе транзакций сервиса обнаруживает дополнительное взаимодействие с серверами или компонентами, о которых администратор сети не знал или забыл, то эти компоненты будут дорисованы на карту автоматически и отмечены специальным символом.

nGeniusONE анализирует даже те протоколы, мониторинг которых не планировалось вести. Представим, что на этапе внедрения информация о протоколе Kerberos не была внесена ни в один из анализирующих модулей и связанный с ним сервис не был добавлен в древовидную структуру. Это означало, что он отсутствовал в Service Dashboard и пользователь не мог видеть ни ошибок, ни предупреждений, ни какой-либо статистики по этому протоколу. Тем не менее благодаря функции адаптивного ситуационного анализа комплекс среагировал на аномальное поведение Kerberos. Информация об этом была получена ответственными лицами, которые сделали необходимые выводы и приняли соответствующие решения.

За сбор трафика отвечают специальные пакетные коллекторы. Это позволяет легко масштабировать систему контроля — если у предприятия появляются новые ЦОДы, то проблема решается установкой дополнительных коллекторов. При этом обработка и визуализация получаемой ими информации происходит практически мгновенно.

Одна из типичных проблем системного администратора — обслуживание приложений, которые были написаны в самой компании. Зачастую средства мониторинга работают с такими программами не лучшим образом — у них свои лог-файлы и коды ошибок. Поскольку в основе комплекса nGeniusONE лежит анализатор трафика, то решение задачи радикально упрощается — все эти приложения и используемые ими оригинальные протоколы с кодами ошибок можно внести в базу, и они будут обрабатываться точно так же, как и все остальные.

Этим свойством nGeniusONE удобно пользоваться для тестирования разрабатываемых приложений. Важно, что такие тесты будут производиться не автономно, а в составе всей IT-инфраструктуры, что позволит выявить не только внутренние ошибки программы, но и проблемы, которые могут возникнуть при ее взаимодействии с другими компонентами рабочей среды.

Подводя итоги, можно сказать, что система мониторинга сети и приложений NetScout nGeniusONE хорошо вписывается в нынешние реалии сетевой инфраструктуры, как облачной, так и физической. Это делает комплекс универсальным решением, которое можно применять в самых разных сферах — в том числе он хорошо подойдет провайдерам.

У компании NetScout, к сожалению, нет локального представительства, но в России их представляет официальный дистрибьютор «ИМАГ». Он же предлагает свои услуги по бесплатному проведению пилотного проекта с использованием nGeniusONE, который позволяет ознакомиться с работой комплекса на своей сети и лишь потом решать, приобретать ли оборудование.

  • Подпишись на наc в Telegram!

    Только важные новости и лучшие статьи

    Подписаться

  • Подписаться
    Уведомить о
    3 комментариев
    Старые
    Новые Популярные
    Межтекстовые Отзывы
    Посмотреть все комментарии