Распечатать

CIO, № 5, 2007

Управлять качеством.

1 июня 2007

Управлять качеством.

Телекоммуникационная инфраструктура крупной, территориально-распределенной компании сопоставима по сложности с сетью оператора связи и передачи данных. Это предопределяет высокий качественный уровень автоматизированных средств мониторинга и управления, которые должны использоваться для обеспечения надежной работы такой сети. В мультисервисной сети «Лукнет», обслуживающей нужды группы компании «Лукойл», поэтапно внедряется комплексная система мониторинга и управления на базе, в частности, программного обеспечения IBM Tivoli Netcool и Route Explorer фирмы Packet Design.
 
Телекоммуникационная сеть «Лукнет» обеспечивает услуги связи и передачи данных более чем в 35 регионах России, странах ближнего и дальнего зарубежья. Она насчитывает десятки наземных спутниковых станций, сотни малогабаритных спутниковых терминалов, телефонных станций, множество радиорелейных линий, оптоволоконных и других наземных каналов связи. Пользователям сети, в том числе и на самых труднодоступных производственных объектах, предоставляется весь набор современных услуг связи и телематических служб.
В условиях консолидации информационных ресурсов и необходимости согласованной работы удаленных друг от друга территориальных подразделений надежность телекоммуникационной сети и качество предоставляемых ею сервисов приобретают критическую важность. Вовремя выявить вышедший из строя канал связи или маршрутизатор в сети с широким покрытием, насчитывающей сотни единиц оборудования, можно только с помощью специализированных средств мониторинга. При оптимизации работы сложной сети не обойтись без специального программного обеспечения.
В сети «Лукнет» в настоящее время создается комплексная система мониторинга и управления, включающая управление IP-маршрутизацией. Проект реализует головная организация по ИТ-обеспечению группы «Лукойл» ООО «Лукойл-информ» в сотрудничестве с системным интегратором «Энвижн Груп».
Работы над проектом были начаты в 2005 году. В 2006 году был завершен первый этап. Внедрены модули управления событиями, мониторинга загрузки сетевых устройств и каналов, система визуализации загрузки каналов, система контроля и мониторинга маршрутной информации.
 
Мониторинг и управление инфраструктурой
Первый этап проекта предусматривал охват системой управления московских офисов «Лукойла», опорной сети, обеспечивающей связь расположенного в Москве центра обработки данных с филиалами, и пермского филиала.
— Задача заключается в том, чтобы обеспечить подразделениям, пользующимся услугами сети, сервис соответствующего уровня, — рассказывает начальник отдела OSS компании «Энвижн Груп» Александр Елкин. — Первый этап решения этой задачи — это мониторинг сетевой инфраструктуры: оборудования и каналов связи, которые задействуются для предоставления услуги.
Признанный инструмент мониторинга сетевой инфраструктуры — комплекс программного обеспечения Netcool, разработанного компанией Micromuse. IBM приобрела Micromuse в 2006 году, и теперь это ПО включено в семейство Tivoli.
— Сначала в «Лукнете» использовалась условно-бесплатная система мониторинга SNMPC, — говорит Александр Елкин. — На определенном этапе она перестала справляться с тем объемом информации, который в нее поступал. Некоторые системы строят свою работу на автоматическом раскрытии топологии сетей. Но не во всех сетях можно автоматически раскрыть топологию второго-третьего уровня. Например, не всегда спутниковое оборудование можно опросить по протоколу IP. Тем не менее, оно может генерировать сообщения о состоянии в собственном формате. Netcool позволяет отобразить на карте и активное сетевое оборудование, и спутниковое оборудование.
Консолидацию, обработку и хранение данных, поступающих в виде потока сообщений от интерфейсных модулей, выполняет центральный модуль Netcool/OMNIbus. Сбор, унификацию и дедупликацию аварийных сообщений, а также в некоторых случаях синхронизацию и поддержание актуальности набора полученных данных, осуществляют пробы — программные агенты, предоставляющие интерфейс к уровню сетевых элементов или к уровню управления элементами сети.
Модуль Precision осуществляет мониторинг сетей в реальном времени, собирает информацию о находящихся в сети устройствах, и на ее основании строит подробную топологическую карту сети.
Для того, чтобы операторы сразу могли увидеть проблемный участок, необходима визуализация топологии сети. Однако сложные сети с большим количеством основных и резервных каналов в исходном виде отобразить невозможно. Даже если экран будет достаточно велик, разобраться в спутанной системе связей и узлов человек не сможет. Поэтому для визуализации применяется разбиение сети на уровни и подуровни: магистральный уровень, уровень региона и др. Несколько физических линий связи, соединяющих два узла, могут быть отображены в виде одной логической. Кроме того, сеть постоянно меняется: добавляется новое оборудование, строятся новые каналы связи. Автоматическое отображение изменений будет приводить к тому, что каждый раз оператор будет видеть новую карту. Но удобнее работать со статической картой. Ее отображение обеспечивает компонент Webtop модуля Netcool/OMNIbus — конфигурируемый графический веб-интерфейс.
Второй главной функцией модуля Precision является обнаружение неисправностей. Используемая при диагностике технология анализа первопричины (root cause analysis — RCA) позволяет производить корреляцию событий со многих узлов сети, выявляя исходную неисправность.
На втором этапе реализации проекта предполагается начать внедрение мониторинга приложений и услуг в «Лукнете». В состав пакета Netcool входит компонент Internet Service Monitor, позволяющий контролировать доступность и параметры работы таких интернет-сервисов, как Web, DNS, DHCP, POP3, IMAP и других. Кроме того, объединенными усилиями «Лукойл-информа» и «Энвижн груп» ведутся исследования возможности вести мониторинг приложений «глазами пользователя», когда установленное на клиентских компьютерах программное обеспечение эмулирует работу пользователя с приложением на сервере, контролирует время отклика и извещает оператора в случае выхода параметров качества обслуживания за предельно допустимые значения.
 
Мониторинг IP-маршрутизации
Качество предоставления сервисов в территориально-распределенных мультисервисных сетях в значительной степени определяется эффективностью схем маршрутизации IP-трафика. Разработка таких схем и управление ими — достаточно сложный процесс, требующий учета и топологии сети, и параметров каналов связи, и различий в обработке разных видов трафика. Ошибки в управлении маршрутизацией нередко оборачиваются критическими для пользователей нарушениями и серьезными экономическими потерями.
— Одной из сильных сторон IP-технологий является распределенный интеллект, — рассказывает начальник отдела мониторинга и сетевого анализа ООО «Лукойл-информ» Павел Прокопенко. — Маршрутизаторы обмениваются друг с другом информацией о доступности сетей с помощью протоколов маршрутизации (таких, как OSPF). На основе этой информации каждый маршрутизатор решает, как передавать данный пакет. Но здесь проявляется слабая сторона IP: отсутствие единого репозитория информации о маршрутизации в сети. Для того, чтобы не было проблем, которые приводят к непредсказуемому и необъяснимому поведению IP-cети, необходимо понимать, как именно работает маршрутизация в данный момент и почему возникла такая ситуация. То есть, необходимо знать, что происходило ранее.
По словам Павла Прокопенко, Route Explorer фирмы Packet Design — лучшее в индустрии решение в области анализа IP-маршрутизации, не имеющее аналогов в мире на сегодняшний день. Именно поэтому «Лукойл-Информ» остановил на нем свой выбор. Система Route Explorer решает весь комплекс задач, связанных с управлением маршрутизацией. Среди них: разработка и оптимизация схем маршрутизации, мониторинг, журналирование и визуализация маршрутных данных, оперативный и ретроспективный анализ этих данных с целью выявления проблем на сетевом уровне, моделирование влияния изменений схемы маршрутизации на работу сети, в том числе, с использованием архива данных, и др.
— Теперь мы имеем достоверную информацию о том, как ходит трафик из точки A в точку Б в данный момент и почему именно так, а не иначе; как ходил трафик из точки A в точку Б в момент времени X и почему, — поясняет Павел Прокопенко. — И даже более того: как ходил бы трафик из точки A в точку Б, если внести некоторое изменение. Кроме этого, Route Explorer отслеживает в реальном времени важные изменения на сетевом уровне и формирует соответствующие сообщения для централизованной системы мониторинга.
Один из недостатков Route Explorer — невозможность показать на карте связность сегментов сети, подключаемых через провайдеров MPLS/VPN. Однако компания-производитель обещает улучшить визуализацию топологии для таких архитектур уже в этом году.
Систему обслуживает отдел мониторинга и сетевого анализа «Лукойл-информа». С компанией «Энвижн Груп» заключен договор на сервисное обслуживание, в рамках которого обновляется программное обеспечение системы, специалисты подрядчика и производителя привлекаются для решения проблем и консультирования сотрудников.
 
Планы и перспективы
— В 2007 году мы планируем завершить второй этап: включение в централизованную систему мониторинга всех региональных сетей на территории РФ — и подготовить третий, — рассказывает Павел Прокопенко. — На третьем этапе планируется мониторинг инфраструктуры корпоративных центров обработки данных, серверов, операционных и прикладных систем, а также интеграция системы мониторинга с системой регистрации инцидентов (HP Service Desk).
Такая разбивка по срокам, по словам Павла, продиктована необходимостью распределения ресурсов, как трудовых, так и материальных, необходимых для реализации данного проекта.
Дальнейшие совместные планы «Лукойл-информа» и «Энвижн Груп» —­ внедрение технологии Traffic Explorer. Это комбинация маршрутной информации и информации о трафике, которая позволит увидеть объем и состав трафика на всех маршрутах или на любом отдельно взятом канале, как в реальном масштабе времени, так и за прошедший период, планировать и оптимизировать сеть. Предполагается также развивать систему мониторинга загрузки ресурсов и их производительности, соответствующие модули отчетности.
Планируется дальнейшая интеграция с процессами ITSM. В частности, по мере внедрения процесса управления изменениями и конфигурациями будет осуществляться интеграция системы мониторинга с CMDB. Это позволит, в частности,  обогащать события бизнес-информацией, выполнять более сложные корреляции событий, автоматизировать часть функций и повысить эффективность работы специалистов «Лукойл-информа».
 
История «Лукнета» и его создателей
ООО «Лукойл-информ» было образовано в 1993 году. Одной из основных причин создания нефтяной компанией специализированного предприятия связи стало развитие современных тенденций корпоративного управления, когда исключительно важное значение стали приобретать качество, скорость и полнота передачи информации. На специализированное предприятие связи была возложена задача по разработке и созданию автоматизированной системы связи компании, которая должна охватить предприятия геологоразведки, бурения, нефтедобычи, транспортировки, переработки и реализации нефти и нефтепродуктов, территориально расположенных в различных регионах Российской Федерации. В 1995 году специалисты «Лукойл-информа» совместно с сотрудниками Государственного предприятия «Космическая связь», ГСПИ РТВ, ЦПИС МО РФ, Военной академии связи, РТИ им. Минца, сертификационной лаборатории «СВИТ», а также рядом зарубежных компаний приступили к разработке основных направлений построения и развития системы связи. Создаваемая сеть получила название «Лукнет». «Лукойл-информ» получил лицензии на предоставление основных видов телекоммуникационных услуг: местной, междугородной и международной телефонной связи, передачи данных, телематических услуг, предоставление в аренду каналов связи; была получена лицензия Министерства строительства РФ на проектирование и строительство объектов связи.
К 1997 году в тринадцати городах РФ в опытную эксплуатацию были введены первые станции автоматизированной магистральной сети спутниковой связи С-диапазона на базе станций «Global Macs». Центр управления сетью «Лукнет» и круглосуточного мониторинга находился в Москве. В районах установки наземных спутниковых станций развернулось строительство региональных систем связи, была подготовлена техническая база для предоставления высококачественного доступа в Интернет всем подразделениям и дочерним предприятиям ОАО «Лукойл», включая те регионы, где доступ в Интернет другими путями невозможен. Сеть «Лукнет» охватила тридцать пять регионов: республики, края, области и автономии в Западной Сибири, на Урале, в Поволжье и на юге европейской части России.
В 2003 году была запущена в эксплуатацию сеть спутниковой связи Ku-диапазона, использующая технологии LinkStar и LinkWay. К настоящему времени она насчитывает около 200 абонентских малогабаритных спутниковых терминалов, с помощью которых предоставляются услуги связи предприятиям и организациям группы «Лукойл».
Развитие корпоративной сети связи происходит в сотрудничестве с крупными российскими и зарубежными операторами связи — компаниями «Транстелеком», «Ростелеком», «Голден Телеком», «Интелсат», «Эквант», «Вымпелком» и другими. В сети предоставляется весь набор современных услуг связи, в том числе видеоконференц-связь. Для обеспечения предприятий группы доступом в сеть Интернет «Лукойл-информ» располагает полностью резервированными соединениями с ключевыми узлами обмена трафиком.
В 2004 году, в результате объединения всех региональных ИТ-подразделений группы «Лукойл», произошло серьезное преобразование «Лукойл-информа»: возникло практически новое предприятие с новыми задачами и бизнес-процессами. И сейчас «Лукойл-информ» — головная организация по информационно-технологическому обеспечению организаций группы «Лукойл». На текущий момент в обществе работают более 6 000 человек. Его ключевые направления развития:
— внедрение, сопровождение и развитие интегрированных информационных систем для решения бизнес-задач; обеспечение бесперебойной работы приложений, телекоммуникационного и технологического оборудования.
— оптимизация бизнес-процессов организаций группы «Лукойл» для достижения стратегических целей и повышения эффективности на каждом участке деятельности нефтяной компании;
— консалтинговый и технологический сервисы мирового уровня на базе передовых технологий, продуктов и решений.
 
Бизнес-преимущества IBM Tivoli Netcool
Обеспечение непрерывности бизнеса. Непрерывность предоставления услуг крайне важна как для предприятий, так и для операторов связи. Netcool обеспечивает сквозной проактивный мониторинг доступности, состояния и производительности критически важных для бизнеса процессов, позволяя организациям более эффективно решать поставленные задачи.
 Снижение затрат и повышение эффективности. Netcool позволяет управлять сложными гетерогенными инфраструктурами как единой и эффективной системой, консолидирует управленческие ресурсы, что значительно снижает операционные издержки и повышает эффективность. Интеллектуальные средства диагностики позволяют быстро обнаружить и изолировать неисправность, тем самым сокращая время возможного простоя.
Быстрое внедрение новых услуг. Поддержка прогрессивных инициатив и развивающихся технологий (3G, Wi-Fi, web-сервисы, ITIL, XML и др.), позволяет быстро внедрять новые сервисы на всех уровнях инфраструктуры. Внедрение новых сервисов дает дополнительный рост прибыли, а их сквозная управляемость позволяет минимизировать затраты на внедрение и эксплуатацию.
Возможности для расширение бизнеса. Использование средств управления Netcool решает многие вопросы, связанные с обеспечением предоставления множественных услуг-предложений, таких как многоуровневые соглашения о качестве услуг, их мониторинг со стороны клиента, аутсорсинг управления системами и сетями и т. д. Netcool позволяет минимизировать время внедрения услуг, а также анализировать эффективность их использования на основе предоставляемой операторам аналитической информации.
 
Технологические преимущества IBM Tivoli Netcool
Универсальность. Netcool — единственный в отрасли продукт, обеспечивающий интегрированное управление инфраструктурой на всех технологических уровнях в реальном времени.
Масштабируемость. Netcool обладает высокой производительностью и практически неограниченной масштабируемостью для решения задач сбора, консолидации и обработки событий.
Быстрое время внедрения. Netcool разворачивается в кратчайшие сроки, обеспечивая быструю окупаемость. Кроме того, гибкость решения предоставляет возможность быстрого реагирования на изменения требований со стороны бизнес-процессов предприятия.
Эффективность. Netcool значительно расширяет функционал инфраструктуры, повышает эффективность используемых систем и приложений — без изменения текущих процессов и перестройки архитектуры.
Гибкость. Развитые средства конфигурирования Netcool дают возможность подстроить средства управления под нужды любой отдельно взятой организации.