|
Мультисервисные сети
Сеть для передачи голоса и данных Сеть хранения данных (SAN) >>
Сеть хранения данных (SAN)
Постоянный рост объемов обрабатываемых данных, который оценивается сегодня как ежегодное двукратное увеличение, и возрастание важности доступности данных для непрерывности бизнеса поставили в последние годы задачу хранения данных в центр внимания ИТ-индустрии. Расходы на хранение данных к 2002 году оцениваются в 665 миллионов долларов (данные The Ken Orr Institute).
Сегодня многие лидеры информационных технологий предлагают специальные решения, направленные на создание систем хранения корпоративных данных, позволяющие повысить надежность хранения и управляемость всех информационных ресурсов предприятия.
Системы хранения данных позволяют решать ключевые проблемы обработки информации корпоративного уровня, такие как:
- Высокая доступность данных и защищенность от сбоев и форс-мажоров необходимы для обеспечения непрерывности бизнес-процесса. International Data Corp. (IDC) определяет систему хранения как систему высокой доступности (High Availability System), если в случае сбоя или возникновения форс-мажора, данные не утрачиваются и доступ к ним может быть восстановлен в приемлемое время. Приемлемость длительности простоя определяется областью применения системы и для современных систем доводится до 5 минут в год (непрерывность бизнеса). Технологии организации удаленных online копий в удаленных резервных центрах (Remote Mirroring) и средств переключения рабочих станций и серверов на удаленные системы хранения данных обеспечивают непрерывность бизнеса в случае форс-мажоров.
- Организация эффективного резервирования/архивирования корпоративных данных позволяет повысить защищенность данных от потери и снизить при этом общую стоимость хранения. Организация эффективного backup/archive для корпоративных данных, не использующего ресурсов сети (LAN-free) или без остановки приложения (Server-free), применение Hierarchical Storage Management и т.п. - все это требует:
- наличия разнообразных типов носителей для уменьшения стоимости и большей защищенности хранения данных
- зеркалирования на избыточных дисках
- избыточности каналов (путей) восстановления
- сочетания распределенного хранения и восстановления с централизованным управлением
- Централизованное управление и увеличение ресурсов хранения. Большое количество устройств хранения и данных, разбросанных по сети по достижению ею определенного размера создает большие трудности по управлению ресурсами хранения, выявлению и устранению дефицита ресурсов. Администрирование усложняется разнообразием средств управления и необходимостью содержать значительный штат подготовленных администраторов.
- Совместное использование данных. Использование прикладных систем от разных поставщиков и даже на разных платформах требует гетерогенного доступа к единым ресурсам хранения. Высоко интеллектуальный бизнес требует конкурентного доступа к данным из фронт-офисных операционных приложений и бэк-офисных аналитических систем. Для модернизации существующих систем необходимы копии реальных данных (snapshots), например, для тестирования новых версий систем.
Системы хранения данных по способу подключения к серверам приложений можно разделить на несколько моделей:
- Локальное подключение устройств хранения к серверам (DAS). Традиционная модель, при которой устройства хранения данных является локальным ресурсом сервера. Решение ключевых задач локализовано на серверах. В корпоративных сетях при большом количестве и гетерогенности серверов такая модель затрудняет, а часто и исключает возможность единых подходов к решению ключевых проблем хранения данных.
- Централизованное хранилище. Интеллектуальные дисковые массивы большой емкости, имеющий до 32 каналов для подключения серверов. Построенные в архитектуре полного дублирования всех компонентов, обеспечивающей высокий уровень доступности; имеют развитые средства управления. Современные модели обеспечивают разделение данных (Data Sharing). Следует отметить ограничения в масштабируемости (до десятков терабайт в одном массиве) и необходимость специальных решений для бэкапа и удаленного зеркалирования, а также высокую стоимость хранения ($ 0.5 - 1 за 1 MB хранения).
- Network Attached Storage (NAS). Устройства хранения NAS подключаются к уже имеющейся сети и обмениваются данными с приложениями по локальной сети. Они легко устанавливаются, относительно недороги, опираются на зрелые технологии. Вместе с тем перегружается сетевой трафик, падает производительность сети, высок риск простоя. LAN - узкое место, точка отказа. В настоящее время признается как вполне удовлетворительное решение на уровне рабочих групп.
- Storage Area Network (SAN) - новая модель хранения корпоративных данных, объединяющая гибкость сетевых архитектур с принципами центра хранения данных. Все устройства хранения и сервера подключаются к специальным устройствам (концентраторам и коммутаторам) и объединяются в выделенную сеть хранения Storage Area Network (SAN). Обобщенная модель SAN - включает 3 обязательных компоненты:
- Сетевая инфраструктура, опирающаяся на технологии Fibre Channel.
- Устройства хранения любых типов, как для on-line доступа к данным, так и backup-устройств.
- Программное обеспечение для управления ресурсами SAN.
- iSCSI - технология, которая предполагает непосредственно адресуемое, распараллеливаемое устройство хранения, которое подключается к сети на основе протокола TCP/IP. Доступ осуществляется с помощью команд ввода-вывода блочного типа SCSI. Технология позволяет предоставлять некоторые преимущества SAN в сетях IP.
Интеграция устройств хранения в выделенную сеть позволяет создать единую систему хранения корпоративного уровня с единым центром управления и эффективным резервированием данных. Развитая инфраструктура с применением топологий Arbitrared Loop и Switched Fabric на основе Fibre Channel с пропускной способностью до 100 MБайт/с дает возможность строить сети с дублированными путями доступа всех-ко-всем (серверов-к-устройствам хранения). При этом возможно управление доступом для создания кластерных структур и группировки устройств под конкретные задачи.
Таким образом, для хранения данных корпоративного уровня целесообразно использовать сети SAN и интеллектуальные сервера хранения, которые естественным образом тоже интегрируются в SAN.
Описание технологии Fibre Channel
Технология Fibre Channel стандартизирована американским институтом по стандартизации ANSI (стандарт ANSI X3T11) в 1994 г. для создания интерфейса передачи данных с широкой полосой пропускания, а следовательно и высокой производительностью, между хостами и системами хранения информации. По сравнению со SCSI, Fibre Channel поддерживает более емкие системы хранения информации и является более гибкой технологией при реализации информационных систем.
Данный стандарт предполагает в качестве физической среды передачи данных оптоволокно (многомодовое или одномодовое), витую пару или коаксиальный кабель с экранированными разъемами, т. е. среду, обеспечивающую пропускную способность от 133 до 1062 Мбит/c (в дальнейшем планируется ее увеличение до 4 Гбит/с).
Максимальное, теоретически возможное расстояние между двумя территориями (при применении одномодового оптоволокна) - 10 км. (спецификация ANSI).
По аналогии с семиуровневой моделью OSI разработана 5-уролвневая модель Fibre Channel (cм.рис.ниже).
Соединения Fibre Channel в топологическом смысле технологии могут быть организованы тремя способами: Point-to-Point, Arbitrated Loop (AL) и Switch fabric.
Наиболее простой является топология Point-to-Point. Она позволяет иметь два устройства, соединенных отдельным каналом.
Топология Arbitrated Loop позволяет нескольким устройствам подключаться к единому каналу. Поддерживаются два типа соединений: direct connect и hub connect.
Тип direct connect выглядит как point-to-point, но на самом деле представляет собой arbitrated loop состоящий из двух устройств. Интерфейсная карта хоста подключается к устройству хранения информации напрямую через оптоволоконный кабель. Каждая интерфейсная карта хоста может поддерживать только одно соединение. Использование хаба (hub connect) позволяет хосту иметь соединение с несколькими устройствами хранения информации. Также хабы позволяют обеспечить и повысить доступность системы: добавление или удаление устройств из сети Fibre Channel не приводит к нарушению целостности сети. Хабы также позволяют увеличить расстояние между хостами и устройствами хранения информации.
Наиболее прогрессивная в настоящее время топология switch fabric позволяет нескольким устройствам подключаться друг к другу по коммутируемым каналам.
При этом для объединения нескольких коммутаторов в SAN каждый из них должен поддерживать коммутируемые (или, в терминологии SAN, матричные) соединения, по крайней мере для части своих портов. Если прибегнуть к аналогии из сферы передачи данных, то различие между шинной (loop) и матричной (fabric) архитектурами можно уподобить различию между двумя сетями Ethernet, в одной из которых установлен концентратор, а в другой - коммутатор. Преимущества коммутаторов перед концентраторами в обоих случаях проявляются в увеличении полосы пропускания трафика, обеспечении управляемости, возможности агрегации портов, и т.п.
Виды оборудования Fibre Channel
Основными элементами, требуемыми для построения среды Fibre Channel являются:
- дисковые массивы
- ленточные библиотеки
- хабы или коммутаторы для организации множественного подключения устройств
- устройства конвертации протокола SCSI в Fibre Channel для возможности интеграции устройств, выпущенных ранее и неподдерживающих Fibre Channel
- адаптеры Fibre Channel для установки в сервера
- конвертеры для увеличения расстояния
- специализированное ПО управления
|