Донецкий техникум промышленной автоматики

CDP - рішення для безперервної захисту даних

ОГЛЯД

У другій половині минулого року в заголовках новин, присвячених індустрії систем зберігання, все частіше стала з'являтися абревіатура CDP, яка розшифровується як Continuous Data Protection (безперервна захист даних), а вже восени свої продукти, що реалізують цю концепцію, представили Microsoft і лідери ринку ПО резервного копіювання Symanteс-Veritas, EMC-Legato і IBM Tivoli. Перш ніж розбиратися, що принципово нове привнесла CDP, розглянемо проблеми класичного підходу до організації резервного копіювання.

Чим погана стрічка

Для прикладу розглянемо типову схему резервного копіювання в невеликому офісі, де на файл-сервері, обладнаному дисками великої ємності, кожному користувачеві виділена окрема папка. Для захисту даних, що зберігаються на файл-сервері, застосовується резервне копіювання на стрічковий автозавантажувач. Оскільки на стрічку можна копіювати відкриті файли і сама операція резервного копіювання створює додаткове навантаження на сервер, то її можна виконувати тільки в неробочий час, т. Е. Вночі або у вихідні (проміжок часу, що виділяється для цієї мети, називається вікном резервного копіювання). Зазвичай за нічну зміну не вдається скопіювати вміст всіх дисків сервера на стрічку (наприклад, найпоширеніший зараз стрічковий привід DAT72 (DDS-5) за 8 год здатний записати не більше 172 Гб). Тому повністю диски сервера копіюються тільки один раз в тиждень: ввечері в п'ятницю системний адміністратор запускає програму резервного копіювання і до понеділка отримує повну резервну копію на одній або декількох стрічках. В інші робочі дні на окремі стрічки записуються тільки зміни вмісту дисків, зроблені з того моменту, коли була створена остання повна (диференціальна) копія, або, якщо потрібно максимально скоротити вікно резервного копіювання, проводиться инкрементальное резервне копіювання (т. Е. На стрічці фіксуються зміни в порівнянні з попереднім резервним копіюванням).

Вибір файлів для відновлення у вікні консолі адміністратора DPM

У чому полягають головні недоліки такого методу? Розглянемо ситуацію, коли одному з користувачів знадобилося терміново відновити в своїй папці випадково видалений файл. Для цього йому доведеться звертатися до системного адміністратора, який повинен знайти стрічки з останньої повної резервної копією і, можливо, ще й стрічки з диференціальної або Інкрементальний копіями, завантажити ці стрічки в автозавантажувач, прочитати їх вміст, після чого можна буде відновити файл з стрічки на диск. Цей процес може розтягнутися на кілька годин (особливо якщо у системного адміністратора є більш важливе завдання або стрічки зберігаються в іншій будівлі), і в результаті потрібний файл буде відновлений занадто пізно (наприклад, співробітник не встигне до призначеного терміну вислати клієнтові повний комплект документації).

Інший недолік класичного резервного копіювання - періодичність створення резервної копії. Резервне копіювання проводиться тільки в кінці робочого дня, тому в разі видалення або псування файлів, створених протягом дня (наприклад, якщо співробітник до обіду підготував новий документ в Microsoft Word, а о п'ятій годині вечора виявив, що цього файлу немає в його папці) , їх не можна відновити, оскільки вони ще не були скопійовані на стрічку.

Архітектура Microsoft DPM

Нарешті, не слід забувати, що відновлення файлів з стрічки може виконувати тільки системний адміністратор, і якщо з запитами на відновлення до нього кожен день буде звертатися кілька користувачів, то у нього просто не залишиться часу на іншу роботу. Зараз вихід з ладу дисків або серверів трапляється досить рідко, тому основна частина запитів на відновлення за резервною копії приходить від користувачів, які випадково видалили важливі файли або зберегли новостворений файл під ім'ям вже існуючого (наприклад, користувач вирішив підготувати скорочений варіант своєї презентації PowerPoint і викинув з неї частину файлів, але потім замість команди "Зберегти як ..." за звичкою вибрав в меню PowerPoint команду "Зберегти" і в результаті затер вихідну презентацію).

Згідно з наведеними корпорацією Microsoft оцінками аналітиків, в американських компаніях в 40% випадків спроба відновлення даних з стрічки закінчується невдачею. Мабуть, такий високий відсоток пов'язаний не стільки з надійністю самих стрічкових технологій, скільки зі складністю процесу резервного копіювання на стрічку, який вимагає виконання безлічі ручних операцій, чіткої організації касет і не дозволяє перевірити правильність отриманої копії.

Основна проблема стрічки - це низька швидкість читання і запису, через що резервне копіювання доводиться переносити на неробочий час і застосовувати ускладнює відновлення инкрементальное і диференціальне копіювання. Логічне рішення в даному випадку - заміна стрічки на більш швидкі жорсткі диски, т. Е. Резервне копіювання за схемою D2D, при якій резервна копія записується з одного жорсткого диска на інший (слід уточнити, що такі новітні стрічкові накопичувачі старшого класу, як Ultrium 960 , можуть обганяти по швидкості диски, однак ці пристрої дуже дорогі для невеликих компаній). Сама концепція D2D не нова, проте широко застосовуватися на практиці вона стала тільки в останні роки, коли був налагоджений випуск RAID-масивів на базі недорогих SATA-дисків. Наслідком популярності D2D стала поява ідеології резервного копіювання CDP, яка передбачає постійне відображення в резервної копії всіх змін оригіналу, завдяки чому можна практично миттєво відновити стан даних на будь-який момент часу в минулому з необмеженою деталізацією (аж до секунд). Розглянемо деякі з найбільш відомих рішень CDP, які з'явилися за кілька останніх місяців.

Microsoft DPM і Symatnec Backup Exec 10d

Пакет Microsoft System Center Data Protection Manager 2006 (DPM, www.microsoft.com/windowsserversystem/dpm) був представлений ще в вересні 2004 року, за рік до виходу остаточної версії, і цей анонс софтверного гіганта став серйозним стимулом для становлення ринку рішень CDP . Резервне копіювання DPM засноване на використанні функції "тіньового копіювання" Volume Shadow Copies Services (VSS) в ОС Windows Server 2003 і її спеціалізованої версії Windows Storage Server 2003: Додати спочатку вихідні дані копіюються на диски сервера DPM, а потім VSS записує на нього всі наступні зміни у вигляді так званих тіньових копій. У цих тіньових копіях зміни оригіналів фіксуються на байтовому рівні, тому після редагування якогось файлу на DPM пересилається не його нова версія, а тільки ті байти, в які було записано нове значення. Це скорочує обсяг трафіку резервного копіювання та зменшує додаткові витрати ємності на дисках DPM для зберігання тіньових копій (Microsoft рекомендує, щоб вони були в півтора рази більше дисків, де зберігаються оригінали файлів). При необхідності за первісною і тіньової копій можна практично миттєво відновити стан файлів в різні моменти часу. Однак VSS накладає суттєві обмеження на використання тіньового копіювання - його можна проводити не частіше восьми разів за добу і одного разу на годину, а число тіньових копій одного тому не може бути більше 64 (крім того, воно обмежене розміром дискового простору на сервері DPM, а загальний обсяг вихідних файлів повинен бути не більше 6 Тб). Через ці обмежень неможливо реалізувати безперервну захист даних, тому Microsoft вважає за краще класифікувати свій продукт як рішення "майже CDP". Крім того, DPM поки не підтримує такі функції класичного ПО резервного копіювання, як захист в онлайновому режимі баз даних і систем електронної пошти та відновлення вийшов з ладу сервера з нуля (bare-bone restore; т. Е. Без попередньої інсталяції та налаштування серверної ОС ).

Без попередньої інсталяції та налаштування серверної ОС )

Web-інтерфейс Backup Exec 10d

На відміну від резервного копіювання на стрічку системний адміністратор може без великих витрат часу переглядати диски DPM і перевіряти, чи є там всі необхідні резервні копії. У порівнянні з використанням стрічки істотно спрощується і відновлення даних - досить вказати у вікні консолі адміністратора потрібні резервні копії, що зберігаються на диску DPM, і дати команду Recover. Крім того, завдяки інтеграції з Windows XP і Microsoft Office 2003 відновлення видалених і пошкоджених файлів можуть проводити самі кінцеві користувачі, задавши команди Open і Recover previous version в діалоговому вікні програми Office або Windows Explorer.

DPM розрахований насамперед на організацію резервного копіювання в офісах невеликих компаній, де часто немає системного адміністратора, а також для організації централізованого резервного копіювання в корпораціях з територіально розподіленою структурою. Наприклад, сама Microsoft вже більше року використовує цей продукт для централізованого захисту в 130 своїх відділеннях - по глобальній мережі тіньові копії пересилаються в центральний офіс, де записуються на сервер DPM. За оцінками корпорації, вона заощадить за перші два роки не менше 2,7 млрд. Дол. За рахунок вартості стрічкових систем і ПО резервного копіювання, які раніше використовувалися в кожному з цих філій, а також значно зменшить вікно резервного копіювання. Наприклад, в одному з її офісів, де раніше на стрічку копіювалися 300 Гб, після впровадження DPM тривалість резервного копіювання скоротилася з 8 год до 10 хв.

DPM встановлюється на виділений сервер з Windows Server 2003 або Windows Storage Server 2003 і здатний захищати тільки сервери з тими ж ОС, а також Windows 2000 (на цих серверах встановлюються програми-агенти DPM, що забезпечують передачу тіньових копій). Крім того, на сервер DPM можна встановити звичайне ПО резервного копіювання та з його допомогою скидати вміст дисків DPM на стрічку для його архівації або зберігання на іншому майданчику.

Пакет DPM в мінімальній конфігурації, що включає ліцензії на один сервер DPM і обслуговування трьох файл-серверів, коштує 950 дол.

Перші анонси DPM були розцінені аналітиками ринку систем зберігання як виклик Microsoft компаніям, що спеціалізуються на розробці ПЗ резервного копіювання, перш за все Veritas (зараз цей підрозділ корпорації Symantec), чий пакет Backup Exec (www.backupexec. Com) є лідером серед програмних рішень для резервного копіювання в середовищі Windows. Корпорація Symantec не змусила себе чекати з відповіддю - в той же день, 27 вересня 2005 року, коли Microsoft оголосила про початок поставок DPM, вийшла нова версія Backup Exec 10d (кодова назва Panther). Від представленого на початку минулого року Backup Exec 10 нова версія відрізняється наявністю модуля Continuous Protection Server, який і реалізує функції CDP на основі технології VSS (буква d в ​​її назві говорить про використання жорстких дисків). Як інтерфейс Symantec в своєму продукті використовувала консоль на базі Web-браузера, яка, як і Windows Explorer в DPM, дозволяє кінцевому користувачеві самому відновлювати файли з резервних копій. В іншому за своєю основною функціональності Backup Exec 10d мало відрізняється від продукту Microsoft, до того ж має майже таку ж ціну, як і у конкурента: ліцензія на сервер і три програми-агента для клієнтських машин стоїть 995 дол.

Для Tivoli CDPF можна задати збереження резервних копій на локальному диску, вилученому файл-сервері або сервері TSM

Які ж основні відмінності цих продуктів? Якщо Backup Exec 10d продається тільки як окремий програмний продукт, який необхідно інсталювати і налаштувати, то DPM можна придбати також як готовий апаратно-програмний комплекс на базі Intel-сервера. Наприклад, корпорація HP пропонує три моделі, що працюють під управлінням DPM NAS-пристроїв ProLiant Data Protection Storage Server на базі серверів ProLiant, а компанія Fujitsu Siemens Computers випустила систему FibreCAT N40-DPM на базі двопроцесорного стоечного сервера Primergy RX. Мабуть, продукт Microsoft зацікавить в першу чергу ті невеликі компанії, де до сих пір не використовувалося резервне копіювання, а рішення Symantec - користувачів Backup Exec, які хотіли б доповнити (або замінити) резервне копіювання на стрічку технологією DPM. Крім того, завдяки наявності в портфелі Symantec різних додаткових модулів для Backup Exec в цьому продукті можна реалізувати ряд функцій, відсутніх в DPM, наприклад відновлення серверів з нуля.

IBM Tivoli CDP for Files (CDPF)

Представлене на місяць раніше DPM і Panther рішення CDP від ​​компанії IBM (www.ibm.com/ru/software/tivoli/ products / cont_data_prot_files.html) розраховане перш за все на захист в середовищі Windows файлів, що зберігаються на дисках ноутбуків, а також настільних ПК і файл-серверів. Кожен раз, коли користувач створює на локальному диску свого ПК новий файл або змінює існуючий, CDPF копіює його в спеціальну папку RealTimeBackup на цьому ж диску, а потім, відразу по підключенні комп'ютера до мережі, пересилає її на віддалений файл-сервер, в NAS- систему або на сервер резервного копіювання Tivoli Storage Manager (TSM). Крім того, це ПЗ дозволяє копіювати файли і на знімні накопичувачі комп'ютера, наприклад флеш-диски, що зручно в тих випадках, коли ноутбук тривалий час відключений від мережі. Воно практично не накладає ніяких обмежень на періодичність створення резервних копій, т. Е. В чистому вигляді реалізує CDP, але оскільки кожна нова версія файлу копіюється цілком, то в порівнянні з продуктами Microsoft і Symantec це рішення значно інтенсивніше витрачає ємність дисків і створює більший трафік при пересиланні копії через мережу.

CDPF може використовуватися як окремий продукт або як компонент TSM. Його серверна ліцензія коштує 995 дол. (В розрахунку на один процесор), а ліцензія для ноутбука або настільного ПК - 35 дол.

EMC RecoverPoint

Рішення RecoverPoint (www.legato.com/products/backup/recover_point.htm), розроблене підрозділом Legato корпорації EMC, найбільш повно реалізує концепцію CDP - воно забезпечує відновлення не тільки даних, але і додатків за станом на довільний момент часу в минулому. Архітектура продукту EMC (в ньому використані технології CDP невеликий каліфорнійської фірми Mendocino, www.mendocinosoft.com) включає три компоненти: програмний сервер RecoverPoint Engine, програми-агенти RecoverPoint Protection Drivers і систему, в якій зберігаються резервні копії RecoverPoint Recovery Storage. Перший компонент керує всіма метаданими, за допомогою яких фіксуються зміни вихідних даних, і на їх основі готує "образи" для відновлення по резервної копії. Він може встановлюватися на будь-який Intel-сервер з ОС Red Hat Linux 3.0 (EMC рекомендує використовувати стієчний Сервер висотою 2U). Агенти RecoverPoint Protection Drivers, що встановлюються на сервери додатків, відстежують і зберігають зміни даних додатків. В першу версію RecoverPoint включені агенти для Solaris 8/9 і додатків Oracle 9i / 10g, UFS і VxFS на цій платформі і Windows 2003 з підтримкою SQL Server і NTFS.

Архітектура EMC RecoverPoint

Зміни, зафіксовані драйверами Protection Drivers, записуються на RecoverPoint Recovery Storage. Цей компонент встановлюється на будь-якому дисковому масиві з інтерфейсом Fibre Channel (зрозуміло, EMC рекомендує вибрати її власні системи зберігання Symmetrix і Clariion).

RecoverPoint за допомогою драйверів відстежує всі зміни в додатках, для яких необхідно забезпечити резервне копіювання, і записує їх на Recovery Storage. Одночасно з цим відстеженням драйвери передають RecoverPoint Engine метадані з описом змін даних на рівні блоків. З цих метаданих Engine готує віртуальні копії, по ним і проводиться відновлення даних.

Системний адміністратор взаємодіє з Engine за допомогою ПО EMC Replication Manager або EMC-Legato Networker. Там, де необхідно відновити дані додатків, адміністратор у вікні Replication Manager або Networker вказує час, на яке потрібно зробити "відкат", після чого RecoverPoint створює потрібну віртуальну копію, по якій миттєво відновлюються дані.

RecoverPoint може використовуватися для захисту баз даних, файл-серверів, а також для організації резервного копіювання та архівування даних на стрічку з проміжною записом на диски за схемою D2D2T і створення "миттєвих копій" баз даних для тестування і розробки нових додатків.

Поставки RecoverPoint почнуться в березні 2006 р Тоді ж будуть оголошені і ціни на цей продукт.

Версія для друку

Тільки зареєстровані користувачі можуть залишати коментарі.