Jak ukládat firemní data? Bezpečně a na vlastní server

Objem ukládaných dat stoupá závratným tempem. Některé odhady tvrdí, že je to zhruba o polovinu každý rok. Stále více se využívá elektronických dokumentů a do elektronické podoby se postupně převádějí i staré archivy. Nároky na úložná zařízení, zálohování, sdílení a práci s nestrukturovanými daty neustále stoupají. Jak si s těmito nároky poradit?
Ukládání firemních dat

Naštěstí také vývoj storage technologií jde kupředu. Kapacita pevných disků roste, algoritmy pro práci s daty se zdokonalují a pokročilé enterprise technologie jsou stále dostupnější. Jelikož i my v Aiře slýcháme požadavky na moderní datová úložiště stále častěji, vyvinuli jsme vlastní diskové pole, které za pomoci moderních technologií splňuje veškeré současné požadavky firemních datových úložišť a to jak z hlediska dosažení vysokého výkonu, tak z hlediska efektivity ukládání dat.

Smart neboli chytrá storage: Zapřáhněte moderní procesory!

SmartStorage je fyzický server specializovaný pro práci s daty, postavený na moderních 64bit procesorech Intel a AMD, které zajišťují veškerý výpočetní výkon pro RAID konfigurace s dostatečnou rezervou. Na základě našeho testovaní jsme zjistili, že klíčovým prvkem výkonu při práci s pevnými disky je správná konfigurace RAID odpovídající požadovanému nasazení, dostatečná cache paměť na rychlém paměťovém médiu, správná konfigurace síťového protokolu pro komunikaci s diskovým polem a především detailní monitoring práce diskového pole a jeho vyhodnocení spolu s průběžnou úpravou jeho konfigurace.

Baví Vás články Filipa Marvana? Přečtěte si také jeho text o tom, jak spravovat svoje data s pomocí virtuálního cloudu.

Jednou z konkrétních výhod SmartStorage je například to, že při práci s RAID poli nevyužívají hardwarový řadič, ale vše počítají moderní procesory, jejichž výkon je mnohem vyšší. Navíc na rozdíl od diskových řadičů mají k dispozici celou operační paměť serveru jako cache pro čtení, která u hardwarových řadičů bývá maximálně v řádu jednotek GB. Navíc pokud kapacita operační paměti nestačí, lze ji dále rozšířit za pomoci rychlého SSD a vytvořit tak hybrid-storage využívající to nejlepší ze SSD i HDD.

Operační systém běžící na serveru pak sám rozhodne, která data jsou nejčastěji používána a ty připraví na rychlejší paměťové médium, odkud je průběžně odbavuje. Pokud nastane jakýkoliv problém s cache pamětí nebo například výpadek proudu, nehrozí žádná ztráta dat, neboť veškerá data z cache pamětí pro čtení jsou vždy uložena zároveň také na pevných discích.

Co dokáže ZFS aneb jak dosáhnout maximálního výkonu?

Diskové pole je postaveno na ZFS technologii souborového systému a správce logických jednotek od společnosti Oracle. Díky tomu je k dispozici hned několik možností optimalizace pro vysoký výkon. Každý kdo pracoval s diskovými poli, ví, že základem je správná konfigurace RAID disků. Populární varianta RAID-5, která je kompromisem mezi redundancí dat a kapacitou, je pro vysoké výkony nevhodná kvůli nízkým hodnotám IOPS, které ve skutečnosti v případě zápisu odpovídají jednomu jedinému disku. Oproti tomu konfigurace RAID-10razantně navyšuje IOPS s každým přidaným párem disků a to jak pro čtení, tak pro zápis. Pro nasazení s důrazem na výkon (například běh virtuálních serverů) proto jednoznačně doporučujeme RAID-10.

Komprese dat v reálném čase zrychlí veškeré diskové operace

Co dalšího může mít vliv na výkon? Kromě naprosto zásadní role cache paměti, kterou jsme již zmínili, jsou to další pokročilé funkce ZFS. Jednou z nich je komprese dat v reálném čase. Princip spočívá v tom, že nejužší hrdlo současných serverů je právě práce s pevným diskem, která je v porovnání s rychlostí procesoru či operační paměti stále velmi malá. A jelikož je procesorového výkonu nadbytek, proč ho nevyužít ke zmenšení dat, které je potřeba na disky uložit a tím celou operaci zrychlit. SmartStorage podporuje hned několik kompresních algoritmů, díky kterým lze ušetřit nejen prostor na discích, ale právě i zrychlit veškeré diskové operace.

Dalším důležitým parametrem storage serverů je způsob komunikace ve firemní síti. Na diskovém poli SmartStorage můžete využít síťových filesystémů jako NFS, AFP, CIFS/SMB, které jsou výhodné z hlediska sdílení mezi více klienty a práci se souborovou cache. Také je ale možné SmartStorage připojit blokově pomocí iSCSI nebo FibreChannel a pracovat s ním stejně jako s lokálně připojeným fyzickým diskem. Zde je potřeba dát pozor na velikost bloků, použitý souborový systém a především nastavení I/O plánovače, jehož vliv na výkon je dle našich testů nejzásadnější. Oba tyto způsoby, jak blokový tak souborový, mají důležitý vliv na výkon vzhledem ke konkrétnímu nasazení.

ZFS a efektivní ukládání dat: Deduplikace a snapshoty

Dat bude stále přibývat a jakkoliv velká kapacita bude jednou zaplněna. Přesto SmartStorage nabízí některé technologie, které dokáží s daty pracovat natolik efektivně, že každoročně ušetří nemalé náklady. Jednou z nich je již zmiňovaná komprese v reálném čase, která kromě navýšení výkonu přináší v průměru kolem 50% úspory dat.

Druhou zásadní technologií pro úspornou práci s daty je deduplikace. Ta funguje na úrovni bloků (nikoliv souborů) a pokud zjistí, že se snažíte na diskové pole uložit data, z nichž některé bloky jsou stejné jako bloky již uložených dat, vytvoří se místo další kopie stejných dat jen link. Díky tomu lze ušetřit v závislosti na konkrétním nasazení, třeba i několikanásobek původní kapacity.

Díky copy-on-write způsobu práce lze navíc kdykoliv pořídit snapshot vybraných dat na disku, tedy jejich kompletní obraz. Zjednodušeně řečeno to následně funguje tak, že pokud mají být data označená snapshotem přepsána, je zároveň uchována jejich kopie a kdykoliv se tak lze vrátit k jejich stavu v době vytvoření snapshotu. A to přesto, že není potřeba data ukládat znovu a fakticky se tak ukládají pouze změny. Díky tomu odpadají nároky na úložnou kapacitu, protože lze provádět neomezené množství snapshotů, které zabírají většinou jen zlomek z celkové kapacity "snapshotovaných" dat.

SmartStorage: řešení pro malé kanceláře i vysoký výkon

Tento způsob práce umožňuje mimo jiné také efektivní replikaci mezi více diskovými poli. Stačí více diskových polí mezi sebou navzájem propojit (přes lokální síť nebo přes internet) a replikace následně odesílá změněná data z jednoho storage serveru na druhý. Díky tomu, že se odesílají pouze změněná data, je celá operace velmi rychlá a vzájemná konektivita není zbytečně vytěžována.

Pro maximální možnou variabilitu, kterou naši klienti často poptávají, připravujeme SmartStorage server jak ve variantě malého tichého zařízení určeného do kanceláře (s maximálním počtem čtyř datových disků), kde svým provozem nebude nikoho rušit, tak také jako rack server pro 12 a více hot-swap disků, optimalizované pro vysoký výkon. Pokud Vás zajímá, co bychom doporučili Vám, neváhejte se na nás obrátit.

Čtěte dál!

 

Přidat komentář