Dosažení stoprocentní provozuschopnosti je cílem každého správce IT systémů. Říkám cíl, protože je obecně známo, že je v praxi nedosažitelný. I když odhlédneme od plánovaných odstávek, dříve či později dojde k selhání systému. Každý si přeje dosáhnout co nejlepší provozuschopnosti a zejména je schopen tuto úroveň provozuschopnosti doložit. A právě zde se uplatní nástroje pro měření dostupnosti – nebo, jak se jim často říká, nástroje pro monitorování dostupnosti.
Přestože neexistují vyloženě specializované nástroje pro měření nebo sledování provozuschopnosti, mnoho univerzálních monitorovacích řešení zahrnuje sledování provozuschopnosti mezi své monitorované parametry. Dnes se podíváme na několik z nejlepších nástrojů pro monitorování dostupnosti.
Než se pustíme do konkrétních nástrojů, podrobněji se podíváme na samotné měření provozuschopnosti. Budeme se snažit pochopit, proč je důležité tento parametr sledovat a jak jej lze měřit. Dále si probereme různé typy nástrojů, které se k měření času používají. Vysvětlíme rozdíl mezi nástroji pro měření lokální provozuschopnosti serveru a službami pro měření dostupnosti webových stránek. Po tomto úvodu se podíváme na některé z nejlepších dostupných nástrojů. Začneme pěti nejlepšími lokálními nástroji pro sledování provozuschopnosti serveru a poté se podíváme na tři skvělé služby pro měření dostupnosti webových stránek.
Proč je důležité měřit dobu provozuschopnosti
Hlavním důvodem, proč měřit dobu provozuschopnosti, je mít doklad o její úrovni. Výpadky systémů, ať už k nim dojde kdekoliv nebo z jakéhokoliv důvodu, často způsobují nemalé komplikace v chodu organizace. Během výpadku bývá mnoha zaměstnancům znemožněno vykonávat svoji běžnou práci, nezbývá jim než čekat na obnovení systému. V těchto situacích se zdá, že čas plyne obzvláště pomalu a mnoho lidí, včetně vedoucích pracovníků, může nabýt dojmu, že výpadek trval déle, než ve skutečnosti trval.
Mnohá IT oddělení mají také uzavřené smlouvy o úrovni služeb se zbytkem organizace, ve kterých je definováno požadované procento provozuschopnosti. Měření provozuschopnosti, o kterém je možné generovat reporty, pomáhá udržovat věci v patřičné perspektivě. Například i dvouhodinový výpadek může stále znamenat 99,997% dostupnost za měsíc. To je skvělé číslo a pokud vaše SLA (Smlouva o úrovni služeb) vyžaduje 99,99% dostupnost, jste stále v souladu s požadavky.
Různé typy nástrojů pro různé typy měření provozuschopnosti
V zásadě existují dva typy provozuschopnosti, které obvykle zajímají systémové administrátory a pro každý z nich je potřeba jiný typ nástroje. Prvním je lokální provozuschopnost. Ta se týká provozuschopnosti jednotlivých serverů a dalších zařízení. Druhý běžný typ měření provozuschopnosti se zaměřuje na dostupnost internetových služeb. Organizace bude chtít například sledovat dostupnost svých webových stránek pro uživatele na internetu. Tento typ měření provozuschopnosti neměří dobu provozu samotného serveru, ale spíše dostupnost celého systému.
Měření provozuschopnosti lokálního serveru
Měření lokální provozuschopnosti serveru je relativně jednoduché. Většina operačních systémů má integrovaný čítač provozuschopnosti. Pro nástroj, který měří provozuschopnost, stačí na dálku přečíst hodnotu z tohoto čítače a lokálně ji uložit. Tyto čítače obvykle zobrazují dobu provozuschopnosti systému ve dnech, hodinách, minutách a sekundách. Je na měřícím nebo monitorovacím nástroji, aby provedl výpočet a z těchto dat odvodil procentuální hodnotu.
Vzdálené měření dostupnosti webové služby
Vzdálené měření dostupnosti webové služby je odlišné. Obvykle zde nejsou k dispozici čítače provozuschopnosti. Různé dostupné nástroje proto musí pravidelně kontrolovat, zda je systém v provozu a reaguje správně. V tomto systému nemůže rozlišení měření doby nikdy přesáhnout interval kontrol. Pokud například služba monitorování dostupnosti kontroluje vaši webovou stránku každých pět minut, čtyřminutový výpadek mezi dvěma kontrolami zůstane bez povšimnutí. Proto je důležité zvolit službu s co nejkratším intervalem kontroly.
Nejlepší nástroje pro měření provozuschopnosti serveru
Ke sledování provozuschopnosti serveru se dá použít mnoho nástrojů pro monitorování sítě, protože čítač provozuschopnosti zabudovaný ve většině zařízení lze obvykle na dálku číst pomocí protokolu Simple Network Management Protocol. Sestavili jsme seznam pěti nástrojů, které můžete použít pro měření a sledování doby provozuschopnosti systému.
1. SolarWinds Server & Application Monitor (bezplatná zkušební verze)
SolarWinds je mezi správci sítí dobře známá značka. Společnost již asi 20 let vyvíjí vynikající nástroje pro správu sítí a některé z jejích produktů, jako je Network Performance Monitor, si trvale získávají pozitivní hodnocení. SolarWinds je také známý svými bezplatnými nástroji. Vytváří několik nástrojů, z nichž každý je zaměřen na specifickou potřebu správy sítě. Server Kiwi Syslog a TFTP server od SolarWinds jsou dva příklady takových bezplatných nástrojů.
Nejlepším nástrojem od SolarWinds pro měření a sledování provozuschopnosti je SolarWinds Server and Application Monitor. Tento nástroj pomáhá správcům monitorovat servery, jejich provozní parametry, procesy a aplikace, které na nich běží. Nástroj měří nejen dobu provozu serveru, ale také dobu běhu aplikací na serverech. Nástroj lze snadno škálovat od malých sítí po velké se stovkami serverů (fyzických a/nebo virtuálních) rozložených na mnoha místech. Stejně snadno monitoruje cloudové služby, jako jsou Amazon Web Services a Microsoft Azure.
SolarWinds Server and Application Monitor se velmi snadno nastavuje. Po instalaci je počáteční konfigurace snadná díky procesu automatického zjišťování. Zjištění zařízení probíhá ve dvou krocích. První krok objeví servery a druhý krok najde aplikace, které na nich běží. Pro urychlení procesu je možné zadat seznam aplikací, které se mají hledat. Po spuštění je uživatelské rozhraní nástroje velmi intuitivní. Můžete si zvolit zobrazení všech dostupných informací v tabulce nebo grafu.
Cena za SolarWinds Server and Application Monitor začíná na 2 995 USD pro 150 monitorů a roste v závislosti na počtu monitorovaných komponent, uzlů a objemech. Pro ty, kteří si chtějí produkt vyzkoušet před zakoupením, je k dispozici ke stažení bezplatná 30denní zkušební verze.
2. ManageEngine OpManager
ManageEngine je dalším renomovaným výrobcem nástrojů pro správu sítě. ManageEngine OpManager umožňuje monitorovat směrovače, přepínače, firewally, servery a virtuální stroje z hlediska chyb a výkonu. Nástroj nabízí podporu více dodavatelů pro nepřetržité monitorování serverů a kritických aplikací včetně jejich služeb a procesů. Pravidelně monitoruje servery pomocí protokolů SNMP a WMI, aby se ujistil, že jsou neustále v provozu a fungují na nejvyšší úrovni. Kromě toho nástroj ukládá všechna shromážděná data pro historické sledování výkonu a odstraňování problémů, takže není potřeba více nástrojů pro monitorování serverů.
Výkon zařízení je monitorován v reálném čase a je možné jej sledovat na živých přehledech a grafech. Nástroj ale nesleduje pouze provozuschopnost. Mezi jeho hlavní funkce patří monitorování šířky pásma. Kromě toho monitoruje také kritické metriky, jako jsou ztráty paketů, chyby a vyřazení. Nástroj monitoruje výkon fyzických a virtuálních serverů, jako je dostupnost, zatížení CPU, využití disku a paměti.
Reporting je další silnou stránkou ManageEngine OpManager. Nabízí více než 100 vestavěných reportů – včetně reportu o dostupnosti – které lze plánovat, přizpůsobovat a exportovat. Můžete si vybrat ze tří různých verzí: Free, Essential a Enterprise. Liší se počtem zařízení, která mohou monitorovat – od 10 pro bezplatnou verzi po 10 000 pro verzi Enterprise – a rozsahem funkcí.
3. Paessler Router Traffic Grapher (PRTG)
Paessler Router Traffic Grapher, zkráceně PRTG, je známá monitorovací platforma. Prodejce tvrdí, že jde o jeden z nejjednodušších a nejrychlejších monitorovacích nástrojů k nastavení. Podle Paesslera byste měli být schopni nástroj používat během několika minut. Značná část rychlosti a snadného nastavení produktu vychází z funkce automatického zjišťování. Po instalaci prohledá vaši síť a automaticky přidá nalezené komponenty a monitory, které jsou pro každé zařízení relevantní.
PRTG nabízí několik možností uživatelského rozhraní. Můžete si vybrat mezi nativní konzolí Windows, webovým rozhraním založeným na Ajaxu nebo mobilními aplikacemi pro Android a iOS. A když už mluvíme o mobilních aplikacích, ty plně využívají možnosti své platformy. Umožní vám například pomocí fotoaparátu vašeho mobilního zařízení naskenovat QR kód, který je připevněný ke každému zařízení a rychle zobrazit jeho stav. PRTG se neomezuje pouze na používání SNMP pro monitorování. Dokáže monitorovat i mnoho dalších parametrů, včetně doby provozu systému, pomocí protokolů, jako jsou WMI, NetFlow a Sflow.
4. WhatsUp Gold
WhatsUp Gold od Ipswitch je dalším nástrojem, který je na trhu již nějakou dobu. Ve skutečnosti je to podle mě nejstarší nástroj z tohoto seznamu. Původně se zaměřoval spíše na monitorování dostupnosti systému a následné doby provozuschopnosti než na monitorování provozních parametrů. Odtud pochází i jeho název. WhatsUp Gold se tehdy používal k informování o tom, co je v provozu a co ne, a k odesílání upozornění na pager, když selhal server. Nástroj má dodnes jeden z nejlepších výstražných systémů, který lze konfigurovat pro doručování upozornění mnoha způsoby, včetně e-mailu a SMS.
WhatsUp Gold dnes dělá mnohem více než jen sledování stavu zařízení. Je to plnohodnotná monitorovací platforma, která dokáže měřit i využití šířky pásma a ověřovat, zda služby reagují. Bude například monitorovat dobu provozu serverů Exchange a SQL, Active Directory, IIS a webových služeb Apache. A pokud je vaše serverová farma v cloudu, lze WhatsUp Gold použít i pro monitorování instalací Amazon AWS nebo Microsoft Azure.
5. Zabbix
Posledním nástrojem v našem seznamu pro měření a sledování lokální provozuschopnosti je bezplatný open-source produkt Zabbix. Ačkoli je tento nástroj zdarma, působí velmi profesionálně, podobně jako komerční produkty. Ale profesionální webové rozhraní pravděpodobně není jediným důvodem, proč si tento produkt vybrat. Nástroj má docela působivou sadu funkcí. Zabbix monitoruje většinu zařízení připojených k síti, nejen síťová zařízení jako někteří jeho konkurenti. Co se týče měření a monitorování provozuschopnosti, je to v produktu snadno dostupné.
Kromě protokolu SNMP (Simple Network Management Protocol) používá Zabbix pro monitorování zařízení také rozhraní IMPI (Intelligent Platform Monitoring Interface). Lze jej použít ke sledování šířky pásma, doby provozuschopnosti, využití CPU a paměti zařízení, celkového stavu zařízení i změn konfigurace. Kromě toho má Zabbix vynikající a plně přizpůsobitelný systém upozornění, který nejen posílá upozornění e-mailem nebo SMS, ale také spouští lokální skripty.
Zabbix je vybaven také skvělým nástrojem pro tvorbu reportů. Nabízí několik předpřipravených reportů, včetně reportu o dostupnosti, který je ve skutečnosti reportem o provozuschopnosti. Tento produkt funguje pouze na platformě Linux a jeho nastavení může být, stejně jako u mnoha linuxových softwarů, výzvou. Ale kdo si může stěžovat, když je to zadarmo?
Služby vzdáleného sledování provozuschopnosti serveru
Pokud potřebujete měřit dobu provozu z pohledu internetu, například když se snažíte zjistit dostupnost svého webu elektronického obchodu, potřebujete zcela jiný typ nástroje. Budete potřebovat cloudovou službu, která bude pravidelně kontrolovat váš web a informovat o jeho provozuschopnosti. Existují stovky takových služeb. Je jich příliš mnoho, než abychom je všechny mohli otestovat. Proto jsme sestavili tento krátký seznam několika z nich.
6. Uptime Robot
Uptime Robot je cloudová monitorovací platforma, která monitoruje až 50 webových stránek dotazováním každých pět minut. Nástroj nejen měří provozuschopnost, ale také vás upozorní e-mailem, pokud některá z monitorovaných stránek přestane reagovat. Nástroj nabízí také základní modul pro tvorbu reportů, kde můžete sledovat dobu provozu i prostoje pro jakýkoli sledovaný prvek.
Pro větší přesnost nebo pokud máte více než 50 sledovaných stránek, je k dispozici Uptime Robot Pro Plan za 5,50 USD měsíčně (4,50 USD, pokud platíte ročně), který nabízí 1minutové intervaly dotazování, monitorování SSL, pokročilé upozornění a několik dalších funkcí.
7. Uptime Doctor
Uptime Doctor nabízí podobný typ služby. Omezuje se na sledování pouze 5 webových stránek, ale každou minutu je zdarma kontroluje. Je také o něco flexibilnější v zasílání upozornění. Kromě e-mailu nabízí i SMS a push notifikace. Nástroj poskytuje také reporty o dostupnosti.
Pro větší testovací kapacitu nabízí Uptime Doctor tři placené plány za ceny od 7,95 do 31,95 $ měsíčně. Jednotlivé plány se liší hlavně počtem testů, které umožňují: 10, 20 a 30.
8. Freshping
Freshping od Freshworks nabízí spolehlivou službu pro sledování provozuschopnosti a výkonu. Je zdarma a podle tvrzení prodejce bude navždy zdarma. Služba bude monitorovat až 50 různých URL v 1minutových intervalech z 10 globálních lokalit.
Kromě bezplatné služby je k dispozici i verze Enterprise za 42 USD měsíčně. Ta umožňuje monitorovat až 250 URL a data se ukládají po dobu 36 měsíců namísto 6 měsíců u bezplatné verze. Jedinečnou funkcí Freshpingu je dostupnost veřejných stránek se stavem, které můžete použít ke sdělování stavu svých stránek svým klientům.
Závěrem
Ať už si vyberete jakýkoli nástroj, každý z zde recenzovaných nástrojů poskytuje kvalitní měření doby provozuschopnosti. Vzhledem k tomu, že mnoho lokálních nástrojů nabízí i další užitečné funkce, věnujte čas jejich analýze a případně jeden nebo dva vyzkoušejte. Vaše konečná volba by se měla v první řadě odvíjet od funkcí, které považujete za nejužitečnější.