Pålidelighedskontrol på billige med Cacti og Monitor.Us

Hvis min service ikke er pålidelig, er den ikke klar til drift. Jeg vil forudsige, hvor pålidelig min nye service vil være, når den bliver operationel. Jeg vil ikke bruge nogen penge. Hvordan gør jeg det?

Krav til pålidelighed

Jeg skrabede sammen et par enkle funktionelle krav, jeg kunne teste imod.

  • Vis startsiden inden for 5 sekunder.
  • Hold denne besværlige opgave ope i 1 uge.
  • Handle med en bruger ad gangen.

Naturligvis er dette lidt latterligt. Et websted på én side, der beskæftiger sig med en kunde ad gangen, kan drives med et ark papir og en pakke farveblyanter. En reel beskrivelse af pålidelighedskrav til en virksomhed strækker sig til mange sider.

Jeg er nødt til at forfalde et operationelt miljø og se, hvad der sker. Jeg kører min produktionstjeneste i en uge, samler nogle tal om ydeevne og fiasko og sammenligner disse målinger med kravene.

Forudsigelse af pålidelighed inden drift

Jeg har brug for et overvågnings- og alarmsystem, der holder øje med min service.

  • indefra, ser på komponenterne og
  • udefra og kontrollere, hvad en klient ville se.

For at se mit system indefra bruger jeg open source-applikationen Cacti, fordi det er gratis, og mit projektbudget er nul. Jeg kunne bruge de grundlæggende CloudWatch-metrics, som AWS bundter med min EC2-maskine. Jeg får disse gratis.

Figur A

Det er fint, men jeg er ikke helt tilfreds med detaljeringsniveauet. Jeg kunne aktivere detaljeret overvågning for et mindre gebyr, men det behøver jeg ikke.

For at se mit system udefra bruger jeg den skybaserede overvågningstjeneste Monitor.Us.

Ser på indersiden med kaktus

Kaktus er et open source-program, der kan vise mig historien om, hvor meget mit systems ressourcer blev brugt. Det producerer grafer over systemaktivitet - CPU, netværksbrug, antal brugere der er logget ind og så videre. Disse grafer viser mig, hvad der er sket i de sidste fem minutter, de sidste par timer, uge ​​og endda år. En simpel installation af kaktus holder øje med netop EC2-maskinen, hvor den er installeret, men den kan også se hundredvis af andre maskiner.

Figur B

Jeg følger denne procedure for at begynde at se mit system indefra.

  • Installer kaktus for at fremstille ydelsesgrafer.
  • Udvid kaktisovervågning til at dække alle mine EC2-maskiner.
  • Få den nye service til at gøre noget med test af mennesker eller en syntetisk belastningsgenerator.
  • Saml en uges grafer.

Jeg har nu min første opfattelse af, om en komponent sandsynligvis vil mislykkes. Hvis jeg allerede har problemer, vil jeg sandsynligvis have et uacceptabelt niveau af fiasko.

Kaktus er irriterende at installere på en måde, som kun open source-produkter kan være. Det ville bestemt ikke overleve som et lukket kildeprodukt: ingen betalende kunde ville bruge gode penge på at fikle med config i timevis. Det hele starter så let med sudo yum installation kaktus, derefter falder det hurtigt ned i SNMP config og manglende grafforvirring. Jeg beundrer den idealistiske advokat, professor Eben Moglen, der sagde, at proprietær software er så latterligt som proprietær matematik (selvom jeg læste det på Wikipedia, så han har muligvis sagt "matematik er ordentligt latterligt") og endda ser jeg ikke frem til at installere kaktus. En gang forbi smerterbarrieren er det stadig et fremragende produkt, der vedligeholder masser af lette at læse resumégrafer, der dækker perioder fra 5 minutter til 1 år.

(Hvis du ønsker, at kaktuserne skal installere snyderi, skal du sige det.)

Ser på ydersiden med Monitor.Us

Jeg er nødt til at kontrollere responstiden via Internettet og sørge for, at systemet opfylder mine krav. Jeg kan kigge efter et mønster i mine resultater for at hjælpe mig med at finde ud af, om min service er konsistent.

Monitor.Us følger freemium marketing model. Ligesom AWS Cloudwatch giver Monitor.Us det grundlæggende gratis, som får opmærksomheden af ​​billigskøjter som mig, og afgifter for de smarte ting. Jeg kan gratis få en regelmæssig HTTP-check af www.internetmachines.co.uk og en svartidgrafik for den aktuelle dag (jeg vil faktisk have en uges grafer, hvilket betyder, at enten skal jeg være nøje opmærksom i en uge eller betale lidt penge).

Fig

Monitor.Us-tjenesten kan fungere som en operationel monitor, der opfylder en anden af ​​mine driftsberedskabskrav.

Måling af pålidelighed under drift

En permanent pålidelighedsmonitor sætter numrene på smerten ved fiasko. I løbet af mit systems levetid kan jeg registrere dets ydeevne og evaluere mine data. Kaktus viser mig til sidst en graf over hele året.

I teorien, jo flere data jeg har, jo bedre er mit billede af dets pålidelighed, så jeg kan forbedre mine forudsigelser med historiske data. I praksis skal jeg være forsigtig. Det tager kun en lille infrastrukturændring for at fjerne værdien af ​​mine målinger. Bare fordi min service fungerede fint i årevis på IBM-klinger, betyder det ikke, at den vil fungere fint på EC2 VM'er.

© Copyright 2020 | mobilegn.com