Video: Take the Lead Jenn Tejada & Stacey Cunningham (Oktober 2024)
PagerDuty je storitev za odzivanje na nesreče in opozorilo, ki deluje pri skoraj vseh storitvah spremljanja. Storitev je mogoče konfigurirati za pošiljanje opozoril s telefonskim klicem, e-pošto, besedilom ali prek aplikacij za iOS in Android, skupaj s potrditvijo dostave in samodejno preusmeritvijo. Na nadzorni plošči so prikazani incidenti in stanje opozorila v vseh vaših orodjih za spremljanje. S prefinjenimi konfiguracijami načrtovanja in eskalacijskimi eskalacijami opozarjate, da je celotna ekipa v zanki. Napredna analitika podjetja PagerDuty pomaga prepoznati vroče točke in trende uspešnosti ekipe.
Z rešitvami za odzivnost na incidenco se ukvarjam že več kot 20 let in zagotovo lahko rečem, da PagerDuty dosega odlično ravnotežje med enostavno uporabo in močjo. Priznam, zaljubljen sem v PagerDuty.
Namestitev
Registracija je bila zelo enostavna in zahtevala sem le moj e-poštni naslov in geslo. Nato sem bil pozvan, naj pošljem testno opozorilo prek SMS-a, telefona in e-pošte. V 10 sekundah sem prejel vsa tri opozorila. Opozorilo SMS PagerDuty me je pozvalo, naj naložim mobilno aplikacijo, medtem ko je telefonski klic rekel: "Pozdravljeni, to je opozorilo za PagerDuty test. Dodajte to številko v telefon, da boste vedno prejemali svoja opozorila." Prepričljivo je bilo, da sistem za opozarjanje deluje.
Naslednji korak je bil povezati moje orodje za spremljanje. To bi lahko storili preprosto tako, da iz spustnega okna podprtih programov, vključno s HP SiteScope, New Relic APM, CopperEgg ali katerim koli od navedenih 50, izberete moje najljubše orodje. Izbral sem CopperEgg, ker sem že nastavil račun, da sem pregledal storitev. Prav tako bi se lahko odločil, da pošljem e-poštno sporočilo PagerDuty, da sproži opozorila ali se povežem neposredno z REST API-jem PagerDutyja. Ko sem kliknil, da dodam CopperEgg, sem bil usmerjen na spletno stran z dodatnimi informacijami o integraciji. Nato sem moral ustvariti in dodati ključ PagerDuty API v CopperEgg. Nato sem nastavil stopnjevanje incidentov, tako da, če se ne odzovem na prvo opozorilo v 10 minutah, bi bil sekundarni odzivnik poslan po e-pošti.
Delo s PagerDuty
Pri prijavi v PagerDuty me je presenetilo, kako naravnost je izgledal vmesnik. PagerDutyjev vmesnik ponuja vse možnosti navigacije na vrhu strani: nadzorno ploščo, nezgode, konfiguracijo, analitiko in pomoč. Armaturna plošča se odpre privzeto in vključuje seznam mojih odprtih incidentov in odprtih incidentov na celotnem podjetju ter vse dejavnosti v zadnjih sedmih dneh. Zaslon za incidente je podoben nadzorni plošči, vendar vključuje več možnosti za delo z nezgodami.
Pravo meso PagerDuty-ja je v meniju za konfiguracijo, ki vključuje možnosti urnikov, storitev, politike eskalacije, uporabnike in skupine. Prvi korak pri sodelovanju s PagerDuty je ustvarjanje uporabnikov, ki bodo opozorjeni, ko pride do incidentov. Uporabniki so dodeljeni eni od štirih vlog, od omejenega, uporabnika, ki lahko samo sproži, potrdi in razreši nezgode, do lastnika računa, ki ima možnost upravljanja ničesar v sistemu PagerDuty. Vsak uporabnik dobi dodeljena pravila obveščanja; lahko jih opozorijo na nove ali spremenjene incidente in ko se njihovo dežurstvo začne z e-pošto, telefonskim klicem ali SMS-om. Zelo verjetno je, da bodo velike organizacije želele uporabnike dodeliti skupinam, da bodo lažje upravljali urnike, obvestila in eskalacijske politike. Na primer, organizacija bi lahko imela ekipo, ki je obveščena o incidentih na strežniku, in drugo ekipo, ki je obveščena o varnostnih incidentih.
V PagerDuty-u je, kot v vseh sistemih za odzivanje na pojavnost, hudič v podrobnostih. Celoten koncept je obvestiti tiste, ki morajo vedeti ob pravem času, in nato vgraditi varnostne kopije, da nič ne pade skozi razpoke. Za to je treba skrbno paziti na urnike in politike obveščanja, zlasti na politike eskalacije. PagerDuty ima fantastično delo, tako da podrobnosti olajša konfiguriranje in upravljanje, in to predvsem zaradi močnega, a enostavno razumljivega vmesnika GUI. Nastavitev urnika dežurstva zahteva malo več kot izbira uporabnikov, izbira vrste vrtenja (dnevno, tedensko ali po meri) ter izbira začetnega časa in datuma. Urnike dežurstva lahko nalagate drug na drugega, tako da vidite, kje se prekrivajo, na strani za upravljanje urnika pa se prikaže koledar, ki jasno prikazuje urnike in prekrivanja. Zaradi preprostega GUI-ja je tudi enostavna nastavitev in upravljanje zelo enostavno konfiguriranje in upravljanje.
Moj prvi preizkus programa PagerDuty je vključeval ročno odpiranje incidenta, kar je mimogrede odlična funkcija za preizkušanje konfiguracije obvestil in stopnjevanja. V petih sekundah sem po telefonskem klicu, SMS-u in e-pošti prejel obvestila o nezgodah. Telefonski klic mi je glasno prebral storitev, ki je povzročila opozorilo, in nekaj osnovnih informacij o opozorilu, poleg tega pa mi je dala možnosti, da se odzovem, na primer "pritisnite 4 za potrditev, 6 za razrešitev ali 8 za stopnjevanje". Pritisnil sem 4, da potrdim, in po moji politiki obveščanja sem bil čez pol ure ponovno obveščen, da stanje opozorila še vedno obstaja (edini načini za zaustavitev obvestil so njihovo razreševanje ali stopnjevanje). Obvestila, ki sem jih prejela prek e-pošte in SMS-a, so bila podobna, opozorilo po e-pošti je vsebovalo tudi povezavo do spletnega mesta PagerDuty, tako da sem lahko videl več informacij. PagerDuty je med mojim testiranjem opravil občudovanja vredno in me pravočasno obvestil o incidentih, po moji eskalacijski politiki, in me ponovno obvestil, ko sem zanemaril označiti težavo kot rešeno.
Pomoč PagerDutyja je odlična. Vsaka stran na portalu vsebuje vsaj eno povezavo do kontekstno občutljive pomoči. Obstaja tudi poglavje o poglobljenem začetku, ki zajema vse od osnovnih tem, na primer nastavitve in odzivanja na obvestila do naprednejših tem, kot so ustvarjanje urnika dežurstva in oblikovanje eskalacijskih politik. Spletna pomoč vključuje tudi podrobne informacije o integraciji programa PagerDuty z drugimi orodji za spremljanje, vire razvijalcev in obrazec za oddajo zahteve za tehnično podporo.
Poročila družbe PagerDuty so zelo preprosta in jih je enostavno razumeti. Poročila lahko prikažemo na celotnem sistemu ali jih filtriramo v pravilniku o storitvah, skupini ali eskalaciji. Na voljo so tudi povzete meritve, ki prikazujejo povprečni čas za potrditev, srednji čas za rešitev, število stopnjenih incidentov in drugo. Te informacije so zelo koristne operativno, vendar bodo upravljavci verjetno želeli večjo globino za namene načrtovanja in analiz, v tem primeru pa bodo te podatke želeli odstraniti iz PagerDutyja. Če ste naročeni na načrt podjetja, potem je možno izvoziti poročila. PagerDuty priporoča, da poizvedujete o incidentih prek njihovega API-ja, namesto da bi izvažali poročila.