Puncte:0

Cum se calculează timpul de detectare în registrul de lucru Google Site Reliability Engineering?

drapel cn

În al doilea exemplu de alertă SLO din registrul de lucru Site Reliability Engineering, se face următoarea declarație:

Pentru a menține rata de alerte gestionabilă, decideți să fiți notificat numai dacă un eveniment consumă 5% din bugetul de eroare de 30 de zile – o fereastră de 36 de ore

Se pare că ei sugerează că o fereastră de 36 de ore este derivată din 5% din bugetul de eroare de 30 de zile. Văd că 36 de ore reprezintă 5% din 30 de zile, dar de ce sunt legate aceste două lucruri? De exemplu, un eveniment ar putea consuma orice cantitate dintr-un buget de eroare peste orice dimensiune de fereastră, depinde complet de bugetul de eroare.

În plus, se precizează următoarea formulă pentru timpul de detectare:

(1âSLO/raport eroare)Ãalertează dimensiunea ferestrei

De ce timpul de detectare este proporțional cu dimensiunea ferestrei de alertă? Dacă există o creștere bruscă a erorilor care declanșează o alertă, atâta timp cât fereastra de alertă acoperă perioada în care s-au produs erorile, atunci detectarea va fi aceeași pentru orice dimensiune a ferestrei de alertă.

Simt că ceea ce îmi lipsește este același pentru ambele afirmații, motiv pentru care întreb despre ele împreună.

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.