Puncte:0

Alerta prometheus pentru rau Kubernetes

drapel gb

Pe un cluster K8s rulează Prometheus Operator și AlertManager.

Am această alertă pentru a detecta incidente când un pod critic este oprit:

 - alertă: KubernetesContainerMission-gslNotRunning
    expr: kube_pod_status_ready{condition="false", pod=~"mission-gsl.*"} == 1 SAU on() vector(0)
    pentru: 5m
    etichete:
      severitate: avertisment
      mediu: PRODUCTION_ENV
    adnotari:
      rezumat: podul CUSTOM mission-gsl nu rulează mai mult de 5 minute (instanță {{ $labels.instance }})
      descriere: „podul mission-gsl nu rulează mai mult de 5 minute”

Această implementare se repornește automat la un program la fiecare oră și rămâne poate 30 de secunde în timpul procesului.

M-aș aștepta ca alerta să nu se declanșeze, deoarece stipulez o perioadă de 5 minute, dar se întâmplă.

Ce îmi lipsește?

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.