Puncte:0

Dezactivarea e-mailului pentru Prometheus Alertmanager în funcție de gravitate

drapel ru

Monitorizăm un cluster de calcul HPC folosind o combinație de Prometheus, Alertmanager și Grafana. Pe mașinile noastre, lucruri precum umplerea memoriei SWAP până la limita limită se întâmplă frecvent și, deși este util să vedeți memoria corespunzătoare info-nivel alerte în tabloul de bord Grafana Alerts, de preferat nu trimitem e-mailurile corespunzătoare.

Există vreo modalitate de a dezactiva/dezactiva toate, să zicem, e-mailurile de alertă care au gravitate info în alertmanager.yml fisier de configurare?

Alertele sunt toate definite similar cu aceasta (ajustată de la https://awesome-prometheus-alerts.grep.to/rules.html):

  - alertă: HostSwapIsFillingUp
    expr: (1 - (node_memory_SwapFree_bytes / node_memory_SwapTotal_bytes)) * 100 > 95
    pentru: 60m
    etichete:
      severitate: info
    adnotari:
      rezumat: Schimbul de gazdă se umple (instanța {{ $labels.instance }})
      descriere: „Swap se umple (>95%)\n VALUE = {{ $value }}”

și secțiunea corespunzătoare din alertmanager.yml se citește fișierul

  rute:
    - Meci:
        severitate: „avertisment”
      interval_repetare: 24h
      continua: adevarat
    - Meci:
        severitate: „informații”
      interval_repetare: 24h
      continua: adevarat
      receptor: scăpat

receptori:
  - nume: „admin-mails”
    email_configs:
      - către: „admins@DOMAIN”
  - nume: „scăpat”
    email_configs:
      - către: „admins@DOMAIN”

Există posibilitatea de a vă asigura că infoalertele de nivel nu provoacă niciodată e-mailuri, în timp ce le au în continuare „declanșează”, astfel încât Grafana le va afișa?

Puncte:0
drapel ru

După câteva încercări și erori, următoarele pare să facă truc:

  rute:
    - Meci:
        severitate: „avertisment”
      interval_repetare: 24h
      continua: adevarat
    - Meci:
        severitate: „informații”
      interval_repetare: 24h
      continua: adevarat
      receptor: scăpat

receptori:
  - nume: „admin-mails”
    email_configs:
      - către: „admins@DOMAIN”
  - nume: „scăpat”

Deci ideea este să aveți pur și simplu receptorul neconfigurat. Cu aceasta, nu se mai generează e-mailuri, dar alertele sunt încă afișate în Grafana.

Voi lăsa asta aici în cazul în care altcineva întâmpină aceeași întrebare.

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.