Puncte:0

Fedora Server 34 se blochează aleatoriu la fiecare câteva minute pe HP ProLiant DL380e G8

drapel ar

Din păcate, am o problemă cu serverul meu HP ProLiant DL380e G8 care rulează Fedora Server 34. Bănuiesc că acestea sunt erori de memorie sau un DIMM care se defectează/se defectează, însă nu sunt sigur.

Feedback-ul este foarte binevenit!

Am fugit journalctl -r, care returnează următoarea ieșire în linkul PasteBin (un fragment din ceea ce pare ieșit din comun): https://pastebin.com/KPUZHceD

Tot ajutorul și ideile sunt apreciate!

Salutări calde

Editați | ×: Ca răspuns la comentariul lui @Michael Hampton: Rezultatul postat aici:

<27>Sep 7 17:03:51 mcelog: Locație: SOCKET:0 CHANNEL:3 DIMM:1 []
Sep 07 17:03:51 turbo mcelog[1304]: Locație: SOCKET:0 CHANNEL:3 DIMM:1 []
07 septembrie 17:03:51 turbo mcelog[1303]: <27>7 septembrie 17:03:51 mcelog: numărul erorilor de memorie DIMM corectate a depășit pragul: 10 în 24 de ore
07 septembrie 17:03:51 turbo mcelog[1303]: numărul erorilor de memorie DIMM corectat a depășit pragul: 10 în 24 de ore
Sep 07 17:03:51 turbo mcelog[1304]: <27>Sep 7 17:03:51 mcelog: Locație: SOCKET:0 CHANNEL:3 DIMM:1 []
Sep 07 17:03:51 turbo mcelog[1304]: Locație: SOCKET:0 CHANNEL:3 DIMM:1 []
07 septembrie 17:03:51 turbo mcelog[1303]: <27>7 septembrie 17:03:51 mcelog: numărul erorilor de memorie DIMM corectate a depășit pragul: 10 în 24 de ore
07 septembrie 17:03:51 turbo mcelog[1303]: numărul erorilor de memorie DIMM corectat a depășit pragul: 10 în 24 de ore
Sep 07 17:03:51 turbo mcelog[1067]: Furnizor CPUID Familia Intel 6 Model 45 Pasul 7
Sep 07 17:03:51 turbo mcelog[1067]: MICROCODE 71a
Sep 07 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID 2 SOCKETID 0
Sep 07 17:03:51 turbo mcelog[1067]: STATUS c80000c400800093 MCGSTATUS 0
07 septembrie 17:03:51 turbo mcelog[1067]: MemCtrl:
Sep 07 17:03:51 turbo mcelog[1067]: Tranzacție: Eroare citire memorie
Sep 07 17:03:51 turbo mcelog[1067]: MCA: MEMORY CONTROLLER RD_CHANNEL3_ERR
07 septembrie 17:03:51 turbo mcelog[1067]: Registrul MCi_MISC valid
07 septembrie 17:03:51 turbo mcelog[1067]: eroare corectată
07 septembrie 17:03:51 turbo mcelog[1067]: eroare depășire
Sep 07 17:03:51 turbo mcelog[1067]: Stare MCi:
07 septembrie 17:03:51 turbo mcelog[1067]: stare MCG:
07 sept 17:03:51 turbo mcelog[1067]: TIME 1631027031 marți 7 sept 17:03:51 2021
Sep 07 17:03:51 turbo mcelog[1067]: MISC d22131295c834800
Sep 07 17:03:51 turbo mcelog[1067]: CPU 1 BANK 11
07 septembrie 17:03:51 turbo mcelog[1067]: MCE 7
Sep 07 17:03:51 turbo mcelog[1067]: Eveniment hardware. Aceasta nu este o eroare de software.
Sep 07 17:03:51 turbo mcelog[1067]: Furnizor CPUID Familia Intel 6 Model 45 Pasul 7
Sep 07 17:03:51 turbo mcelog[1067]: MICROCODE 71a
Sep 07 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID 3 SOCKETID 0
Sep 07 17:03:51 turbo mcelog[1067]: STATUS c80000c400800093 MCGSTATUS 0
07 septembrie 17:03:51 turbo mcelog[1067]: MemCtrl:
Sep 07 17:03:51 turbo mcelog[1067]: Tranzacție: Eroare citire memorie
Sep 07 17:03:51 turbo mcelog[1067]: MCA: MEMORY CONTROLLER RD_CHANNEL3_ERR
07 septembrie 17:03:51 turbo mcelog[1067]: Registrul MCi_MISC valid
07 septembrie 17:03:51 turbo mcelog[1067]: eroare corectată
07 septembrie 17:03:51 turbo mcelog[1067]: eroare depășire
Sep 07 17:03:51 turbo mcelog[1067]: Stare MCi:
07 septembrie 17:03:51 turbo mcelog[1067]: stare MCG:
07 sept 17:03:51 turbo mcelog[1067]: TIME 1631027031 marți 7 sept 17:03:51 2021
Sep 07 17:03:51 turbo mcelog[1067]: MISC d22131295c834800
07 septembrie 17:03:51 turbo mcelog[1067]: CPU 13 BANK 11
07 septembrie 17:03:51 turbo mcelog[1067]: MCE 6
Sep 07 17:03:51 turbo mcelog[1067]: Eveniment hardware. Aceasta nu este o eroare de software.
Sep 07 17:03:51 turbo mcelog[1067]: Furnizor CPUID Familia Intel 6 Model 45 Pasul 7
Sep 07 17:03:51 turbo mcelog[1067]: MICROCODE 71a
Sep 07 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID 0 SOCKETID 0
Sep 07 17:03:51 turbo mcelog[1067]: STATUS c80000c400800093 MCGSTATUS 0
07 septembrie 17:03:51 turbo mcelog[1067]: MemCtrl:
Sep 07 17:03:51 turbo mcelog[1067]: Tranzacție: Eroare citire memorie
Sep 07 17:03:51 turbo mcelog[1067]: MCA: MEMORY CONTROLLER RD_CHANNEL3_ERR
07 septembrie 17:03:51 turbo mcelog[1067]: Registrul MCi_MISC valid
07 septembrie 17:03:51 turbo mcelog[1067]: eroare corectată
07 septembrie 17:03:51 turbo mcelog[1067]: eroare depășire
Sep 07 17:03:51 turbo mcelog[1067]: Stare MCi:
07 septembrie 17:03:51 turbo mcelog[1067]: stare MCG:
07 sept 17:03:51 turbo mcelog[1067]: TIME 1631027031 marți 7 sept 17:03:51 2021
Sep 07 17:03:51 turbo mcelog[1067]: MISC d22131295c834800
07 septembrie 17:03:51 turbo mcelog[1067]: CPU 0 BANK 11
07 septembrie 17:03:51 turbo mcelog[1067]: MCE 5
Sep 07 17:03:51 turbo mcelog[1067]: Eveniment hardware. Aceasta nu este o eroare de software.
07 septembrie 17:03:51 turbo mcelog[1067]: Se execută declanșatorul „dimm-error-trigger” (reporter: memdb)
Sep 07 17:03:51 turbo mcelog[1067]: Furnizor CPUID Familia Intel 6 Model 45 Pasul 7
Sep 07 17:03:51 turbo mcelog[1067]: MICROCODE 71a
Sep 07 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID 6 SOCKETID 0
Sep 07 17:03:51 turbo mcelog[1067]: STATUS c80000c400800093 MCGSTATUS 0
07 septembrie 17:03:51 turbo mcelog[1067]: MemCtrl:
Sep 07 17:03:51 turbo mcelog[1067]: Tranzacție: Eroare citire memorie
Sep 07 17:03:51 turbo mcelog[1067]: MCA: MEMORY CONTROLLER RD_CHANNEL3_ERR
07 septembrie 17:03:51 turbo mcelog[1067]: Registrul MCi_MISC valid
07 septembrie 17:03:51 turbo mcelog[1067]: eroare corectată
07 septembrie 17:03:51 turbo mcelog[1067]: eroare depășire
Sep 07 17:03:51 turbo mcelog[1067]: Stare MCi:
07 septembrie 17:03:51 turbo mcelog[1067]: stare MCG:
07 sept 17:03:51 turbo mcelog[1067]: TIME 1631027031 marți 7 sept 17:03:51 2021
Sep 07 17:03:51 turbo mcelog[1067]: MISC d22131295c834800
07 septembrie 17:03:51 turbo mcelog[1067]: CPU 3 BANK 11
07 septembrie 17:03:51 turbo mcelog[1067]: MCE 4
Sep 07 17:03:51 turbo mcelog[1067]: Eveniment hardware. Aceasta nu este o eroare de software.
Sep 07 17:03:51 turbo mcelog[1067]: Furnizor CPUID Familia Intel 6 Model 45 Pasul 7
Sep 07 17:03:51 turbo mcelog[1067]: MICROCODE 71a
Sep 07 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID a SOCKETID 0
Sep 07 17:03:51 turbo mcelog[1067]: STATUS c801c00400800093 MCGSTATUS 0
07 septembrie 17:03:51 turbo mcelog[1067]: MemCtrl:
Sep 07 17:03:51 turbo mcelog[1067]: Tranzacție: Eroare citire memorie
Sep 07 17:03:51 turbo mcelog[1067]: MCA: MEMORY CONTROLLER RD_CHANNEL3_ERR
07 septembrie 17:03:51 turbo mcelog[1067]: Registrul MCi_MISC valid
07 septembrie 17:03:51 turbo mcelog[1067]: eroare corectată
07 septembrie 17:03:51 turbo mcelog[1067]: eroare depășire
Sep 07 17:03:51 turbo mcelog[1067]: Stare MCi:
07 septembrie 17:03:51 turbo mcelog[1067]: stare MCG:
07 sept 17:03:51 turbo mcelog[1067]: TIME 1631027031 marți 7 sept 17:03:51 2021
Sep 07 17:03:51 turbo mcelog[1067]: MISC d2213fa689118800
Sep 07 17:03:51 turbo mcelog[1067]: CPU 5 BANK 11
07 septembrie 17:03:51 turbo mcelog[1067]: MCE 3
Sep 07 17:03:51 turbo mcelog[1067]: Eveniment hardware. Aceasta nu este o eroare de software.
Sep 07 17:03:51 turbo mcelog[1067]: Furnizor CPUID Familia Intel 6 Model 45 Pasul 7
Sep 07 17:03:51 turbo mcelog[1067]: MICROCODE 71a
Sep 07 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID 5 SOCKETID 0
Sep 07 17:03:51 turbo mcelog[1067]: STATUS c801bd8400800093 MCGSTATUS 0
07 septembrie 17:03:51 turbo mcelog[1067]: MemCtrl:
Sep 07 17:03:51 turbo mcelog[1067]: Tranzacție: Eroare citire memorie
Sep 07 17:03:51 turbo mcelog[1067]: MCA: MEMORY CONTROLLER RD_CHANNEL3_ERR
07 septembrie 17:03:51 turbo mcelog[1067]: Registrul MCi_MISC valid
07 septembrie 17:03:51 turbo mcelog[1067]: eroare corectată
07 septembrie 17:03:51 turbo mcelog[1067]: eroare depășire
Sep 07 17:03:51 turbo mcelog[1067]: Stare MCi:
07 septembrie 17:03:51 turbo mcelog[1067]: stare MCG:
07 sept 17:03:51 turbo mcelog[1067]: TIME 1631027031 marți 7 sept 17:03:51 2021
Sep 07 17:03:51 turbo mcelog[1067]: MISC d2213f0649118800
07 septembrie 17:03:51 turbo mcelog[1067]: CPU 14 BANK 11
07 septembrie 17:03:51 turbo mcelog[1067]: MCE 2
Sep 07 17:03:51 turbo mcelog[1067]: Eveniment hardware. Aceasta nu este o eroare de software.
Sep 07 17:03:51 turbo mcelog[1067]: Furnizor CPUID Familia Intel 6 Model 45 Pasul 7
Sep 07 17:03:51 turbo mcelog[1067]: MICROCODE 71a
Sep 07 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID 1 SOCKETID 0
Sep 07 17:03:51 turbo mcelog[1067]: STATUS c801bec400800093 MCGSTATUS 0
07 septembrie 17:03:51 turbo mcelog[1067]: MemCtrl:
Sep 07 17:03:51 turbo mcelog[1067]: Tranzacție: Eroare citire memorie
Sep 07 17:03:51 turbo mcelog[1067]: MCA: MEMORY CONTROLLER RD_CHANNEL3_ERR
07 septembrie 17:03:51 turbo mcelog[1067]: Registrul MCi_MISC valid
07 septembrie 17:03:51 turbo mcelog[1067]: eroare corectată
07 septembrie 17:03:51 turbo mcelog[1067]: eroare depășire
Sep 07 17:03:51 turbo mcelog[1067]: Stare MCi:
07 septembrie 17:03:51 turbo mcelog[1067]: stare MCG:
07 sept 17:03:51 turbo mcelog[1067]: TIME 1631027031 marți 7 sept 17:03:51 2021
Sep 07 17:03:51 turbo mcelog[1067]: MISC d221196e09118800
07 septembrie 17:03:51 turbo mcelog[1067]: CPU 12 BANK 11
07 septembrie 17:03:51 turbo mcelog[1067]: MCE 1
Sep 07 17:03:51 turbo mcelog[1067]: Eveniment hardware. Aceasta nu este o eroare de software.
Sep 07 17:03:51 turbo mcelog[1067]: Furnizor CPUID Familia Intel 6 Model 45 Pasul 7
Sep 07 17:03:51 turbo mcelog[1067]: MICROCODE 71a
Sep 07 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID 0 SOCKETID 0
Sep 07 17:03:51 turbo mcelog[1067]: STATUS c0107b4000010093 MCGSTATUS 0
Sep 07 17:03:51 turbo mcelog[1067]: Tranzacție: Eroare citire memorie
Sep 07 17:03:51 turbo mcelog[1067]: MCA: MEMORY CONTROLLER RD_CHANNEL3_ERR
07 septembrie 17:03:51 turbo mcelog[1067]: eroare corectată
07 septembrie 17:03:51 turbo mcelog[1067]: eroare depășire
Sep 07 17:03:51 turbo mcelog[1067]: STATUS c0107b4000010093 MCGSTATUS 0
Sep 07 17:03:51 turbo mcelog[1067]: Tranzacție: Eroare citire memorie
Sep 07 17:03:51 turbo mcelog[1067]: MCA: MEMORY CONTROLLER RD_CHANNEL3_ERR
07 septembrie 17:03:51 turbo mcelog[1067]: eroare corectată
07 septembrie 17:03:51 turbo mcelog[1067]: eroare depășire
Sep 07 17:03:51 turbo mcelog[1067]: Stare MCi:
07 septembrie 17:03:51 turbo mcelog[1067]: stare MCG:
07 sept 17:03:51 turbo mcelog[1067]: TIME 1631027031 marți 7 sept 17:03:51 2021
Sep 07 17:03:51 turbo mcelog[1067]: CPU 0 BANK 5
07 septembrie 17:03:51 turbo mcelog[1067]: MCE 0
Sep 07 17:03:51 turbo mcelog[1067]: Eveniment hardware. Aceasta nu este o eroare de software.
Sep 07 17:03:51 turbo mcelog[1067]: mcelog: mcelog read: eroare de intrare/ieșire
Sep 07 17:03:51 turbo kernel: ERST: [Firmware Warn]: Firmware-ul nu răspunde la timp.
07 septembrie 17:03:51 turbo kernel: mce: [Eroare hardware]: evenimente de verificare a mașinii înregistrate
07 septembrie 17:03:51 turbo kernel: mce: [Eroare hardware]: evenimente de verificare a mașinii înregistrate
07 septembrie 17:03:51 turbo kernel: mce_notify_irq: 6 apeluri inverse suprimate
Michael Hampton avatar
drapel cz
Nu pot vedea ce ai pus pe pastebin. Poate site-ul lor se comportă. În orice caz, este într-adevăr prea lung să fie postat aici? Preferăm ca tot ceea ce este relevant pentru întrebare să fie postat în întrebare ori de câte ori este posibil.
drapel br
Nu este o confugurare susținută.
jonasclaes avatar
drapel ar
@Chopper3 îmi poți explica de ce?
Michael Hampton avatar
drapel cz
Cred că primul lucru pe care l-aș face este să elimin memoria defectuoasă. Jurnalul îl identifică clar.
djdomi avatar
drapel za
`Locație: SOCKET:0 CHANNEL:3 DIMM:1` eliminați acest ram nu am văzut niciodată un defect atât de clar și @chopper3 vă rugăm să explicați că nu văd o problemă la această întrebare, chiar dacă serverul este destul de vechi
drapel br
@jonasclaes pentru că toate serverele au o listă de sisteme de operare acceptate și versiunea acceptată și aveți o configurație neacceptată (https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=&cad =rja&uact=8&ved=2ahUKEwiN8NmwrO3yAhUMgVwKHTRiDxoQFnoECAsQAQ&url=https%3A%2F%2Fh20195.www2.hpe.com%2Fv2%2Fgetdocument.as%3Fdocname%3Dc06Vg2019201920200000000000000000000000000000000000000000000000000000000000000000000001
jonasclaes avatar
drapel ar
@Chopper3 văd. Cu toate acestea, RHEL este întreprindere, iar Fedora este condusă de comunitate. Dar mulțumesc că ai subliniat asta.
Puncte:0
drapel ar

Această postare a fost rezolvată prin eliminarea a 2 stick-uri RAM defecte de pe server și reinstalarea procesorului, deoarece nici acesta nu făcea un contact bun.

Mulțumesc pentru tot ajutorul!

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.