Puncte:0

Se blochează Ubuntu 20.04: a fost detectată o eroare ECC sau otravă L2

drapel kz

Ubuntu 20.04 se blochează aleatoriu în momente diferite. Nu se poate indica un anumit eveniment.

uname -a 
Linux ubuntu 5.11.0-051100-generic #202102142330 
SMP Duminica 14 februarie 23:33:21 UTC 2021 x86_64 x86_64 x86_64 GNU/Linux

Se blochează cu următorul semnal:

 kernel:[19849.215258] [Eroare hardware]: Eroare necorectată, repornibilă software.

 kernel:[19849.215259] [Eroare hardware]: CPU:22 (19:21:0) MC0_STATUS[-|UE|MiscV|AddrV|-|-|-|-|Poison|-]: 0xbc00080001010135

 kernel:[19849.215263] [Eroare hardware]: Adresă eroare: 0x000000076bed1c00

 kernel:[19849.215264] [Eroare hardware]: IPID: 0x001000b000000000

 kernel:[19849.215266] [Eroare hardware]: Încărcați unitatea de stocare ext. Cod de eroare: 1, a fost detectată o eroare ECC sau otravă L2 pe un cache de date citit de o încărcare.

 kernel:[19849.215269] [Eroare hardware]: nivelul cache: L1, tx: DATE, mem-tx: DRD

Informații hardware:

### PROCESOR
  Arhitectură: x86_64
  Modul operațional al procesorului: 32 de biți, 64 de biți
  Ordinea octetilor: Little Endian
  Dimensiuni adrese: 48 de biți fizice, 48 de biți virtuale
  CPU(e): 24
  Lista CPU(e) on-line: 0-23
  Filet(e) per miez: 2
  Miez(e) per soclu: 12
  Priză(i): 1
  Nod(e) NUMA: 1
  ID furnizor: AuthenticAMD
  Familia CPU: 25
  Model: 33
  Nume model: Procesor AMD Ryzen 9 5900X cu 12 nuclee
  Pasul: 0
  Amplificare de frecvență: activată
  CPU MHz: 2200.000
  CPU max MHz: 6442.4800
  CPU min MHz: 2200.0000

### Informații placa de bază
  Producator: ASRock
  Nume produs: X570 Taichi

### Memorie:
G Skill Trident Z Neo DDR4 - 3600Mhz 32GB (2 x 16GB)

Care sunt modalitățile sugerate de a afla cauza principală? Cum activez mai multe înregistrări sau dacă jurnalul există deja, unde le pot găsi etc. Orice îndrumare va fi apreciată. Mulțumiri!

Puncte:2
drapel in

Asta nu este tehnic un raspuns, dar...

The A fost detectată eroare ECC sau otravă L2 pe un cache de date citit de o încărcare mesajul indică o problemă de memorie, fie cu memoria RAM în sine, fie cu memoria cache de pe CPU. Niciunul nu este grozav, dar puteți testa RAM-ul sistemului cu următorul proces:

  1. Reporniți sistemul
  2. Țineți apăsat butonul Schimb pentru a afișa meniul GRUB
  3. Selectați „Ubuntu, memtest86+” și apăsați introduce
    Testul de memorie va rula până la sfârșitul timpului sau până când apăsați tasta Esc cheie. Lăsați mașina să finalizeze cel puțin un test înainte de a scăpa.

Bazat pe rapoarte în jurul pe web, această problemă pare să fie văzută numai cu procesoarele AMD Ryzen de ultimă generație. Citind acest fir lung pe site-ul comunității AMD a dezvăluit acest lucru interesant:

Am înlocuit memoria și computerul este solid acum de câteva zile. Sper că acest lucru vă ajută, așa cum m-a ajutat pe mine. Memoria anterioară a fost memoria Gskill 3600mhz... noua memorie este 3200 memorie de la Corsair.

Întrebarea dvs. nu precizează ce fel de memorie ați instalat, dar, dacă este un set de module cu frecvență mai mare, este posibil să existe ceva între RAM și CPU care cauzează o instabilitate. Dacă testul de memorie eșuează și se întâmplă să aveți o memorie RAM compatibilă de 3200MHz disponibilă (chiar dacă este doar un DIMM), luați în considerare să o schimbați și să efectuați din nou testul de memorie.

dina avatar
drapel kz
Multumesc mult pentru raspuns. RAM-ul meu este G Skill Trident Z Neo DDR4 - 3600Mhz 32GB (2x16). Am rulat memtest86, a durat aproximativ patru ore și jumătate și a trecut testul.
dina avatar
drapel kz
Din păcate, nu am memorie de rezervă, aceasta este o construcție nouă. Sper să apară câteva soluții pentru acest lucru pe stratul BIOS sau OS în loc de hardware.
heynnema avatar
drapel ru
@dnification Cu memtest, ai rulat doar 1 test sau toate 4/4? Procesoarele AMD sunt foarte exigente în privința memoriei RAM. RAM-ul tău este pe lista de compatibilitate? Accesați site-ul de asistență pentru placa de bază și aruncați o privire. De asemenea, procesorul sau memoria RAM sunt overclockate?
heynnema avatar
drapel ru
@dnification Arată-mi și „sudo dmidecode -s bios-version”. Ai activat ECC pentru RAM... poate în BIOS?
dina avatar
drapel kz
mulțumesc @heynnema, am rulat toate testele (cred că au arătat aproximativ 10 teste și a rulat mai mult de 4 ore). CPU sau RAM ar trebui să fie setate așa cum este. Nu-mi amintesc să fi făcut modificări sau să fi făcut overclock. Versiunea BIOS este „P4.30”. Voi arunca o privire despre ECC în timpul pornirii.
dina avatar
drapel kz
@heynnema, am rulat și memtester: `sudo memtester 4000M 1`. nicio eroare raportata.
dina avatar
drapel kz
Versiunea BIOS pare a fi cea mai recentă. Aceasta este placa de bază: https://www.asrock.com/mb/AMD/X570%20Taichi/#Specification
heynnema avatar
drapel ru
@dnification Accesați https://www.asrock.com/MB/AMD/X570%20Taichi/index.asp#Download și uitați-vă la lista CPU Support pentru a determina numele procesorului, apoi uitați-vă la lista corespunzătoare de memorie QVL pentru a determina dacă memoria dvs. este susținută. Obțineți modelul DIMM-urilor dvs. cu „memorie sudo lshw -C”.
dina avatar
drapel kz
Să [continuăm această discuție în chat](https://chat.stackexchange.com/rooms/126576/discussion-between-dnification-and-heynnema).
drapel cn
Am ECC RAM și un Ryzen 5900X. Am verificat prin `edac-util` și `dmesg` că ECC pare să funcționeze. Nu am văzut nicio eroare de luni de zile. Cu toate acestea, o dată la câteva zile, aparatul meu se îngheață și repornește. `/var/log/kern.log` arată același MCE (otrăvire cache L2). Voi rula `memtest86+`, dar mă îndoiesc că va găsi probleme. I-am văzut pe alții plângându-se despre asta cu 5900X, așa că bănuiesc microcodul procesorului. Încercarea de a colecta mai multe date.
Puncte:1
drapel ru

BIOS

ASRock X570 Taichi

BIOS-ul este actual la versiunea P4.30.

MEMORIE

G Skill Trident Z Neo DDR4 - 3600Mhz 32GB (2 x 16GB), produs: F4-3600C16-16GTZNC

Procesor AMD Ryzen 9 5900X cu 12 nuclee

Procesoarele Ryzen sunt foarte exigente în privința memoriei RAM.

Aceste module DIMM nu apar pe lista de memorie acceptată, așa cum se vede Aici.

memtest a trecut toate testele.

Când ne uităm la sudo lshw -C memorie vedem că DIMM-urile Mai fi instalat în locații incorecte ale sloturilor. Când utilizați 2 DIMM-uri de dimensiuni egale, acestea trebuie instalate în sloturile A2 și B2. Iată o imagine a aspectului plăcii și a sloturilor de memorie... luată din Manualul de utilizare la Aici... deci verificați asta...

introduceți descrierea imaginii aici

dina avatar
drapel kz
O sa incerc astazi multumesc mult! :D
dina avatar
drapel kz
Am mutat RAM-ul din A1 --> A2 și B1 --> B2. Se pare că încă se prăbușește după ceva timp. :( Îmi puteți sugera altceva? Există teste pe care le pot rula, vreo diagnosticare pentru a vedea dacă este cu siguranță o eroare hardware? Am pornit sistemul în Windows și l-am ținut să funcționeze suficient de mult timp fără nicio blocare.
heynnema avatar
drapel ru
@dnification Tocmai am observat că rulați kernelul 5.11.0-051100-generic pe 20.04. Nu cred că acesta este nucleul stoc pentru 20.04. L-ați instalat manual sau o actualizare de software a pus-o acolo? Editează-ți întrebarea și arată-mi `ls -al /boot`.
heynnema avatar
drapel ru
@dnification Porniți pe un USB/DVD Ubuntu Live 21.04 și rulați sistemul suficient pentru a vedea dacă există probleme.
dina avatar
drapel kz
da, am instalat manual nucleul. Voi încerca 21.04 și vă anunt.
drapel cn
Am aceeași placă și procesor ca și tine, dar am ECC RAM. Nu s-au indicat probleme ECC cu `edac-utils` și pare să funcționeze bine în conformitate cu asta și `dmesg`. Am si eu problema asta. Încerc să determin dacă problema este placa sau 5900X. S-ar putea să schimb un 3600 aici pentru un pic. Având în vedere că se pare că afectează un număr de oameni, aș dori să ajung la rădăcina acestei probleme.
heynnema avatar
drapel ru
@dnification Stare vă rog...
dina avatar
drapel kz
Am încercat pentru scurt timp Ubuntu live 21.04, dar am renunțat rapid din cauza problemei driverului grafic și a muncii prea mult reinstalând acesta din nou și din nou. M-am mutat înapoi la Windows. Nu am văzut niciun accident până acum. Un pic dezamăgit că am renunțat, dar mă costă mult timp să mă joc cu toate aceste setări.
heynnema avatar
drapel ru
@dnification Testul 21.04 trebuia să vadă dacă mai aveai erori de memorie. Nu m-a surprins cu adevărat că ar fi putut apărea probleme de grafică, chiar dacă ați fi putut instala drivere video în timpul testului. Îmi pare rău să văd că mergi în „cealaltă parte”.
Puncte:0
drapel kz

Pe baza sugestiei de la @heynnema, am putut afla că modelul de DIMM-uri instalate pe computerul meu nu este listat în lista lor de compatibilitate. Iată pașii urmați:

  1. Vizitați lista CPU acceptate a Site-ul web ASRock x570 Taichi. Aflați tipul de bază. In cazul meu a fost Vermeer
  2. Aflați modelul DIMM-urilor instalate pe sistem rulând sudo lshw -C memorie (a fost F4-3600C16-16GTZNC)
  3. Navigați la Lista de memorie acceptată pentru Vermeer și vezi dacă este acceptat. Din pacate nu este in lista! poate că aceasta este cauza accidentelor inconsecvente. Voi încerca o versiune acceptată de DIMM-uri pentru a vedea dacă blocările apar din nou și voi actualiza acest răspuns în consecință.
 *-firmware
       descriere: BIOS
       furnizor: American Megatrends Inc.
       ID fizic: 0
       versiunea: P4.30
       data: 14.04.2021
       dimensiune: 64 KiB
       capacitate: 16 MiB
       capabilități: pci upgrade shadowing cdboot bootselect socketedrom edd int13floppy1200 int13floppy720 int13floppy2880 int5printscreen int9keyboard int14serial int17printer acpi usb biosbootspecification uefi
  *-memorie
       descriere: Memorie de sistem
       ID fizic: e
       slot: placa de sistem sau placa de baza
       dimensiune: 32 GiB
     *-banca:0
          descriere: DIMM DDR4 sincron fără tampon (neînregistrat) 2133 MHz (0,5 ns)
          produs: F4-3600C16-16GTZNC
          furnizor: necunoscut
          ID fizic: 0
          serie: 00000000
          slot: DIMM 0
          dimensiune: 16 GiB
          lățime: 64 biți
          ceas: 2133 MHz (0,5 ns)
     *-banca:1
          descriere: Project-Id-Version: lshwReport-Msgid-Bugs-To: FULL NAME <EMAIL@ADDRESS>PO-Revision-Date: 2012-02-02 13:04+0000Last-Translator: Joel Addison <[email protected] >Echipă de limbă: engleză (Australia) <[email protected]>Versiune MIME: 1.0Tip de conținut: text/plan simplu; charset=UTF-8Content-Transfer-Encoding: 8bitX-Launchpad-Export-Date: 2021-01-21 18:43+0000X-Generator: Launchpad (build 2d1d5e352f0d063d660df2300d063d660df2300x-063d660df2300x-Version-02-0000000000000000000000000000000000000000000000000000000000000000000000003 NUME COMPLET <EMAIL@ADDRESS>PO-Revision-Date: 2012-02-02 13:04+0000Last-Translator: Joel Addison <[email protected]>Limba-Echipă: Engleză (Australia) <[email protected]> MIME-Versiune: 1.0Content-Type: text/plain; charset=UTF-8Content-Transfer-Encoding: 8bitX-Launchpad-Export-Date: 2021-01-21 18:43+0000X-Generator: Launchpad (build 2d1d5e352f0d063d660df2300be027fa65)
          produs: necunoscut
          furnizor: necunoscut
          ID fizic: 1
          serial: necunoscut
          slot: DIMM 1
     *-banca:2
          descriere: DIMM DDR4 sincron fără tampon (neînregistrat) 2133 MHz (0,5 ns)
          produs: F4-3600C16-16GTZNC
          furnizor: necunoscut
          ID fizic: 2
          serie: 00000000
          slot: DIMM 0
          dimensiune: 16 GiB
          lățime: 64 biți
          ceas: 2133 MHz (0,5 ns)
     *-banca:3
          descriere: Project-Id-Version: lshwReport-Msgid-Bugs-To: FULL NAME <EMAIL@ADDRESS>PO-Revision-Date: 2012-02-02 13:04+0000Last-Translator: Joel Addison <[email protected] >Echipă de limbă: engleză (Australia) <[email protected]>Versiune MIME: 1.0Tip de conținut: text/plan simplu; charset=UTF-8Content-Transfer-Encoding: 8bitX-Launchpad-Export-Date: 2021-01-21 18:43+0000X-Generator: Launchpad (build 2d1d5e352f0d063d660df2300d063d660df2300x-063d660df2300x-Version-02-0000000000000000000000000000000000000000000000000000000000000000000000003 NUME COMPLET <EMAIL@ADDRESS>PO-Revision-Date: 2012-02-02 13:04+0000Last-Translator: Joel Addison <[email protected]>Limba-Echipă: Engleză (Australia) <[email protected]> MIME-Versiune: 1.0Content-Type: text/plain; charset=UTF-8Content-Transfer-Encoding: 8bitX-Launchpad-Export-Date: 2021-01-21 18:43+0000X-Generator: Launchpad (build 2d1d5e352f0d063d660df2300be027fa65)
          produs: necunoscut
          furnizor: necunoscut
          ID fizic: 3
          serial: necunoscut
          slot: DIMM 1
  *-cache:0
       descriere: cache L1
       ID fizic: 11
       slot: L1 - Cache
       dimensiune: 768 KiB
       capacitate: 768 KiB
       ceas: 1 GHz (1,0 ns)
       capabilități: pipeline-burst write-back intern unificat
       configurație: nivel=1
  *-cache:1
       descriere: cache L2
       ID fizic: 12
       slot: L2 - Cache
       dimensiune: 6 MiB
       capacitate: 6 MiB
       ceas: 1 GHz (1,0 ns)
       capabilități: pipeline-burst write-back intern unificat
       configurație: nivel=2
  *-cache:2
       descriere: cache L3
       ID fizic: 13
       slot: L3 - Cache
       dimensiune: 64 MiB
       capacitate: 64 MiB
       ceas: 1 GHz (1,0 ns)
       capabilități: pipeline-burst write-back intern unificat
       configurație: nivel=3
heynnema avatar
drapel ru
Arată-mi `sudo lshw -C memory`. Vreau să verific în ce sloturi sunt DIMM-urile. Scoateți un DIMM de 16G și vedeți dacă situația de blocare se îmbunătățește.
dina avatar
drapel kz
@heynnema am adăugat rezultatul comenzii în răspunsul de mai sus.
drapel cn
Placa ar trebui să poată suporta DIMM-uri care nu sunt în lista de compatibilitate foarte bine. Am construit multe sisteme Ryzen începând cu 1800X. Am urmărit până acum această groapă de iepure „RAM compatibilă”, fără niciun rezultat pozitiv. Kilometrajul dvs. poate varia. Este bine să încerci un alt set de DIMM-uri în orice caz.
dina avatar
drapel kz
@MishaNasledov mulțumesc, nu am opțiunea de a înlocui DIMM-urile din păcate și am decis să mă întorc la Windows. Am Win10 pro și funcționează bine până acum.

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.