Puncte:0

Ce cauzează erorile de „blocare soft” și cum le pot remedia?

drapel cn

Am văzut mesaje sporadice de forma „BUG: blocare soft - CPU#0 blocat pentru 22 de secunde!” de la System Notifier timp de câteva luni -- Am avut cel puțin trei sau patru actualizări ale versiunii de kernel în acea perioadă de timp și problema pare să se înrăutățească -- chiar aseară, aveam două dintre cele opt nuclee ale mele în această stare , rezultând o blocare a browserului pe care nu l-am putut reseta prin niciun mijloc de care eram conștient (a trebuit să folosesc butonul de resetare hard de pe carcasa turnului). Când se întâmplă acest lucru, nucleul afectează citirile la o utilizare de 100% pe monitorul sistemului.

În prezent rulez Kubuntu 20.04, actualizări de depozit aproape zilnic. În prezent, pe kernel-ul 5.4.077-generic, repornirea pe o versiune mai veche a nucleului nu va ajuta, deoarece actualizările păstrează doar versiunile actuale și una mai veche de kernel și nici măcar nu-mi amintesc cu exactitate cu cât timp în urmă am început să primesc asta (dar cred că am l-a avut în 16.04 înainte de a face upgrade în decembrie anul trecut).

Am o placă de bază MSI, AMD FX8350 (8 nuclee, 8 fire, ceas maxim 4,1 GHz), 16 GB RAM, nVidia GTx750. Nu am rapoarte de temperatură excesivă a procesorului de la widget-urile de monitorizare (și am avut de obicei software BOINC care menține toate cele opt nuclee la 100% când nu folosesc computerul; probleme recente BOINC sau ale proiectului au împiedicat acest lucru timp de câteva săptămâni).

Întrebare de bază: cum pot opri acest comportament? Este aceasta o eroare a nucleului (dacă da, persistă de la cel puțin versiunea 4.4.* și rulează la cel puțin 5,7.*), o problemă hardware sau altceva?

user10489 avatar
drapel in
Există probabil mai multe cauze posibile pentru aceasta, fără a se limita la erori ale driverului de dispozitiv și defecțiuni hardware.
Zeiss Ikon avatar
drapel cn
@user10489 Deci, răspunsul tău este că nu există nicio soluție și trebuie doar să trăim cu găsirea aleatorie a sute de mesaje de notificare stivuite și posibile blocări de software? Acest lucru nu ajută la cearta mea continuă cu partenerul meu despre Mac vs. Windows vs. Linux...
user10489 avatar
drapel in
Trebuie să diagnosticați problema mai profund. Mac-urile pot avea hardware defect la fel de ușor ca Linux. Am postat ca comentariu pentru că nu am un răspuns complet pentru asta. Ar putea sau nu să fie de ajutor pentru a posta mesaje de jurnal de sistem care au precedat blocarea soft sau pentru a rula diagnosticarea hardware.
Zeiss Ikon avatar
drapel cn
@user10489 Sunt un transplant de Windows -- am rulat Windows de la 3.0/1990 până la XP/2011 -- și fac totul din GUI, cu excepția cazului în care introduc anumite comenzi pe care le cunosc sau comenzi de copiere/lipire găsite în răspunsuri, articole etc. *Nu* știu cum să mă descurc sub capota Ubuntu -- pot verifica uleiul, ca să spun așa, și cam atât. Întrebați echivalentul cu purtarea frânelor sau raportați intervalul de căldură al bujiilor instalate...
user10489 avatar
drapel in
De fapt, rularea diagnosticării hardware nu este specifică linuxului în sine. Dacă este disponibil, o diagnosticare hardware a furnizorului (poate pentru placa dvs. de bază?) ar fi ideală. Sper că altcineva vă poate oferi o idee mai clară despre ce să căutați în jurnale.
Zeiss Ikon avatar
drapel cn
MSI chiar face, um, interesant să găsești un diagnostic de descărcat pentru o placă de bază de 3-4 ani. Ca și în, înregistrați-vă, apoi găsiți că nu o listează, apoi găsiți că „chatul live” lor nu există până când înregistrați placa, ceea ce necesită deschiderea turnului pentru a scoate numărul de serie de pe placă. Și deja ne îndreptăm către „comentariile nu sunt pentru discuții extinse”...
user10489 avatar
drapel in
Poate ar trebui să puneți o altă întrebare prin care să cereți un diagnostic hardware bun. Sau caută pe google și găsește câteva și încearcă-le. Un test de stres al procesorului ar putea fi un început bun. Nu sunt surprins că MSI nu oferă unul. Dacă ar fi făcut-o, ar fi probabil în firmware-ul plăcii de bază.
Zeiss Ikon avatar
drapel cn
Rularea sarcinilor BOINC atât pe CPU (8 nuclee la 100% pentru săptămâni la rând) cât și pe GPU (toate nucleele mele Cuda la maxim pentru perioade similare) nu este un test de stres?

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.