Puncte:1

CPU rulează mai fierbinte la inactiv când utilizați parametrii de boot grub

drapel pl

Deci, laptopul meu s-a „înghețat” în mod aleatoriu (sistemul nu răspunde total, mouse-ul blocat, ceasul nu merge înainte, nicio comandă de la tastatură nu are niciun efect și singura modalitate de a ieși din el este repornirea greutății folosind butonul fizic de pornire), de la oriunde până la câteva minute până la câteva ore de utilizare a computerului meu.

Deci, firește, am investigat problema și am încercat să găsesc o remediere.După ce m-am uitat la jurnalul kernelului, am văzut că ultimele evenimente înregistrate înainte de înghețare sunt mai multe „Erori hardware”:

kernel: mce: [Eroare hardware]: evenimente de verificare a mașinii înregistrate

Așa că îl caut și încerc să găsesc soluții. Și am făcut, am găsit acest post. Ceea ce practic îmi spune să adaug câțiva parametri de boot. Și rezolvă problema, nu am mai avut erori de hardware înregistrate sau înghețari aleatorii de atunci. Aceștia sunt parametrii de pornire:

noapic pci=assign-buses apicmaintimer idle=repornire sondaj=rece, greu

Dar problema este că acum laptopul meu este inactiv la o temperatură mult mai mare atunci când folosesc acești parametri de pornire. În jur de 70 de grade Celsius, în loc de 35-40. Acum, evident că am verificat System Monitor pentru a vedea dacă există ceva care ocupă utilizarea CPU, dar nu există nimic. Folosește între 0 și 3% din utilizarea procesorului pe toate cele 4 fire, nimic ieșit din comun.

Și știu că parametrii de pornire cauzează această problemă, pentru că am încercat să-i îndepărtez și, după repornire, ventilatoarele nu se învârt la fel de tare și funcționează la o temperatură normală. Dar erorile hardware au revenit, la fel și înghețarile aleatorii.

Sunt destul de începător la chestii Linux, așa că literalmente nu am idee ce fac acești parametri de boot. Poate cineva cu experiență să-mi spună ce face și de ce îmi determină CPU-ul să funcționeze atât de mult?

EDIT #1

Așa că, datorită ajutorului lui Matigo și Doug, mi s-a spus că inactiv = sondaj parametrul este dezactivarea sistemului inactiv pentru procesor, ceea ce, evident, face ca procesorul să funcționeze mai cald și creează mai multă căldură reziduală.

Când eliminați acel parametru de pornire, erorile hardware revin.

Deci, blocările mele și erorile hardware par să aibă ceva de-a face cu modul în care CPU comută între stările inactiv.

CPU-ul meu este un Intel Core i7-7500U

Aceasta este rezultatul rulării grep . /sys/devices/system/cpu/cpu0/cpuidle/state*/name:

/sys/devices/system/cpu/cpu0/cpuidle/state0/name:POLL
/sys/devices/system/cpu/cpu0/cpuidle/state1/name:C1
/sys/devices/system/cpu/cpu0/cpuidle/state2/name:C1E
/sys/devices/system/cpu/cpu0/cpuidle/state3/name:C3
/sys/devices/system/cpu/cpu0/cpuidle/state4/name:C6
/sys/devices/system/cpu/cpu0/cpuidle/state5/name:C7s
/sys/devices/system/cpu/cpu0/cpuidle/state6/name:C8
/sys/devices/system/cpu/cpu0/cpuidle/state7/name:C9
/sys/devices/system/cpu/cpu0/cpuidle/state8/name:C10

Deci, practic, ceea ce am nevoie de ajutor este acesta, pentru a scăpa de aceste erori hardware și blocări fără a dezactiva complet sistemul inactiv CPU, dacă este posibil.

drapel in
Ce versiune de Ubuntu folosești? Am avut o problemă similară pe un Lenovo W541 cu 16.04 și 18.04. Trecerea la 20.04 a scăzut temperaturile inactiv cu 30 de grade și a îmbunătățit, de asemenea, termicele SSD.
B.Tibell avatar
drapel pl
@matigo Folosesc Zorin OS 16 bazat pe Ubuntu 20.04.3 și am un HP 17x115dx.Am încercat mai multe distribuții bazate pe Ubuntu, dar am avut această problemă de înghețare cu toate, inclusiv Ubuntu, Lubuntu, Zorin OS, Linux Mint și Pop OS.
drapel in
Zorin este foarte în afara subiectului aici, dar acele opțiuni de pornire distrug efectiv capacitatea sistemului dvs. de a gestiona consumul de energie inactiv. Poate doriți să [citiți asta](https://www.kernel.org/doc/html/v5.0/admin-guide/pm/cpuidle.html) și să decideți dacă parametrii de pornire merită...
B.Tibell avatar
drapel pl
Bine.. Mulțumesc, aveți idee ce ar putea cauza erorile hardware și de ce acești parametri de boot ajută la oprirea lor?
Doug Smythies avatar
drapel gn
Vă rugăm să vă editați întrebarea și să adăugați numele statelor dvs. inactive. Fă `grep. /sys/devices/system/cpu/cpu0/cpuidle/state*/name`. De asemenea, adăugați marca și modelul procesorului.
Puncte:0
drapel gn

Parametrul de boot inactiv = sondaj practic dezactivează sistemul inactiv, redând inactiv ca cicluri de rotație fără operațiuni. Deci, da, te-ai aștepta la mult mai multă căldură reziduală, deoarece procesoarele nu intră niciodată în stare de adormire.

Iată un exemplu de pe serverul meu de testare, folosind turbostat:

doug@s19:~$ sudo turbostat --Summary --quiet --show Busy%,Bzy_MHz,IRQ,PkgWatt,PkgTmp,RAMWatt,GFXWatt,CorWatt --interval 15
Ocupat % Bzy_MHz IRQ PkgTmp PkgWatt CorWatt GFXWatt RAMWatt
0,01 938 558 36 1,34 0,68 0,00 0,89
0,02 800 455 36 1,33 0,67 0,00 0,89 <<< Toate stările inactiv sunt activate
60,14 4799 109298 47 29,48 28,82 0,00 0,89 <<< eșantion de tranziție
99,76 4800 180297 47 47,24 46,59 0,00 0,89 <<< Toate stările inactiv sunt dezactivate, cu excepția sondajului.
99,76 4800 180311 49 47,65 46,99 0,00 0,89
99,76 4800 180305 49 47,82 47,17 0,00 0,89

Notă: driverul de scalare a frecvenței CPU intel_pstate „vede” procesoarele ca fiind ocupate, dar top nu:

sus - 19:23:43 până la 7:14, 3 utilizatori, medie de încărcare: 0.00, 0.00, 0.00
Sarcini: 214 total, 1 alergare, 213 dormit, 0 oprit, 0 zombi
%Cpu0: 0.0 us, 0.0 sy, 0.0 ni, 100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
%Cpu1: 0.0 us, 0.0 sy, 0.0 ni, 100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
%Cpu2: 0.0 us, 0.0 sy, 0.0 ni, 100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
%Cpu3: 0.0 us, 0.0 sy, 0.0 ni, 100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
%Cpu4: 0.0 us, 0.0 sy, 0.0 ni, 100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
%Cpu5: 0.0 us, 0.0 sy, 0.0 ni, 100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
%Cpu6: 0.0 us, 0.0 sy, 0.0 ni, 100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
%Cpu7: 0.0 us, 0.0 sy, 0.0 ni, 100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
%Cpu8: 0.0 us, 0.0 sy, 0.0 ni, 100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
%Cpu9: 0.0 us, 0.0 sy, 0.0 ni, 100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
%Cpu10: 0.0 us, 0.0 sy, 0.0 ni, 100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
%Cpu11: 0.0 us, 0.0 sy, 0.0 ni, 100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
MiB Mem: 31936.7 total, 31137.0 gratuit, 312.3 folosit, 487.5 buff/cache
MiB Swap: 2048.0 total, 2048.0 gratuit, 0.0 folosit. 31227.9 disponibil Mem
B.Tibell avatar
drapel pl
După eliminarea parametrului `idle=poll`, erorile hardware revin și probabil că se blochează aleatoriu. Ce înseamnă exact aceste erori hardware? Și există vreo altă modalitate prin care pot scăpa de ele, fără a dezactiva sistemul inactiv?
Doug Smythies avatar
drapel gn
Câte stări inactiv aveți? Fă `grep. /sys/devices/system/cpu/cpu0/cpuidle/state*/disable`. Apoi începeți să le dezactivați pe rând pentru a vedea dacă MCE-urile dispar. Do (să spunem că cel mai profund a fost 7) ​​`echo 1 | sudo tee /sys/devices/system/cpu/cpu*/cpuidle/state7/disable`. Semnificația exactă a MCE poate fi dificil de determinat. Ce marca si model de procesor?
B.Tibell avatar
drapel pl
Am 8 stări inactiv. Procesorul este un Intel Core i7-7500U.
Doug Smythies avatar
drapel gn
Aș încerca: Dezactivează starea inactivă 2; Dacă acest lucru nu ajută, atunci dezactivați parametrul de pornire HWP (intel_pstate=no_hwp).
B.Tibell avatar
drapel pl
Am încercat pe amândouă, iar erorile încă apar. Am observat că erorile tind să apară DUPĂ ce opresc o sarcină intensivă de CPU. Și asta se aliniază, de asemenea, cu momentul în care s-a întâmplat înghețarea mea, de exemplu imediat după părăsirea unui joc sau a unei alte sarcini care necesită mult resurse.
B.Tibell avatar
drapel pl
Așa că am testat dacă dezactivarea stării de inactivitate sau adăugarea parametrului de pornire (după repornire desigur) a ajutat rulând `stress --cpu 4` timp de câteva minute și apoi încheindu-l, dar după verificarea fișierului jurnal apare eroarea hardware mce imediat după ce termin testul de stres.
Doug Smythies avatar
drapel gn
Experimentați cu dezactivarea stărilor inactiv. De exemplu, toți de la un anumit nivel și mai profund.

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.