Am un set de mașini identice în hardware și aproape identice în configurarea softare. Dar unul dintre ei se umple /var/log/messages
cu:
16 iunie 09:41:37 h0stname kernel: pciehp 10000:00:00.0:pcie04: Timeout on hotplug command 0x13f8 (emis acum 10082 msec)
16 iunie 09:41:37 h0stname kernel: pciehp 10000:00:01.0:pcie04: Timeout on hotplug command 0x13f8 (emis acum 10082 msec)
16 iunie 09:41:47 h0stname kernel: pciehp 10000:00:00.0:pcie04: Timeout on hotplug command 0x13f8 (emis acum 10080 msec)
16 iunie 09:41:47 h0stname kernel: pciehp 10000:00:01.0:pcie04: Timeout on hotplug command 0x13f8 (emis acum 10080 msec)
16 iunie 09:41:57 h0stname kernel: pciehp 10000:00:00.0:pcie04: Timeout on hotplug command 0x13f8 (emis acum 10076 msec)
16 iunie 09:41:57 h0stname kernel: pciehp 10000:00:01.0:pcie04: Timeout on hotplug command 0x13f8 (emis acum 10076 msec)
16 iunie 09:42:07 h0stname kernel: pciehp 10000:00:00.0:pcie04: Timeout on hotplug command 0x13f8 (emis acum 10082 msec)
16 iunie 09:42:07 h0stname kernel: pciehp 10000:00:01.0:pcie04: Timeout on hotplug command 0x13f8 (emis acum 10082 msec)
16 iunie 09:42:17 h0stname kernel: pciehp 10000:00:00.0:pcie04: Timeout on hotplug command 0x13f8 (emis acum 10081 msec)
16 iunie 09:42:17 h0stname kernel: pciehp 10000:00:01.0:pcie04: Timeout on hotplug command 0x13f8 (emis acum 10081 msec)
16 iunie 09:42:28 h0stname kernel: pciehp 10000:00:00.0:pcie04: Timeout on hotplug command 0x13f8 (emis acum 10074 msec)
16 iunie 09:42:28 h0stname kernel: pciehp 10000:00:01.0:pcie04: Timeout on hotplug command 0x13f8 (emis acum 10074 msec)
16 iunie 09:42:38 h0stname kernel: pciehp 10000:00:00.0:pcie04: Timeout on hotplug command 0x13f8 (emis acum 10083 msec)
16 iunie 09:42:38 h0stname kernel: pciehp 10000:00:01.0:pcie04: Timeout on hotplug command 0x13f8 (emis acum 10083 msec)
16 iunie 09:42:48 h0stname kernel: pciehp 10000:00:00.0:pcie04: Timeout on hotplug command 0x13f8 (emis acum 10082 msec)
16 iunie 09:42:48 h0stname kernel: pciehp 10000:00:01.0:pcie04: Timeout on hotplug command 0x13f8 (emis acum 10082 msec)
16 iunie 09:42:58 h0stname kernel: pciehp 10000:00:00.0:pcie04: Timeout on hotplug command 0x13f8 (emis acum 10081 msec)
16 iunie 09:42:58 h0stname kernel: pciehp 10000:00:01.0:pcie04: Timeout on hotplug command 0x13f8 (emis acum 10081 msec)
16 iunie 09:43:08 h0stname kernel: pciehp 10000:00:00.0:pcie04: Timeout on hotplug command 0x13f8 (emis acum 10069 msec)
16 iunie 09:43:08 h0stname kernel: pciehp 10000:00:01.0:pcie04: Timeout on hotplug command 0x13f8 (emis acum 10069 msec)
16 iunie 09:43:18 h0stname kernel: pciehp 10000:00:00.0:pcie04: Timeout on hotplug command 0x13f8 (emis acum 10079 msec)
16 iunie 09:43:18 h0stname kernel: pciehp 10000:00:01.0:pcie04: Timeout on hotplug command 0x13f8 (emis acum 10079 msec)
Probabil că o piesă hardware nu este prea fericită.Cum pot proceda pentru a afla ce piesa hardware exacta cauzeaza reclamatiile? Totul pare să funcționeze ca, cu excepția unui disc defect cunoscut în RAID. În mod normal, aș începe să deconectez chestii pentru a le restrânge, dar am doar SSH disponibil momentan, iar tabelul hardware este imens.
Tot ce știu este că se referă la puntea PCI, așa cum lspci
enumeră adresa corespunzătoare:
10000:00:00.0 bridge PCI: Intel Corporation Sky Lake-E PCI Express Root Port A (rev 04)
10000:00:01.0 Punte PCI: Intel Corporation Sky Lake-E PCI Express Root Port B (rev 04)
Rulează Centos 7, kernel 3.10.0-693.21.1.el7.x86_64