Aș dori să instalez SLURM pe Clear Linux datorită benchmark-urilor sale bune. Am urmat tutorialul la https://docs.01.org/clearlinux/latest/tutorials/hpc.html. Când am ajuns la pasul secțiunii "Creați fișierul de configurare slurm.conf" Am observat că serviciul slurmctld nu a pornit. Eroarea a fost legată de fișierul slurm.conf. Acesta era în jurnal:
11 iul 19:20:00 slurm-controller slurmctld[615]: eroare: Ignorarea opțiunii învechite FastSchedule=1. Vă rugăm să eliminați din configurația dvs.
11 iul 19:20:00 slurm-controller slurmctld[615]: fatal: SallocDefaultCommand a fost eliminat. Vă rugăm să luați în considerare setarea LaunchParameters=use_interactive_step.
am sters FastSchedule
și SallocDefaultCommand
linii din fișierul de configurare. După aceea am adăugat aceste rânduri:
LaunchParameters=use_interactive_step
InteractiveStepOptions="srun -n1 -N1 --pty --preserve-env --mpi=pmix_v3 $SHELL"
După ce am corectat că nu am putut continua deoarece există un simbol nedefinit într-un obiect partajat.
Acesta este jurnalul:
[2021-07-11T19:35:14.260] slurmctld versiunea 20.11.8 a început pe cluster linux
[2021-07-11T19:35:14.261] cred/munge: init: S-a încărcat pluginul pentru semnătura de autentificare Munge
[2021-07-11T19:35:14.262] depanare: auth/munge: init: pluginul de autentificare Munge încărcat
[2021-07-11T19:35:14.262] select/cons_res: common_init: select/cons_res încărcat
[2021-07-11T19:35:14.263] select/linear: init: pluginul de selecție a nodului liniar încărcat cu argumentul 1
[2021-07-11T19:35:14.263] select/cons_tres: common_init: select/cons_tres loaded
[2021-07-11T19:35:14.263] preempt/none: init: preempt/none încărcat
[2021-07-11T19:35:14.264] depanare: acct_gather_energy/none: init: AcctGatherEnergy NIMIC plugin încărcat
[2021-07-11T19:35:14.264] depanare: acct_gather_Profile/none: init: AcctGatherProfile NONE plugin încărcat
[2021-07-11T19:35:14.264] depanare: acct_gather_interconnect/none: init: AcctGatherInterconnect NICIU plugin încărcat
[2021-07-11T19:35:14.264] depanare: acct_gather_filesystem/none: init: AcctGatherFilesystem NICE plugin încărcat
[2021-07-11T19:35:14.265] debug2: Nu există fișier acct_gather.conf (/etc/slurm/acct_gather.conf)
[2021-07-11T19:35:14.265] depanare: jobacct_gather/none: init: S-a încărcat pluginul NOT_INVOKED de adunare contabilă job
[2021-07-11T19:35:14.265] eroare: plugin_load_from_file: dlopen(/usr/lib64/slurm/prep_script.so): /usr/lib64/slurm/prep_script.so: simbol nedefinit: run_script
[2021-07-11T19:35:14.265] eroare: Nu s-a putut încărca numele pluginului specificat pentru pregătire/script: Deschiderea fișierului plugin eșuat
[2021-07-11T19:35:14.266] eroare: prep_plugin_init: nu se poate crea context de pregătire pentru pregătire/script
[2021-07-11T19:35:14.266] fatal: nu s-a putut inițializa pluginul de pregătire
Deoarece fișierul slurm.conf al pachetului (pachet) Clear Linux este învechit, m-am gândit că poate, folosind un fișier de configurare mai bun, eroarea va dispărea. Ipoteza mea a fost că poate aveam nevoie să încărc un alt plugin care are simbolul run_script. Apoi, am încercat să creez un fișier de configurare mai bun folosind https://slurm.schedmd.com/configurator.easy.html. Dar am primit aceeași eroare.
Crezi că este fie un bug al SLURM, ceva lipsă din configurație, fie o eroare la compilarea pachetului (pachet) pe care l-am instalat? Am observat că în alte distribuții Linux există probleme similare cu pachetele precompilate ale SLURM. Cu toate acestea, se întâmplă cu alte obiecte comune și alte simboluri.
Dacă problema este Clear Linux, care este cel mai bun Linux pentru SLURM?
Aș aprecia orice ajutor mi-ați putea oferi. Multumesc mult anticipat.
Toate cele bune,
Braulio J. Solano-Rojas