Configurerò e imposterò il workload manager slurm sul tuo cluster linux
Informazioni su questo servizio
Slurm è lo standard del settore come workload manager per i cluster HPC. Configurarlo correttamente fin dall'inizio evita mesi di fallimenti dei job, contenziosi sulle risorse e confusione nelle code.
Ho configurato Slurm su cluster che vanno da 4 nodi in laboratori di ricerca a sistemi di supercalcolo nazionali con 600 nodi nell'ambito del programma NSM dell'India.
Ciò che consegno:
configurazione di slurm.conf per il tuo hardware e workload, partizioni, QOS e impostazioni di priorità
applicazione delle cgroup per isolamento di memoria e CPU
impostazione del database di contabilità (slurmdbd)
test di invio e verifica dei job
documentazione di ogni decisione di configurazione
Compatibile con: Rocky Linux, AlmaLinux, CentOS, Ubuntu
Compatibile con: OpenHPC, Warewulf, xCAT, bare metal
Prima di ordinare: condividi il numero di nodi, il sistema operativo e i workload che prevedi di eseguire. Confermerò il pacchetto giusto entro 2 ore.
Server:
Altro
Sistema operativo:
Linux

