Configurerò un cluster HPC Linux con openhpc, slurm e infiniband
Informazioni su questo servizio
Configurare correttamente un cluster HPC fin dall'inizio permette di risparmiare mesi di debug e previene il debito di configurazione che causa l'80% dei problemi di performance del cluster in seguito.
Ho commissionato cluster HPC da 4 a 600 nodi nell'ambito della National Supercomputing Mission dell'India, dal bare metal all'accettazione HPL.
Stack completo con cui lavoro:
Provisioning: Warewulf 4, xCAT, PXE
Sistema operativo: Rocky Linux 8/9, AlmaLinux, CentOS Stream
Scheduler: Slurm con contabilità completa e cgroup
MPI: OpenMPI, IntelMPI, MVAPICH2
Fabric: InfiniBand HDR/NDR/EDR, Ethernet RDMA
Storage: Lustre, BeeGFS, GPFS, NFS
Monitoraggio: Grafana, Prometheus, Ganglia
Cosa ricevi:
Nodi di calcolo completamente provisionati
Fila Slurm funzionante con job di test verificati
Fabric InfiniBand validata con ibdiagnet
Test di MPI hello world e banda passante superati
Documentazione completa di configurazione
Chiamata di consegna per guidarti attraverso il sistema
Prima di ordinare: inviami un messaggio con il numero di nodi, le specifiche hardware e i workload che prevedi di eseguire. Confermerò fattibilità e tempistiche prima che tu paghi.
Server:
Altro
Sistema operativo:
Linux
