集群管理系统
目录
前言
简单对比常见的集群管理系统。
管理系统
管理系统 | 队列信息 | 资源信息 | 提交作业 | 查看作业 | 取消作业 |
---|---|---|---|---|---|
Slurm | yhi/sinfo | sbatch | squeue | scancel | |
PBS(PBS Pro, Torque) | qstat -q | pestat | qsub | qstat | qdel |
LSF | bqueues | bhosts | bsub | bjobs | bkill |
SGE | qconf -sql | qhost | qsub | qstat | qdel |
小结
-
从可以单节点分配核数和查看作业方便性角度,
SGE
(2016年之后不更新了) >PBS
(Torque
显示作业信息不友好,PBS Pro
相对好些) >Slurm
(核数控制麻烦,&&任务不友好)。 -
LSF
偶尔用过,印象不深,不做比较。 -
建议安装
SGE
或PBS Pro
。