目录

集群管理系统

misaraty 更新 | 2023-02-03
前言
简单对比常见的集群管理系统。

管理系统

管理系统 队列信息 资源信息 提交作业 查看作业 取消作业
Slurm yhi/sinfo sbatch squeue scancel
PBS(PBS Pro, Torque) qstat -q pestat qsub qstat qdel
LSF bqueues bhosts bsub bjobs bkill
SGE qconf -sql qhost qsub qstat qdel

后续

2018年5月起:Altair将开源许可的PBS pro命名为openPBS1

注意

OpenPBS v23.06.06只有以下4个预编译版:

  • OpenSuse Leap 15.4
  • RockyLinux 8.8
  • Ubuntu 18.04
  • Ubuntu 20.04

Torque自2018年6月起:转为非自由软(none-free software)。2

小结

  • 从可以单节点分配核数和查看作业方便性角度,SGE(2016年之后不更新了) > PBSTorque显示作业信息不友好,PBS Pro相对好些) > Slurm(核数控制麻烦,&&任务不友好)。

  • LSF偶尔用过,印象不深,不做比较。

  • 建议安装SGEPBS ProOpenPBS

1


  1. 服务器集群任务调度系统大比拼 ↩︎

  2. PBS系列变迁 ↩︎