贡献者: addis
sbatch
命令用于提交任务
--mem-per-cpu=512M
指定内存
--time=hours:minutes:seconds
指定时间
--cpus-per-task=1
--ntasks=1
--nodes=1
机器的数量
#!/bin/sh
srun hello.x < ./param.inp
pwd
的,stdout 会自动生成 slurm-任务编号.out
scancel 任务编号
可以取消某个任务
sbatch --time=24:0:0 --mem-per-cpu=300M --cpus-per-task=10 --ntasks=1 --nodes=1 ./job.sh
scancel JOB_ID
,要取消个人的所有任务,用 scancel -u 用户名
srun -J srun -N 1 -n 32 -t 24:00:00 --mem=120G --partition=ksu-gen-gpu.q --gres=gpu:1 --pty bash
--exclusive
独占整个节点
--exclude=节点名,节点名
不在指定节点上运行
module load
才能加载中 cuda 的 nvcc 和 nvprof。详见 Environment Modules 笔记。
kstat
会列出所有人的所有任务
kstat --me
可以查看我正在运行的所有任务以及所在节点的其他任务。或者用 kstat | grep 用户名
也可以
kstat | grep 用户名
也可以查看某个其他用户的所有任务
kstat -c
可以看到所有用户的 cpu 使用情况
kstat -h
只看节点信息不看任务,最后一列是所有者