为什么在使用sbatch SLURM时,我一直在获取NonZeroExitCode?

我有一个简单的test.ksh,我正在使用命令运行:

sbatch test.ksh

我不断收到“JobState = FAILED Reason = NonZeroExitCode”(使用“scontrol show job”)

我已经确定了以下内容:

  1. slurmd和slurmctld启动并正常运行
  2. “test.ksh”上的用户权限是777。
  3. 命令“srun test.ksh”(本身,没有使用sbatch) 成功没有问题
  4. 我试着在“test.ksh”的最后一行input“return 0”,但没有运气
  5. 我尝试在“test.ksh”的最后一行中input“exit 0”,但没有运气
  6. 我尝试在“test.ksh”的最后一行放入“主机名”,但没有运气
  7. 我尝试在“test.ksh”的最后一行放入“srun hostname”,但没有运气

我发现,我没有设置 – 错误和 – 输出,这意味着默认的是当前目录我发出的命令。

问题是我没有足够的权限写入当前目录。

解决的办法是把–error和–output设置到我有权限的地方。