Gridengine

添加 virtual_free 後 Sun Grid Engine (SGE) 作業不可見

  • November 16, 2011

我正在嘗試使用 virtual_free 來限制執行集群中每個網格節點的大型記憶體作業的數量。這似乎按預期工作。

在我修改程式碼以使用記憶體實例送出作業後, qstat -f -q $queueName 不再顯示等待插槽的作業列表。

作業使用特定隊列 (-q $queueName) 送出。

我猜這是由於 SGE 隊列選擇的魔力而發生的。有沒有辦法讓我的工作像以前一樣顯示出來?

謝謝!

更新

我正在使用:

qstat -f -u * -q $queueName

查看隊列。如果我放棄隊列參數,我可以看到作業。如果我檢查一個特定的作業,我可以看到它設置了正確的 hard_queue_list 值。

我也在使用 Sun Grid Engine 6.1u4

作業正在請求隊列。它們實際上並不隊列中,直到它們開始在具有該隊列實例的主機上執行。只有當它們真正開始在請求的隊列中執行時,您才會在特定於隊列的輸出中看到它們。如果您考慮可以在隊列請求中使用萬用字元這一事實,這將非常有意義。

如果他們沒有出現,qstat那麼他們就沒有送出或者已經崩潰了,SGE 的隊列選擇魔法在他們送出後開始發揮作用。還要檢查 qstat 是否報告了送出該作業的使用者!

如果您有未滿足限制的工作,那麼 SGE 將簡單地排隊,直到它們可用。

引用自:https://serverfault.com/questions/331175