Cluster
PBS/Torque 中的非排他性作業調度
集群資源管理器 Torque 通常以獨占方式分配計算節點。但是,當您有很多小型作業(像我們一樣)在多核計算節點上執行時,這可能會導致大量資源浪費。有什麼方法可以配置 Torque 以允許在計算節點上非獨占分配核心?
(這些作業都是並行的,所以我們不擔心共享網路資源的爭用。我們不能切換調度程序,因為我們客戶的作業腳本都在 PBS/Torque 中。)
好的,這實際上是毛伊島的一個問題。我在這裡給出一個答案,這樣其他人就不必浪費一天了。:)
首先:讓你的 Torque
nodes
文件列出帶有 np 參數的節點,即nodename np=8
. 這將確保資源管理器知道正確的處理器數量。其次,對於 Maui:確保您的 maui.cfg 文件包含
NODEACCESSPOLICY SHARED
. 然後非排他性調度應該起作用。