Linux
Sun Grid Engine:自動終止空閒的互動式作業
我們正在考慮在小型計算集群上使用Sun Grid Engine 。目前,目前的設置非常粗糙,只涉及讓人們通過 ssh 連接到一台開放的機器來執行他們的工作。
我們希望允許互動式作業,因為這應該可以簡化從手動啟動作業到使用
qsub
. 但是,有人擔心,如果我們這樣做,人們可能會不小心讓他們的互動式會話閒置並阻止其他作業在機器上執行。這個問題不僅僅是理論上的問題,因為我們之前嘗試過使用 OpenPBS,並且人們在螢幕會話中打開互動式工作並基本上在機器上露營時存在問題。無論如何配置 SGE 以自動終止空閒的互動式作業?看起來這是在 2007 年作為增強功能(問題 #:2447)提出的。但是,該請求似乎從未得到實施。
您可以將 SGE 設置為具有合理的預設 walltimes (h_rt) 以在預定義的限制後終止會話。
您是否嘗試過讓使用者的外殼在空閒時超時?更多資訊和範例,請訪問 http://www.cyberciti.biz/faq/linux-unix-login-bash-shell-force-time-outs/。
nayrmil 有一些很好的建議。另一種選擇是限制哪些機器可以執行互動式作業。我們基本上將一些節點指定為“互動式”,並在它們上放置一個超額訂閱節點資源的隊列,以便許多使用者可以同時登錄。使用者基本上可以隨心所欲地在那裡露營,但如果他們想獲得一些真實資源,他們需要送出一份合適的工作。