Hpc
扭矩和毛伊節點狀態
我是扭矩和毛伊島的新手。
我正在檢查節點狀態以查找哪些節點是空閒的以及哪些節點正在使用中。
對於扭矩,一個命令是
pbsnodes
。它提供了與節點相關的狀態和其他資訊。當我檢查 maui 時,我找到
diagnose -n
了還顯示節點狀態的命令。我想知道這兩種狀態之間。兩者都為相同的情況賦予不同的狀態。
當我這樣做時,
man pbsnodes
我得到了節點的可能狀態"free", "offline", "down", "reserve", "job-exclusive", "job-sharing", "busy", "time-shared", or "state-unknown"
但是我找不到這種不同的狀態diagnose -n
。如何獲取節點的狀態
pbsnodes
。diagnose -n
有沒有像 xCAT 這樣用於扭矩或毛伊島的數據庫?提前感謝您的寶貴時間。
雖然 Torque 和 Maui 是相關的,但它們確實維護了有關它們管理的計算節點的單獨資訊。
Torque 是集群的資源管理器:它跟踪計算節點列表、每個節點的硬體等。Torque 內置了自己的簡單作業調度程序,但通常會關閉它以支持另一個調度程序。然後 Maui 位於 Torque 的“頂部”並在其節點上安排作業。它支持比內置 Torque 調度器更靈活的調度,並且必須跟踪與 Torque 不同的資訊——因此它報告的狀態可能不同。
我不太了解 xCAT,但兩者都沒有你真正所謂的數據庫。Torque 在文本文件中有一個節點列表
server_priv/nodes
,而 Maui 只使用 Torque 提供的任何節點。