Hadoop
Hadoop:列入黑名單的任務跟踪器
我在 6 台機器上執行 Hadoop 作業(使用 Hadoop 0.20.2);一台機器是名稱節點/輔助節點/作業跟踪器(主),其他 5 台機器都是數據節點/任務跟踪器(從屬)。這項工作有超過 14,000 張地圖,並且已完成 10% 以上。當我瀏覽作業跟踪器作業詳細資訊頁面時,我看到:
Status: Running Started at: Tue Jul 05 18:12:44 PDT 2011 Running for: 66hrs, 5mins, 4sec Job Cleanup: Pending Black-listed TaskTrackers: 1
我登錄到有問題的機器,我可以看到任務跟踪器程序正在執行,但機器沒有做任何工作(top 命令顯示 CPU 使用率小於 10%)。我已經使用這些命令重新啟動了任務跟踪器節點
./hadoop-daemon.sh stop tasktracker ./hadoop-daemon.sh start tasktracker
但是該節點仍在黑名單中,並且任務跟踪器正在執行,但機器仍然沒有執行任何工作。
問題:有什麼方法可以告訴 Hadoop 將其“取消”黑名單並將任務發送到節點?希望不必重新開始工作?
PS。確認該節點在作業開始時正在執行並執行任務。
將以下配置放入 conf/hdfs-site.xml:
<property> <name>dfs.hosts</name> <value>/full/path/to/whitelisted/node/file</value> </property>
使用以下命令要求 Hadoop 根據配置刷新節點狀態。
./bin/hadoop dfsadmin -refreshNodes