Hadoop

Hadoop:列入黑名單的任務跟踪器

  • July 8, 2011

我在 6 台機器上執行 Hadoop 作業(使用 Hadoop 0.20.2);一台機器是名稱節點/輔助節點/作業跟踪器(主),其他 5 台機器都是數據節點/任務跟踪器(從屬)。這項工作有超過 14,000 張地圖,並且已完成 10% 以上。當我瀏覽作業跟踪器作業詳細資訊頁面時,我看到:

Status: Running
Started at: Tue Jul 05 18:12:44 PDT 2011
Running for: 66hrs, 5mins, 4sec
Job Cleanup: Pending
Black-listed TaskTrackers: 1

我登錄到有問題的機器,我可以看到任務跟踪器程序正在執行,但機器沒有做任何工作(top 命令顯示 CPU 使用率小於 10%)。我已經使用這些命令重新啟動了任務跟踪器節點

./hadoop-daemon.sh  stop tasktracker
./hadoop-daemon.sh  start tasktracker

但是該節點仍在黑名單中,並且任務跟踪器正在執行,但機器仍然沒有執行任何工作。

問題:有什麼方法可以告訴 Hadoop 將其“取消”黑名單並將任務發送到節點?希望不必重新開始工作?

PS。確認該節點在作業開始時正在執行並執行任務。

將以下配置放入 conf/hdfs-site.xml:

<property>
 <name>dfs.hosts</name>
 <value>/full/path/to/whitelisted/node/file</value>
</property>

使用以下命令要求 Hadoop 根據配置刷新節點狀態。

./bin/hadoop dfsadmin -refreshNodes

引用自:https://serverfault.com/questions/288440