Elasticsearch

elasticsearch:如何查看日誌中的警告/斷路器被觸發

  • November 10, 2015

CentOS 上的 ES 1.7.x

我們的生產 ES 集群嚴重下降。我們失去了整個索引。事實證明,這已經在日誌中記錄了一天或更長時間:

New used memory from field ### would be larger than configured breaker

好的。

我可以點擊 ES 上的哪個 url 來查看問題是否正在發生?(日誌監控不是我們監控機制的一部分,但訪問 ES url 對我們來說很容易。)

我們現在使用集群健康 url,所以我們看到集群變成黃色/紅色,但是(到目前為止),我們還沒有看到如何從外部看到問題的到來(所以我們被打敗了)。

好的,找到答案了。

坦率地說,這是一個非常薄弱的​​答案,給我們帶來了真正的負擔。

如此處所述:

https://www.elastic.co/guide/en/elasticsearch/reference/1.4/cluster-nodes-stats.html

用這個:

curl -XGET 'http://localhost:9200/_nodes/stats?pretty=true'

然後你可以看到一個breakers|tripped 元素。

那隻是一個計數器,而不是一個速度。所以你必須:

  • 編寫自己的程式碼來讀取值
  • 等待N次
  • 再讀一遍
  • 做數學
  • 表面斷路器跳閘/分鐘
  • 找出適合您的問題門檻值
  • 對此進行監控

如果 ES 可以計算出速度,那就太好了,所以我們可以只關注最後兩點。

但這是那裡最好的,就我目前所見。

引用自:https://serverfault.com/questions/735086