Elasticsearch
elasticsearch:如何查看日誌中的警告/斷路器被觸發
CentOS 上的 ES 1.7.x
我們的生產 ES 集群嚴重下降。我們失去了整個索引。事實證明,這已經在日誌中記錄了一天或更長時間:
New used memory from field ### would be larger than configured breaker
好的。
我可以點擊 ES 上的哪個 url 來查看問題是否正在發生?(日誌監控不是我們監控機制的一部分,但訪問 ES url 對我們來說很容易。)
我們現在使用集群健康 url,所以我們看到集群變成黃色/紅色,但是(到目前為止),我們還沒有看到如何從外部看到問題的到來(所以我們被打敗了)。
好的,找到答案了。
坦率地說,這是一個非常薄弱的答案,給我們帶來了真正的負擔。
如此處所述:
https://www.elastic.co/guide/en/elasticsearch/reference/1.4/cluster-nodes-stats.html
用這個:
curl -XGET 'http://localhost:9200/_nodes/stats?pretty=true'
然後你可以看到一個breakers|tripped 元素。
那隻是一個計數器,而不是一個速度。所以你必須:
- 編寫自己的程式碼來讀取值
- 等待N次
- 再讀一遍
- 做數學
- 表面斷路器跳閘/分鐘
- 找出適合您的問題門檻值
- 對此進行監控
如果 ES 可以計算出速度,那就太好了,所以我們可以只關注最後兩點。
但這是那裡最好的,就我目前所見。