JMX 報告錯誤的測量值並為 Apache Kafka 收集

February 1, 2017

我正在使用 JMX 從 Apache Kafka 收集指標並通過 collectd 發送到視覺化和監控服務 Librato。問題是某些指標似乎報告錯誤。例如，在沒有任何人使用 Kafka 集群的情況下，一些節點報告每分鐘有大量傳入消息（如 15,000 條），而其他節點報告為 0，正如預期的那樣。
這是 collectd 中的一項指標配置：
&lt;MBean "kafka-all-messages"&gt;
 ObjectName "kafka.server:type=BrokerTopicMetrics,name=MessagesInPerSec"
 InstancePrefix "all"
 &lt;Value&gt;
   InstancePrefix "kafka-messages-in"
   Type "counter"
   Table false
   Attribute "MeanRate"
 &lt;/Value&gt;
&lt;/MBean&gt;
這是 Librato 中的圖表：
有誰知道出了什麼問題？是我收集的配置，例如Type或類似的東西嗎？

只是對這個問題的一個小跟進：它既不是 JMX 也不是 collectd 錯誤。我通過直接登錄到每個 Kafka 代理並讀取其 MBean 中的值來驗證 JMX、collectd 和 Librato 具有一致的值。
問題是我們使用的 Kafka 客戶端的自動送出間隔太小，這會產生大量消息發送到每個 Kafka 代理。

引用自：https://serverfault.com/questions/828336

JMX 報告錯誤的測量值並為 Apache Kafka 收集

相關問答

collectd 中的 MBean 參數是什麼意思？

在文本文件中收集 WebSphere 執行緒池使用率數據

JMX實時監控應用

可以為 collectd 收集的指標賦予新的前綴嗎？

收集的“介面”外掛報告累積值而不是速率

開發新的伺服器系統 - JMX 與 SNMP