Heartbeat

可以心跳通知停止的服務並重新啟動它

  • March 11, 2013

我有兩個節點,完整的 IP 故障轉移非常適合它們 - 當節點 1 關閉時,節點 2 獲取 IP 並啟動服務。

我想知道的是:

如果伺服器 1 沒有完全崩潰,只是其中一個服務意外停止,是否可以配置心跳來監視它並啟動它?

編輯:起搏器可以嗎?

來自http://clusterlabs.org/wiki/FAQ#Organizational的引用

當您的應用程序或它們正在執行的機器出現故障時,Pacemaker 可讓您的應用程序繼續執行

如果伺服器 1 沒有完全崩潰,只是其中一個服務意外停止,是否可以配置心跳來監視它並啟動它?

當然,heartbeat 版本 2可以做到。

使用版本 1,您的/etc/ha.d/haresources外觀如下:

master              129.79.136.4 apache

然後您可以通過執行生成心跳 2 配置文件:

python /usr/lib64/heartbeat/haresources2cib.py > /var/lib/heartbeat/crm/cib.xml

/var/lib/heartbeat/crm/cib.xml

...
   <resources>
       <group id="group_1">
           <primitive class="ocf" id="IPaddr_129_79_136_4" provider="heartbeat" type="IPaddr">
               <operations>
                   <op id="IPaddr_129_79_136_4_mon" interval="5s" name="monitor" timeout="5s"/>
               </operations>
               <instance_attributes id="IPaddr_129_79_136_4_inst_attr">
                   <attributes>
                       <nvpair id="IPaddr_129_79_136_4_attr_0" name="ip" value="129.79.136.4"/>
                   </attributes>
               </instance_attributes>
           </primitive>
           <primitive class="ocf" id="apache_2" provider="heartbeat" type="apache">
               <operations>
                   <op id="apache_2_mon" interval="120s" name="monitor" timeout="60s"/>
               </operations>
           </primitive>
       </group>
   </resources>
...

但我建議你應該使用corosyncand Pacemaker

引用自:https://serverfault.com/questions/486714