<html>

  <head>

    <meta content="text/html; charset=ISO-8859-1"

      http-equiv="Content-Type">

  </head>

  <body bgcolor="#FFFFFF" text="#000000">

    <div class="moz-cite-prefix">Perdonad mi ausencia, he estado muy

      liado. Me ped&iacute; el d&iacute;a libre en el trabajo debido a que ten&iacute;a que

      hacer unas gestiones y no he podido seguir lo que ha pasado como

      es debido.<br>

      <br>

      El 16/11/12 17:14, JoseMaria escribi&oacute;:<br>

    </div>

    <blockquote cite="mid:1353082466.9742.13.camel@papageno" type="cite">

      <pre wrap="">Bien. Vaya con el watchdog. 

Estas herramientas de monitorizaci&oacute;n del sistema nos van a ser muy

&uacute;tiles. Con ellas tendremos un servidor mucho m&aacute;s s&oacute;lido cuando

superemos el transitorio inestable hasta que te hagas con ellas.</pre>

    </blockquote>

    <br>

    <br>

    De nuevo siento los problemas que os ha creado, ya sab&eacute;is que pod&eacute;is

    consultar conmigo para lo que haga falta. Hubiera sido buena idea

    discutir previamente qu&eacute; es lo que se recomienda monitorizar y qu&eacute;

    no.<br>

    <br>

    Precisamente monitorizar los servicios ssh y apache2 no es una buena

    idea.<br>

    <br>

    <br>

    <blockquote cite="mid:1353082466.9742.13.camel@papageno" type="cite">

      <pre wrap="">On Thu, 2012-11-15 at 17:49 +0100, Borja Men&eacute;ndez Moreno wrote:

</pre>

      <blockquote type="cite">

        <pre wrap="">A ver, que leo esto que he escrito y ni casi yo lo entiendo...

Watchdog te da la posibilidad de vigilar procesos a trav&eacute;s de su

fichero de pid, los que se sit&uacute;an en /var/run y acaban en .pid; en

teor&iacute;a puedes poner tantos procesos a vigilar como te d&eacute; la gana, pero

en este caso no s&eacute; por qu&eacute; no encuentra los procesos de apache y ssh,

cuando est&aacute;n bien puestos. Al no encontrar los .pid de esos procesos

reinicia la m&aacute;quina, supongo que como medida de seguridad, y al

iniciarse de nuevo vuelve a ejecutar la configuraci&oacute;n de su fichero de

configuraci&oacute;n, volviendo a intentar leer esos .pid, no encontrarlos y

volviendo a reiniciar... Y as&iacute; hasta el infinito.

</pre>

      </blockquote>

    </blockquote>

    <br>

    <br>

    A ver, antes de poner en producci&oacute;n cualquier modificaci&oacute;n en

    watchdog es buena idea hacer unas pruebas.<br>

    <br>

    Para ello existe la opci&oacute;n "-q" o "-no-action", que permite probar

    una configuraci&oacute;n antes de que te empiece a reiniciar el servidor si

    no lo has hecho bien.<br>

    <br>

    Esa opci&oacute;n se activa a&ntilde;adiendo en /etc/default/watchdog la siguiente

    l&iacute;nea (reiniciando posteriormente watchdog y mirando en syslog que

    ha sido activada la misma):<br>

    <meta http-equiv="content-type" content="text/html;

      charset=ISO-8859-1">

    <br>

    watchdog_options="-q"<br>

    <br>

    Cuando se compruebe que todo va bien mirando que en los logs no

    aparecen advertencias o se&ntilde;ales de que watchdog hubiera decidido

    reiniciar la m&aacute;quina por error entonces se comenta esa l&iacute;nea y se

    reinicia watchdog.<br>

    <br>

    Que un servidor caiga (como el servidor ssh o el servidor web) no

    deber&iacute;a ser motivo de reinicio de la m&aacute;quina. Si se hace un apt-get

    upgrade, durante la configuraci&oacute;n de los paquetes, en el que el

    servicio es detenido, el servidor se reiniciar&iacute;a dejando en un

    estado lamentable el sistema (posiblemente se podr&iacute;a arreglar de

    manera sencilla, pero ya ser&iacute;a un quebradero de cabeza m&aacute;s).<br>

    <br>

    No recomiendo, repito: NO RECOMIENDO, monitorizar con watchdog un

    archivo pid. Es una buena idea monitorizar la carga del sistema en

    los &uacute;ltimos 10 o 15 minutos, pero no los &uacute;ltimos 5 minutos si us&aacute;is

    un sistema de backup nocturno que dure m&aacute;s de ese tiempo, se

    reiniciar&iacute;a la m&aacute;quina a medias de cada backup si &eacute;ste carga el

    sistema.<br>

    <br>

    Levantar un servicio como es apache, ssh, etc deber&iacute;a estar

    monitorizado por un operador, que reciba la alerta de un sistema de

    monitorizaci&oacute;n, como zabbix, y decida si debe arrancar el servicio

    porque ha ca&iacute;do accidentalmente o si debe dejarlo apagado porque

    sabe que se est&aacute; realizando una operativa en dicha m&aacute;quina.<br>

    <br>

    Un saludo.<br>

  </body>

</html>