Munin
Parliamo ancora di Munin
MUNIN
Come si adopera munin ?
Sappiamo che munin crea dei grafici bellissimi, ma a cosa servono ?
Se correttamente usato, munin è un potentissimo strumento di verifica.
Munin non prevede il futuro, analizza soltanto il passato.
Smonto subito chi sta pensando all’adozione del metodo induttivo per prevedere il futuro.
Questi sono metodi ideali per prendere le “bastonate”, questi sono i metodi che usa chi lavora in analisi del rischio.
Il metodo induttivo è adatto per altre cose, nella sicurezza informatica, ci si sporca le mani.
Nella sicurezza informatica, munin deve essere usato principalmente per verificare se ciò che è stato fatto, è stato fatto correttamente.
Prendiamo questo grafico, analizziamolo insieme e capiamo in che modo munin mi ha aiutato a prevedere la catastrofe.
Capiamo quali sono state le contromisure e se queste hanno funzionato.
Cominciamo prima con il grafico di sinistra, questo ci mostra l’ andamento della capacità del disco in termini percentuali, della giornata.
Se non sapessi cosa è accaduto, sarei portato a pensare di aver perso una notevole quantità di dati, ma non è così, non ho perso nulla.
Anche se munin ci dice CHIARAMENTE che l’impegno del disco è passato da poco più del 80% a poco più del 60%.
Quindi? Chi ha ragione ?
Abbiamo ragione entrambi, munin ha ragione perché mi dice che adesso il disco è pieno poco più del 60% ed ho ragione io perché non ho perso nessun dato.
Guardiamo, cosa è accaduto durante la settimana e prendiamo in esame il grafico a destra, quello che munin crea in riferimento al giorno intero e lo mostra su base settimanale.
Questa è una macchina di recente installazione, dunque il grafico di munin prende vita nella notte fra il 14 ed il 15 novembre.
Faccio una premessa, su questa macchina ci sono 5 dischi, ne vediamo solo 4 perché il colore giallo ed il colore arancione, sono sovrapposti lungo la striscia dello 0%.
Guardando con occhio attento il grafico di destra, si vede chiaramente che prima del 14 novembre non c’è nulla, dunque neppure una striscia appena accennata di colore arancione, visibile a destra del grafico di destra, lungo la striscia dello 0%.
Torniamo a noi, guardiamo il grafico di destra, notiamo che il 15 novembre, il disco si è riempito fino al 90% in modo repentino, non vediamo una curva, bensì un picco, una linea dritta di colore viola che si inerpica fino a superare il 90% della capacità totale del disco.
Rimane al 90% per qualche ora, nel frattempo munin mi ha inviato una email, informandomi che il disco sta annaspando al 92% della sua capacità totale.
Il grafico si borda di giallo, la spia “WARNING” si accende mostra il numero 1, questo sta a significare che in tutta l’ infrastruttura è stato rilevato un evento che merita attenzione.
Le spie di munin
Poco dopo, il grafico si borda di rosso, si accende la spia “CRITICAL” ed il disco raggiunge il 98%, il mio telefono squilla, una voce registrata mi avvisa che devo intervenire, siamo in zona critica, a breve il sistema si potrebbe bloccare.
Ad onor del vero, bisogna dire che tutto questo è stato voluto.
Questo é un test necessario per verificare che i sistemi di sicurezza funzionino correttamente ed intervengano nei giusti tempi.
Dunque intervengo, il disco pieno è posizionato su una SAN (Storage Area Network) e reso disponibile in con il protocollo ISCSI su fibra ottica dedicata.
Dunque ingrandisco il disco di 50Gb, il “CRITICAL” si spegne, il lavoro di trasferimento dati prosegue senza mai essersi interrotto.
Poco dopo ecco nuovamente accendersi il “CRITICAL”, poi nuovamente il “WARNING”, telefonata, ingrandisco ancora il disco, si spegne tutto ed il teatrino continua ancora un paio di volte, quando sono sicuro che gli allarmi funzionano, setto il disco perché rimanga pieno al 80% circa.
La macchina oggi è in produzione, quindi lavora correttamente, per questo motivo ho concesso altro spazio disco affinché quest ultimo sia ricolmo per il 60%
Vi ho spiegato tutto il mistero. Non ho perso dati, ho ingrandito il disco secondo le esigenze di quel momento.
Ci sono stati fermi macchina in tutto ciò ?
Guardiamo il grafico del uptime.
Non ci sono buchi, dunque la macchina non ha subito riavvii o spegnimenti.
Si sono interrotti i servizi ?
Andiamo a guardare i grafici che munin ha costruito per lo stato della CPU e quello dei processi.
Non ci sono buchi, i sistemi di allarme hanno funzionato egregiamente, munin non ci ha mentito, e ci ha mostrato qual’ è la via maestra.
Rispondo ad una domanda che nessuno mi ha posto, per introdurre un prossimo articolo che mi piacerebbe trattare in futuro e che riguarda la realizzazione di una SAN.
Perchè non ho usato direttamente un disco più grande ma ho tarato lo spazio al “pelo”?
Grazie a munin posso prevedere la necessità di assegnare più o meno spazio, dunque ridimensionare il disco in modo dinamico.
Avendo dischi piccoli, sono agevolato in termini sia di tempo che di STOCCAGGIO dei dati in caso di backup.
Fare l’ immagine completa di un disco da pochi GB è sicuramente diverso che fare la stessa cosa su un disco da svariati TB.
In caso di disastro, ripristinare un immagine piccola offre un enorme vantaggio in termini di tempo.
Abbiamo visto come va usato munin.
Come NON VA USATO MUNIN ?
Pensare al passato per stabilire l’ andamento del futuro è un errore da principianti o da FARABUTTI (vi ho già detto che chi lavora in analisi del rischio è un farabutto ?)
A questo scopo vi lascio un aneddoto che si tramanda di generazione in generazione fra tutti coloro che studiano statistica. IL TACCHINO INDUTTIVISTA.
Per la cronaca, analisi del rischio significa TACCHINO INDUTTIVISTA.
Quando sentite qualcuno che vi dice: ti faccio l’ analisi del rischio, SCAPPATE LONTANO, cacciate quel farabutto, non fatelo entrare nelle vostre vite, è solo una questione di tempo e sarete rovinati, con qualche migliaio di euro il vostro analista del rischio si sarà ripulito la coscienza, forse penserete anche di essere contenti perché tutto sommato avete incassato del denaro, ma i dati persi, quelli non hanno prezzo.
Immaginate i ladri in casa, vi devastano l’ esistenza. L’ assicurazione vi ripaga del danno subito, ma i vostri affetti, i vostri ricordi? …. Quelli sono persi per sempre.
Munin non fa i miracoli, munin aiuta le persone oneste. I farabutti, vengono CASTIGATI da munin.
Per poter monitorare i sistemi windows tramite il protocollo IpV6, dobbiamo usare il nodo munin-node.exe di LuckeHack