giovedì 21 gennaio 2010

Gestire il crash dei dati.

Essenzialmente, i malfunzionamenti dei dischi rigidi sono di due tipi:

* Quelli prevedibili, in cui i malfunzionamenti, specialmente dovuti all'usura o all'invecchiamento, si manifestano gradualmente. Un sistema di monitoraggio può individuarli, come la spia della temperatura nella strumentazione di un'automobile può mettere in guardia il guidatore — prima che accadano seri danni — che il motore sta cominciando a surriscaldarsi.
* Quelli imprevedibili, dove i malfunzionamenti accadono improvvisamente e senza preavviso, come nel caso di un componente elettronico che si brucia.

Il monitoraggio di un disco rigido può predire circa il 60% dei possibili malfunzionamenti. S.M.A.R.T. ha lo scopo di avvisare l'utente o l'amministratore di sistema che il disco rigido sta per guastarsi, in modo che questi abbia il tempo di copiare i dati su un altro dispositivo di archiviazione.

http://it.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting_Technology

Cinque giorni fa.....dopo un certo tempo la cpu comincia a caricarsi inspiegabilmente, la luce che indica lo stato di lavoro dell'hard-disk sempre accesa e le applicazioni di una lentezza esasperante...tipico comportamento da Windows affetto da virus (pero' io utilizzo linux) oppure si poteva ipotizzare un ipotetico bug nel sistema dovuto all'utilizzo dell'ext4 in condizioni estreme (memoria residua 0kb)....in entrambi i casi, ho deciso di formattare e reinstallare il sistema avendo l'accortezza di utilizzare l'ext3.
Nei primi tempi tutto bene (dato che l'utilizzo non era prolungato), ma poi il rumore si e' ripresentato, questa volta piu' forte, e quindi mi sono reso bene conto che era l'hardisk, e il carico di cpu e la lentezza erano dovuti alla fatica di reperire i dati dalla memoria di massa.
Ad un riavvio del sistema mi appare una finestra di Palinsest che mi avverte: diversi blocchi dati dell'hard-disk sono danneggiati.
Se si prova a fare una ricerca sui vari forum si vedranno centinaia di messaggi in cui si lamentano messaggi troppo allarmistici da parte di palinsest. Io posso solo dare alcuni consigli per prevenire la perdita dei propri dati:

Se palinsest avvisa di un qualche malfunzionamento e' meglio verificare ulteriormente.

sudo badblocks -vns /dev/xxx

dove /dev/xxx sarà il nome dell’HD che si vuole controllare (es:. /dev/hda1)

se non siamo soddisfatti e si vuole indagare piu' a fondo si possono utilizzare delle utility che leggono i dati dall'elettronica di diagnostica dell'harddisk (S.M.A.R.T):

sudo apt-get install smartmontools

per analizzare il disco

sudo smartctl -H /dev/sda

dove /dev/sda è il nome del mio disco che si desidera controllare.
Se il test ha esito positivo otterremmo un messaggio tipo:
come output del comando smartctl sul mio disco ottengo:

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

Per effettuare un controllo completo:

sudo smartctl -a /dev/sda1

Si deve fare particolare attenzione alla voce Load_Cycle_Count; se il valore restituito e' alto ed in continuo aumento al ripetersi del comando di diagnostica, si deve intervenire con un comando del genere:

sudo hdparm -B 254 /dev/sda1

su questo wiki, si trovano maggior informazioni:
http://wiki.ubuntu-it.org/Hardware/DispositiviPartizioni/BugPosizionamentoTestina

Il parametro Load_cycle_count, indica il numero di movimenti che il braccio della testina fa per posizionarsi in una sicura ("safe area"), in modo da minimizzare l'usura della superficie del disco. Tipicamente la vita di un'hard-disk da 2.5" si aggira dai 300.000 ai 600.000 Load_cycle, ed e' per questo importante tenere sottocchio questo parametro.

Nessun commento:

Posta un commento

Related Posts Plugin for WordPress, Blogger...