Bueno, gracias a la manera tan particular de infundarme conocimiento que tiene mi querido amigo lavaramano, decidi investigar un poco sobre el tema de la vida de los discos rigidos, ahora en adelante “El HD“, sobre todo pensando en un proyecto «super secreto» que sera develado en algunos dias cuando termine de girar algunas tuercas (?).
Volviendo a lo nuestro, el SMART (Self Monitoring Analysis and Reporting Technology), es un sistema de deteccion de errores en HD´s, que se usa desde 1992 aprox. , y esta muy bien explicado en paginas como esta (que seguramente no conocian). No me hondare en detalles historicos, al granel (?).
En linux, se instala el paquete smartctl (que tiene como dependencias a smartmontools, el que le provee los datos).
Si esta el SMART activado, al ejecutar el siguiente comando:
smartctl -A /dev/sda
Deberian ver algo asi:
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0003 176 176 021 Pre-fail Always - 4166
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 899
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 200 200 051 Pre-fail Always - 0
9 Power_On_Hours 0x0032 090 090 000 Old_age Always - 7569
10 Spin_Retry_Count 0x0013 100 100 051 Pre-fail Always - 0
11 Calibration_Retry_Count 0x0012 100 100 051 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 894
190 Airflow_Temperature_Cel 0x0022 069 053 045 Old_age Always - 31
194 Temperature_Celsius 0x0022 116 100 000 Old_age Always - 31
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0012 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 200 200 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0009 200 200 051 Pre-fail Offline - 0
La tabla varia segun el fabricante, pero suele contener los valores mas criticos/importantes. La columna VALUE, contiene el valor actual de la variable, WORST, es el peor valor registrado en esta ultima. THRESH (trecho) es el valor minimo que debe tener VALUE, si el valor baja de ese limite, es como para empezar a preocuparse.
Los valores suelen estar entre 255 y 0, los mas normales son entre 200 y 100, segun de lo que estemos hablando. La idea tambien es mirar el RAW_VALUE, que con tiene un valor segun el tipo de dato que estemos mirando, por ejemplo Temperature_Celsius contiene 31, que es la temperatura actual del HD. Hay muchos valores en 0, sobre todos los contadores de errores, tambien es importante tener un ojo en eso.
Esto es una mera introduccion del tema, pero con esto podrian ya tener un control de su disco. Para ver mas del tema, no queda otra que buscar por Internet que esta lleno de informacion de este tipo.