问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

CentOS系统中硬盘SMART健康信息查看指南

创作时间:
作者:
@小白创作中心

CentOS系统中硬盘SMART健康信息查看指南

引用
1
来源
1.
https://www.leftso.com/article/249.html

在Linux系统中,定期检查硬盘的健康状况对于预防数据丢失和系统故障至关重要。本文将详细介绍如何在CentOS系统中使用smartmontools工具查看硬盘的SMART(Self-Monitoring, Analysis and Reporting Technology)健康信息。

1. 安装smartmontools工具

要查看硬盘的SMART信息,首先需要安装smartmontools工具。使用以下命令进行安装:

yum -y install smartmontools

Tips: 只有root用户才有权限安装此工具。

2. 查看硬盘基本信息

安装完成后,可以使用smartctl命令查看硬盘的基本信息。例如,查看第一块硬盘(/dev/sda)的信息:

smartctl -i /dev/sda

Tips: /dev/sda是系统的第一块硬盘,可以在/dev目录下查看服务器有多少块硬盘。

输出示例:

SMART support is: Available - device has SMART capability.
SMART support is: Enabled

上面两行分别表示设备是否支持SMART以及是否已启用SMART。如果SMART支持是可用的但状态是DISABLED,可以通过以下命令启用:

smartctl -s on /dev/sda

3. 查看硬盘的SMART健康状态

使用以下命令检查硬盘的健康状态:

smartctl -H /dev/sda

如果输出为PASSED,表示硬盘健康;否则,可能意味着磁盘已经出现故障或即将发生故障。

4. 查看原厂信息

要查看更详细的原厂信息,可以使用以下命令:

smartctl -A /dev/sda

输出示例:

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          
  1 Raw_Read_Error_Rate     读取错误率
  3 Spin_Up_Time            起转时间
  4 Start_Stop_Count        启动停止次数
  5 Reallocated_Sector_Ct   重新分配扇区计数
  7 Seek_Error_Rate         寻道错误率
  9 Power_On_Hours          通电时间
 10 Spin_Retry_Count        起转重试次数
 11 Calibration_Retry_Count 重新校准重试次数
 12 Power_Cycle_Count       启动<->关闭循环次数
192 Power-Off_Retract_Count 断电磁头缩回计数
193 Load_Cycle_Count        磁头加载/卸载循环计数
194 Temperature_Celsius     温度
196 Reallocated_Event_Count 在分配扇区物理位置事件计数(与坏道无关)
197 Current_Pending_Sector  当前等待中扇区数(状态存疑/不稳定-等待后续判断)
198 Offline_Uncorrectable   无法修正的扇区总数
199 UDMA_CRC_Error_Count    UltraDMA CRC错误计数
200 Multi_Zone_Error_Rate   写入错误率

其他常用命令

  • -h:显示帮助信息
  • -V:显示版本信息
  • -i:打印基本信息(磁盘设备号、序列号、固件版本等)
  • -a:打印磁盘所有的SMART信息

运行时行为参数

  • -q TYPE:指定输出的安静模式。TYPE可以是errorsonly(只打印错误日志)、silent(没有任何打印)或nserial(不打印序列号)。
  • -d TYPE:指定磁盘的类型。如果没有指定,smartctl会根据磁盘的名字来猜测磁盘类型。
  • -T TYPE:指定当发生错误时,smartctl的容忍程度。TYPE可以是conservative(一有错就会退出)、normal(如果必须支持的SMART命令失败,则退出)、permissive(忽略一次必须支持的SMART命令失败)或verypermissive(忽略所有必须支持的SMART命令失败)。
  • -b TYPE:指定当发生校验错误时,smartctl的动作。TYPE可以是warn(发出警告,继续执行)、exit(退出smartctl)或ignore(不发出告警,继续执行)。
  • -r TYPE:smartmontools开发人员相关。
  • -n POWERMODE:指定当磁盘处于节能模式时,smartctl是否继续检查。POWERMODE可以是never(检查)、sleep(除了sleep模式,检查)、standby(除了sleep或standby模式,检查)或idle(除了sleep或standby或idle模式,检查)。

SMART功能开关参数

  • -s on/off:打开或关闭磁盘的SMART功能
  • -o on/off:打开或关闭SMART自动离线检测
  • -S on/off:打开或关闭“自动保存厂商指定属性”功能

SMART读和显示数据参数

  • -H:报告磁盘的是否健康
  • -c:显示磁盘支持的普通SMART功能及其当前状态
  • -A:显示磁盘支持的厂商指定SMART特性
  • -l TYPE:指定显示的log类型。TYPE可以是errorselftestselectivedirectory
  • -v N,OPTION:显示厂商指定SMART特性N时,使用厂商相关的显示方式
  • -F TYPE:设置smartctl的行为,当出现一些已知但还没有解决的硬件或软件bug时,smartctl应该怎么做
  • -P TYPE:设置smartctl是否对磁盘使用数据库中已有的参数

SMART离线测试、自测试参数

  • -t TEST:立刻执行测试,可以和-C参数一起使用。TEST可以是offlineshortlongconveyanceselective
  • -C:在captive模式下运行测试
  • -X:中断no-captive模式下运行的测试

通过以上命令和参数,可以全面监控和维护Linux系统中的硬盘健康状况,及时发现潜在问题,避免数据丢失。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号