iostat命令详解:监控主机硬盘故障排查利器
创作时间:
作者:
@小白创作中心
iostat命令详解:监控主机硬盘故障排查利器
引用
CSDN
等
9
来源
1.
https://blog.csdn.net/aaxh01/article/details/139621539
2.
https://blog.csdn.net/renduy/article/details/137262472
3.
https://blog.csdn.net/weixin_48255522/article/details/139066258
4.
https://blog.csdn.net/qq_32014795/article/details/140696639
5.
https://wenku.csdn.net/answer/1f014838dd474f96a013d1fe1ea197b5
6.
https://help.aliyun.com/zh/ecs/support/query-and-case-analysis-linux-io-load
7.
https://my.oschina.net/emacs_8740724/blog/17151291
8.
https://info.support.huawei.com/compute/docs/zh-cn/kunpeng-knowledge/typical-scenarios-1/zh-cn_topic_0000001197755593.html
9.
https://docs.redhat.com/zh-cn/documentation/red_hat_enterprise_linux/8/html-single/8.10_release_notes/index
在IT运维工作中,监控主机的硬盘故障排查是一个常见的挑战。当系统出现性能瓶颈或异常时,如何快速定位问题根源是每个运维人员都需要掌握的技能。本文将介绍一个强大的工具——iostat命令,它能帮助你轻松搞定监控主机的硬盘故障排查。
01
iostat命令详解
iostat是Linux系统中用于监控CPU使用率和磁盘I/O状态的常用工具。它能够提供详细的系统输入输出统计信息,帮助运维人员快速定位性能瓶颈。
iostat的输出主要包含两部分:avg-cpu和Device。
avg-cpu部分
avg-cpu部分显示CPU的平均使用情况,具体字段如下:
- %user:用户模式下运行的时间百分比。高值表示用户进程占用较多CPU资源,通常高于70%需要关注。
- %nice:低优先级进程占用的时间百分比。通常低于5%是正常的,高于10%可能需要关注。
- %system:内核模式下运行的时间百分比。高值表示系统调用或内核进程占用了较多CPU资源,通常高于20%需要关注。
- %iowait:CPU等待I/O操作完成的时间百分比。高值表示系统可能存在I/O瓶颈,通常高于10%需要关注。
- %steal:虚拟机管理程序为了服务其他虚拟处理器而花费的时间百分比。高值表示虚拟化环境中资源竞争激烈,通常高于5%需要关注。
- %idle:CPU空闲且没有任务需要处理的时间百分比。高值表示系统处于空闲状态,通常低于20%需要关注。
Device部分
Device部分显示磁盘设备的I/O统计信息,具体字段如下:
- 磁盘设备的名称(例如sda、sdb)。
- tps (transactions per second):每秒钟传输到设备或从设备传输的数据块数目。高值表示磁盘I/O操作频繁,通常高于1000需要关注。
- kB_read/s:每秒从设备读取的数据量(以千字节为单位)。高值表示读取操作频繁,通常高于100MB/s需要关注。
- kB_wrtn/s:每秒写入设备的数据量(以千字节为单位)。高值表示写入操作频繁,通常高于100MB/s需要关注。
- kB_read:自系统启动以来从设备读取的总数据量(以千字节为单位)。
- kB_wrtn:自系统启动以来写入设备的总数据量(以千字节为单位)。
02
实战案例:使用iostat排查磁盘I/O瓶颈
让我们通过一个实际案例来说明iostat在硬盘故障排查中的应用。
假设我们遇到一个场景:在高并发业务环境下,系统响应变慢,处理时间延长。我们怀疑是磁盘I/O问题,决定使用iostat进行排查。
- 首先查看系统整体状态:
top
输出显示:
top - 19:49:05 up 10 days, 8:16, 2 users, load average: 72.56, 40.21, 17.08
Tasks: 1288 total, 1 running, 586 sleeping, 0 stopped, 0 zombie
%Cpu(s): 19.7 us, 4.2 sy, 0.0 ni, 75.9 id, 1.0 wa, 0.0 hi, 0.2 si, 0.0 st
KiB Mem : 53542118+total, 23667507+free, 22735366+used, 71392448 buff/cache
KiB Swap: 0 total, 0 free, 0 used. 23128006+avail Mem
从输出可以看出,目前一分钟负载为72.56,且呈上升趋势,同时存在I/O压力(%iowait为1.0)。
- 查看各个磁盘设备的I/O情况:
iostat -m -x 1
输出显示:
Linux 4.14.0-115.el7a.0.1.aarch64 (mysql-4) 01/08/2022 _aarch64_ (128 CPU)
Device: rrqm/s wrqm/s r/s w/s rMB/s wMB/s avgrq-sz avgqu-sz await r_await w_await svctm %util
sda 0.00 0.00 14213.00 27430.00 222.08 465.15 33.80 5.39 0.13 0.14 0.12 0.02 86.00
sdb 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
dm-0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
dm-1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
dm-2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
从输出可以看出,sda磁盘的I/O压力较大,%util高达86.00,说明磁盘使用率非常高。
- 进一步检查sda磁盘的I/O读写情况:
iostat -d /dev/sda -m -x 1
输出显示:
Linux 4.14.0-115.el7a.0.1.aarch64 (mysql-4) 01/08/2022 _aarch64_ (128 CPU)
Device: rrqm/s wrqm/s r/s w/s rMB/s wMB/s avgrq-sz avgqu-sz await r_await w_await svctm %util
sda 0.00 0.17 7.86 81.23 0.29 3.96 97.88 0.23 2.53 0.22 2.76 0.04 0.33
Device: rrqm/s wrqm/s r/s w/s rMB/s wMB/s avgrq-sz avgqu-sz await r_await w_await svctm %util
sda 0.00 0.00 21109.00 42839.00 329.81 710.90 33.33 19.47
从输出可以看出,sda磁盘的tps高达63948(21109+42839),且读写速度分别达到329.81MB/s和710.90MB/s,远超过正常阈值,确认存在严重的I/O瓶颈。
03
iostat与其他监控工具的对比
在Linux系统中,常用的性能监控工具还包括sar等。与sar相比,iostat具有以下优势:
- 更专注于CPU和磁盘I/O的详细统计,输出信息更直观。
- 提供了更多的磁盘I/O相关指标,如tps、kB_read/s、kB_wrtn/s等。
- 实时性更好,能够更快地反映系统状态变化。
04
使用建议
- 在日常运维中,建议定期使用iostat检查系统I/O状态,特别是在高并发或关键业务场景下。
- 当发现I/O瓶颈时,可以结合其他工具(如iotop、vmstat)进一步定位问题。
- 注意区分正常业务高峰和异常I/O负载,避免误判。
通过掌握iostat命令的使用,运维人员可以更高效地应对监控主机的硬盘故障问题,及时发现并解决性能瓶颈,保障系统的稳定运行。
热门推荐
新手必看!ETF入门教程,让你轻松上手
冬季福特嘉年华保养秘籍
成都地铁13号线:贯穿四区的文旅新选择
成都地铁13号线最深车站即将封顶!东段实现短轨通
成都地铁13号线:2025年通车,你准备好了吗?
银行股逆势大涨46%,企业盈利与股价关系再审视
传统MTR遇新兴AI:云服务器故障诊断谁主沉浮?
SDN和NFV双剑合璧,云服务器网络性能大幅提升
阿里云服务器网络连接问题解决方案:5大故障排查与预防指南
云服务器安全防护:8大措施保障企业数据安全
感冒期间的饮食指南:这些食物要少吃,这些食物要多吃!
冬季感冒饮食禁忌:这些食物碰不得,否则病情加重!
冬季养生必备:黄芪党参大枣汤的功效与制作方法
冬季感冒速愈食谱大公开
湿疹是什么原因引起的?该怎么治疗?
19岁颜红英冒死送解放军过江,50年后才为人知
杜普兰蒂斯第10次刷新撑杆跳世界纪录,赢得百万美元奖金
布勃卡:杜普兰蒂斯打破撑杆跳高世界纪录是历史性时刻
科普→150秒解锁十五的月亮为何十六圆
三十余万字排日账里的19世纪:刘永华教授还原徽州乡民生活
贺霆等三位教授深耕西方田野,开创中国人类学新篇章
告庄西双景:打卡版纳璀璨明珠
苍耳子:让女生狗狗都怕的植物竟是鼻炎良药
苍耳子:一味治疗鼻炎的有毒中药,使用需谨慎
500ml酒配20g药材,教你正确泡制苍耳子酒
散风寒通鼻窍,苍耳子的药用价值与使用禁忌
冠心病社区筛查,守护邻里健康
冠心病最新诊断标准出炉,你知道多少?
人工智能助力冠心病诊断实现新突破
实地考察五步法:让论文数据更有说服力