硬盘驱动器是个人计算机和服务器中用于存储数字数据的硬件部件,硬盘突然故障可能导致永久数据丢失,大多数硬盘驱动器使用自我监控、分析和报告技术(SMART)来跟踪各种性能指标并分析其自身的运行状况。然而,并不是所有的 SMART 属性都能有效地检测故障硬盘,因此网络和服务器管理员必须监控硬盘,以确保服务器性能正常,并通过避免硬盘中突然出现意外故障和错误来保持网络可用性。
硬盘驱动器被广泛认为是可靠的组件,年故障率很低,但是,硬盘驱动器是大型 IT 基础设施中最常更改的硬件组件,在大多数数据中心中,很大一部分已知故障是由故障硬盘驱动器引起的。使用全面的硬件监控工具监控硬盘驱动器以检测故障硬盘驱动器对于任何企业确保数据可用性和避免不可逆转的数据丢失都至关重要。
硬盘监控的挑战
大多数IT网络和数据中心都使用大量的硬盘作为数据存储设备,随着硬盘数量的成倍增长,对存储系统可靠性的监控和维护变得越来越具有挑战性。以下是硬盘监控的一些挑战。
- 为全球多供应商网络建立集中控制和监控系统。
- 主动式硬盘监控器,可在网络瘫痪之前检测有缺陷的硬件。
- 按警报类型分析排名靠前的警报,并确定修复硬盘问题是否会降低这些警报的频率。
- 能够支持升级的设备,以确保网络基础设施的增长不受限制。
- 使用历史数据提供全面的磁盘空间趋势和报告,以便 IT 团队可以就硬盘需求更改做出正确的选择。
- 查明硬盘性能问题的原因,以缩短修复时间并最大限度地减少停机时间。
硬盘监控工具
OpManager 是一个简单,全面的网络监控解决方案,拥有超过12,000个设备模板,可以快速识别硬盘驱动器并将硬盘性能监视器链接到它们,使用图形、警报和报告显示服务器和网络设备的性能。当确定硬盘问题时,使管理员能够执行远程故障排除。
- 硬盘运行状况监控
- 硬盘空间监控
- 硬盘故障管理
- 硬盘利用率报告
硬盘运行状况监控
保持硬盘运行状况非常重要,这样就不会丢失数据或出现意外问题,管理员需要在硬盘故障之前发现问题。使用硬盘监控工具,可以在硬件运行状况监视报告中选择受监控的硬件参数(如温度、功耗或旋转速度),以查看参数值和日期,从而评估性能、正常运行时间和可用性数据。
硬盘空间监控
硬盘监控工具包括许多磁盘空间监控指标和多个仪表板小部件来监控每个重要指标,以便快速了解存储设备中的磁盘空间状态。使用磁盘读取延迟、磁盘写入延迟、磁盘空间使用情况、磁盘I/O使用情况以及许多其他磁盘空间性能监视器,检查设备当前的使用率和增长趋势,以估计其存储耗尽的时间。
硬盘故障管理
硬盘监控工具定期轮询设备,以验证其运行状况、可用性和磁盘空间使用情况,它可以早发现问题并生成警报,并通知管理员驱动器故障。告警管理功能包括:归属、标注、清除、删除等,根据可配置的规则,将告警信息以邮件或短消息的方式发送给网络管理员,还提供了将无人值守警报升级到上级的预定义规则。
硬盘利用率报告
通过配置硬盘监控工具自带的报表,可以显示磁盘利用率最高的接口或设备,还可以根据历史使用趋势生成网络中所有设备的磁盘消耗预测。此外,还提供了所有硬盘驱动器的详细存储报告,针对所有磁盘空间性能指标,支持立即生成报表或定时生成报表,报表格式为PDF或HTML。
OpManager 使用常规的SNMP或StorageRest API协议监控各种供应商的存储设备,以跟踪关键指标的性能,如吞吐量,延迟,IOPS,读取/秒,写入/秒。管理员可以为这些重要指标分配阈值,并在性能低于理想水平时立即收到通知。