预测性维护：一种用于机器异常声音检测（ASD）的主动学习（AL）框架

创作时间:

作者:

@小白创作中心

预测性维护：一种用于机器异常声音检测（ASD）的主动学习（AL）框架

引用

CSDN

https://blog.csdn.net/robinfang2019/article/details/141253804

异常声音检测（ASD）在工业机械监控、故障检测等众多领域中具有举足轻重的地位。通过解析设备产生的声音信号，ASD技术能够高效地辨识设备状态，为自动化监控系统提供直观且有效的监控手段。然而，在现实应用场景中，由于故障条件的稀缺性，收集充足的异常声音数据以训练模型成为一大挑战。因此，ASD通常被视为一项无监督学习任务，仅依赖非异常声音数据进行模型训练。

尽管近年来的研究进展包括利用预训练模型在辅助任务中的应用，如声音识别、声源分离和对比学习等，但无监督ASD方法在应对新颖、未见过的异常情况时仍显乏力。在动态或持续变化的环境中，现有技术的性能表现尤为受限。因此，迫切需要开发一种能够适应声学环境变化、无需大规模重新训练即可检测新型异常的ASD系统。

主动学习（AL）作为一种突破传统异常检测方法局限性的有前途的解决方案逐渐崭露头角。AL通过挑选富含信息量的数据点进行标注，实现检测模型的迭代优化，同时降低了对大量手动标注的依赖。这种自适应学习方法在提升ASD系统的适应性和可靠性方面具有巨大潜力，尤其是在标注数据稀缺的情况下。

根据选择样本进行标注的方式，AL可分为基于池的AL和基于流的AL。基于池的AL从固定的未标注数据池中抽取样本，通常以批量方式进行，便于全面审视数据集并高效处理。相较之下，基于流的AL则针对连续到达的数据进行实时决策，确定是否请求标注。

本文聚焦于机器状态监控领域的基于流的AL方法，因其相较于基于池的AL方法具有更优的响应速度。

1 异常声音检测系统

异常声音检测（ASD）系统旨在通过分析机器发出的声音，识别并分类目标对象的状态。ASD 系统的核心是异常分数计算器，它根据输入声音样本的特征，输出一个表示异常程度的分数。根据这个分数，系统可以判断机器是否处于正常状态。

1.1 ASD 系统概述

聚类音频编码器（Clustering Audio encoder）：该组件负责将输入的音频信号转换成特征嵌入（embeddings）。这些嵌入能够捕捉音频信号的重要特征，用于后续的异常声音判断。
正常声音（训练数据）：训练阶段使用的正常声音样本，用于训练音频编码器和构建参考嵌入集。
嵌入（Embeddings）：由音频编码器生成的音频特征表示，用于计算测试声音与参考嵌入集之间的相似度。
参考嵌入集（Reference embeddings）：一组通过聚类分析从正常声音样本中提取出的嵌入，作为评估测试声音是否异常的参考标准。
测试声音（Test sound）：需要判断是否为异常声音的输入音频样本。
余弦距离（Cosine distance）：测量向量之间的夹角的余弦值，使用余弦距离来衡量测试声音的嵌入与参考嵌入集之间的相似度。余弦距离越小，表示测试声音与正常声音越相似。
阈值（Threshold）：一个预设的值，用于判断测试声音是否为异常。如果余弦距离小于这个阈值，则认为声音正常；如果大于阈值，则认为声音异常。
异常分数（Anomalous score）：根据余弦距离计算出的分数，用于评估声音的异常程度。
异常/正常（Anomalous/Normal）：根据异常分数和阈值判断测试声音是异常还是正常。
异常声音检测器（Anomalous Sound Detector）：系统的核心部分，负责综合上述所有步骤，最终给出测试声音的异常判断。