• 대한전기학회
Mobile QR Code QR CODE : The Transactions of the Korean Institute of Electrical Engineers
  • COPE
  • kcse
  • 한국과학기술단체총연합회
  • 한국학술지인용색인
  • Scopus
  • crossref
  • orcid

  1. (Dept. of Mechanical and Control Engineering, Handong Global University, Korea)



Convolutional Neural Network, Bearing Fault, Fault Classification, XAI, Grad-CAM

1. 서 론

베어링은 회전기계, 정밀기계의 주요 부품 중 하나이며, 기계 시스템의 중요 부품인 모터 고장 원인의 약 40~50%가 베어링 고장이다(1). 베어링 고장이 조기에 진단되지 않고 전체 시스템의 고장으로 이어지면 산업 시설 전반에 막대한 손실을 야기할 수 있다. 그러나 베어링은 다양한 회전 부품들 과 긴밀하게 결합이 되어 있기 때문에 직접적인 검사를 통해 베어링의 상태를 진단하는데 어려움이 있다.

따라서 직접적인 검사 없이 베어링의 진동 신호만을 이용하여 고장을 판단하는 다양한 기법들이 활발하게 연구되고 있다(2,3). 고장 베어링은 회전할 때 구름요소가 베어링 내의 고장 부분에 부딪히면서 충격파를 발생시킨다. 이 고장 신호는 공진 또는 노이즈 신호에 가려지기 때문에 고장을 판단하기 위해 고장 신호를 반영하는 특징을 추출하는 머신 러닝 기법들이 제시되었다.

일반적으로 베어링 고장 진단 연구에 사용되는 머신러닝 기법의 종류와 적용 방법은 다음과 같다. 원신호에서 공진, 노이즈 등을 필터링한 진동 신호로부터 고장 신호를 반영하는 특징 값을 추출한다. 추출한 특징들의 차원이 높으면 분류에 높은 영향을 미치는 특징 선택을 진행하거나 고차원 데이터를 저차원으로 변환하는 PCA 등의 차원 축소를 진행한 뒤 머신러닝 분류기로 베어링의 상태를 분류한다. 그러나 머신러닝 방법은 특징을 추출하는 과정에서 시스템에 대한 이해와 전문적인 지식이 필요하다는 한계가 존재한다(4).

이러한 머신러닝 방법의 한계를 극복하기 위해 데이터의 특징을 모델 스스로 추출할 수 있는 딥러닝 방법이 제안되었다. 딥러닝 방법은 입력과 출력간의 비선형적인 관계를 학습 해 높은 정확도로 시스템의 건전성 상태를 분류할 수 있다(5). 일반적으로 베어링 고장 진단 분야에서는 이미지 분류에 가장 보편적이고 높은 성능을 보여주는 알고리즘 중 하나인 Convolutional Neural Network(CNN)이 많이 사용되고 있다. 딥러닝 방법은 비선형 입출력 데이터 간의 관계를 매핑하기에 좋은 기법이지만 모델이 내린 결정을 인간이 이해하기 어렵다는 한계를 가지고 있다. 딥러닝 기술이 보편화되고 모델의 복잡성이 높아짐에 따라 모델의 신뢰도를 높이는 설명 가능한 인공지능(XAI) 연구가 주목받고 있다(6).

본 연구에서는 베어링 고장 진단 분야 연구에서 주로 사용되는 머신러닝 및 딥러닝 분류 기법을 자체 시스템 테스트베드에 적용하고, 각 기법들의 결과를 비교 분석하여 해당 시스템의 건강 상태를 진단하기에 가장 적절한 분류 기 법을 찾고자 한다. 대부분의 베어링 고장 진단 연구에서는 Case Western Reserve University(7)의 고장 베어링 데이터셋을 사용하나, 본 논문에서는 해당 데이터셋으로 검증된 모델들을 자체 설계 시스템에 적용하고 적절한 기법을 선정하였다. 머신러닝 기반 베어링 고장 진단 연구에서 특징 추출 기법으로는 통계적 특징(8), 포락선 분석(9), 웨이블렛 패킷 분해 기법들(8)이 일반적으로 사용되고, 차원축소로는 필터 및 래퍼 방법이 사용된다. 그리고 선택된 특징들을 K-최근접 이웃 방법(K-NN), 서포트 벡터 머신(SVM) 두 가지 분류기 모델을 이용하여 베어링 상태를 진단한다. 딥러닝 분류기로는 CNN을 사용하였으며, CNN의 입력 데이터는 1차원 진동 신호를 시간-주파수 2차원 이미지로 변환하여 사용하였다. 또한, CNN 분류 결과를 해석하기 위해 설명가능한 인공지능(XAI) 기법인 Grad-CAM으로 CNN 모델이 분류에 집중적으로 사용한 주파수 영역을 시각화 및 분석하였다. CNN 모델이 분류 과정에서 사용한 공간적인 가중치를 시각화하여 베어링의 각 고장 유형별로 특징적인 주파수 영역을 확인하였다. XAI로 CNN을 해석한 결과를 검증하기 위해 XAI 결과의 물리적 의미를 기반으로 전처리 필터를 설계하고, 진동신호 필터링을 통해 머신러닝 분류기의 정확도를 개선하는 연구 또한 수행하였다.

본 논문의 기여도는 다음과 같다.

자체 설계한 회전체 시스템의 베어링 고장을 진단하는 최적의 기법을 도출하기 위해 다양한 머신러닝 및 딥러닝 기법을 적용하고 성능을 비교 분석하였다.

딥러닝 모델의 분류 결과를 이해하기 위해 Grad-CAM XAI기법을 사용하여 모델의 의사결정을 분석하고 시각화하여 각 고장별 특징적인 주파수를 산출하였다.

XAI 분석 기반의 전처리 필터를 설계하고 머신러닝 진단 성능을 향상함으로써 XAI 해석의 물리적 의미를 검증하였다.

2. 관련 연구

2.1 머신 러닝 기반 베어링 고장분류

고장 신호의 특징 추출 기법에는 통계적 특징 추출, 포락선 분석, 웨이블렛 패킷 분해 기법 등이 있다(9). 통계적 추출 기법은 일정 범위 동안의 연속적인 데이터에서 통계적인 계산으로 특징을 추출하는 기법이다. 대표적으로는 시간 영역에서 RMS, 왜도값, 첨도값 등이 있으며 주파수 영역에서는 중심 주파수와 통계 값을 활용한다. 포락선 분석은 복조 기법 중 하나로, 계측된 회전기기의 진동 신호는 공진 신호와 결함 신호가 진폭 변조(Amplitude modulation)된 형태이기 때문에 포락선 분석으로 결함 신호를 추출할 수 있다(2). Tian 등(10)은 포락선 분석으로 전처리한 신호에서 통계적 기법 중 하나인 Spectral kurtosis 특징을 추출해 모터의 베어링의 고장 특징을 추출하였다. 베어링 결함은 각 유형별로 고유한 결함 주파수를 가지고 있기 때문에 포락선 분석을 거친 진동 신호에서 각 결함 주파수별로 에너지를 계산하여 특징값으로 사용할 수 있다. 웨이블렛 패킷 분해 기법은 진동 신호를 단계적으로 고주파와 저주파로 분해하는 신호 분해 기법이며, 분해된 각 주파수 영역별 에너지 값을 특징 신호로 이용할 수 있다. Priya 등(11)은 웨이블렛 패킷 분해를 이용해 원신호를 여러 주파수 대역으로 분해하고, 분해된 신호의 평균과 표준 편차를 각각 추출하여 특징으로 사용해 고장 유형별로 특징 값을 비교하는 연구를 수행하였다.

추출된 특징들은 특징 선택 기법을 통해 특징의 차원을 줄여 연산량을 감소시키고, 분류 성능이 떨어지는 특징을 제외함으로써 모델의 정확도를 높일 수 있다(12). 특징 선택 기법은 크게 래퍼, 필터, 임베디드 방법으로 나눌 수 있다. 필터 방법은 t검정, 카이 제곱 검정, 정보 이득 등의 통계적인 측정 방법들을 이용하여 특징들 간의 상관관계를 계산해 특징 자체를 평가하는 방법이다. 래퍼 방법은 피처들의 부분 집합들을 사용해 학습시킨 모델의 정확도를 평가하여 모델의 성능을 높이는 방법으로, 필터 방법보다 연산량이 많지만 정확도가 더 높다. 임베디드 방법은 래퍼 방법과 필터 방법의 장점을 결합한 방법이다. Rauber 등(9)은 분류기 모델을 지나치게 정교하게 설계하는 것보다, 고성능의 특징 집합을 구축하는 것이 더 중요하며, 적절한 특징 모델을 사용한다면 간단한 분류기만으로도 충분하다는 결론을 내렸다.

적절한 특징을 추출 및 선택한 후에 베어링 결함진단을 위한 머신러닝 분류기의 입력 값으로 특징 집합을 사용할 수 있다. 머신러닝 분류기로는 이웃한 K개 데이터의 라벨에 따라 새로운 데이터의 라벨을 분류하는 K-Nearest Neighbor(K-NN), 서포트 벡터와 경계면의 마진을 최대화하여 데이터를 분류하는 SVM(Support Vector Machine) 등의 기법들이 주로 사용된다. Konar 등(13)은 Continuous wavelet transform으 로 전처리한 베어링 진동 신호에서 특징을 추출하고 SVM으로 베어링의 상태를 분류하였다. Safizadeh 등(14)은 vibration signal과 load signal 두 가지를 fusion한 multi-sensor data에서 추출한 특징을 K-Nearest Neighbor(K-NN)을 사용하여 볼 베어링의 상태를 식별하였다.

2.2 딥러닝 기반 베어링 고장분류

최근에는 머신러닝에서 더 나아가 딥러닝 기반 진단 기법인 인공 신경망을 이용해 높은 효율성과 정확도로 신호의 특징을 추출 및 건전성을 진단하는 연구가 활발하게 진행되고 있다(15). 또한 기존에 사용되던 머신러닝 기반 방법은 원신호에서 특징을 추출하는 데에 전문가의 지식과 신호 처리 기술이 필요하고, 추출된 특징 간의 비선형적인 관계를 파악하기에는 얕은 구조를 가지고 있다는 한계점을 가지고 있다(4). Wang 등(16)은 1차원 베어링 진동 신호를 잘라서 이어붙임으로써 2차원 이미지로 변환하여 CNN으로 고장을 진단했다. Ding 등(17)은 wavelet packet energy를 입력 이미지로 사용하여 CNN으로 베어링 고장 진단을 수행하였다. Chen 등(18)은 Short Time Fourier Transform(STFT)을 사용해 진동 신호를 2차원 이미지로 변환하여 CNN 학습을 통해 베어링 상태를 분류하는 딥러닝 기반 연구를 진행하였다.

그림 1 회전기기 테스트베드

Fig. 1 Rotationary system testbed

../../Resources/kiee/KIEE.2022.71.9.1315/fig1.png

2.3 딥러닝 고장분류 모델 해석

딥러닝 모델은 예측 및 분류에서 우수한 성능을 제공 하지만 모델 내부의 매개 변수를 설명할 수 없다는 한계를 가지고 있다. 모델이 점점 복잡해져 해석하기 어려워짐에 따 라 최근 의료, 교통, 보안 등 안전과 직결된 분야에서 AI의 의사결정 해석에 대한 중요성이 대두되고 있다(6). XAI는 모델 내부를 설명하여 모델의 신뢰도를 높이고 모델이 도출한 결과를 검증하는 용도로 사용된다. 모델을 해석하는 방법에는 모델 내부 해석, 대리(Surrogate) 모델을 사용 한 방법 등의 방법이 있다. CNN 해석은 주로 CNN이 분류 과정에서 높은 가중치를 둔 영역을 시각화함으로써 모델이 이미지에서 어떤 부분을 중점적으로 사용해 판단했는지 나타낸다. Zhou 등(19)은 CNN 모델의 마지막 convolution layer의 가중치를 시각화하는 Class Activation Map (CAM)을 제안하였다. Chen 등(18)은 CAM의 한계점을 보완한 Gradient-weighted Class Activation Map(Grad-CAM)를 제시하였다. 일반적으로 Grad-CAM은 이미지 및 영상처리 모델에 적용되기 때문에 CNN이 탐지한 객체를 이미지에서 어떤 부분을 보고 결과를 도출했는지 확인하여 모델의 의사결정과정을 해석하고 신뢰도를 판단하는 용도로 이용된다. Menikdiwela 등(20)은 작은 곤충을 탐지하는 VGG16 모델의 결과를 검증하기 위해 Grad-CAM을 사용하였다. Panwar 등(21)은 흉부 CT 스캔 이미지를 사용한 COVID-19 양성 환자 검출 CNN 모델이 판단한 감염 영역을 시각화하고 모델의 신뢰도를 높였다. CNN을 사용한 베어링 고장 진단 연구에서는 주로 진동 신호를 시간-주파수로 분해한 이미지를 입력으로 사용한다. 이러한 모델의 분류 결과에서 높은 중요도를 가지는 주파수 영역을 시각화함으로써 모델을 설명할 수 있다.

표 1 데이터셋 설명

Table 1 Dataset description

Contents

Dataset

Motor Spec, Rpm

1.4[kW], Rpm: 1200

Gear ratio

1/100, 1/50

Class type

Normal, Inner fault, Outer fault

Sampling freq.

10,000[Hz]

Data length

10 sec * 5 times

Accelerometer measurement range

±50 g pk

그림 2 회전 시스템 베어링의 진동 신호

Fig. 2 Vibration signal of bearing in rotationary system

../../Resources/kiee/KIEE.2022.71.9.1315/fig2.png

그림 3 머신러닝 기반 베어링 고장 진단 전체 흐름도

Fig. 3 Overall framework of Bearing fault classification using machine learning method

../../Resources/kiee/KIEE.2022.71.9.1315/fig3.png

따라서 본 논문에서는 자체 설계한 회전기기 시스템에 가장 적절한 머신러닝 및 딥러닝 고장 진단 기법을 선정하고, XAI 기법인 Grad-CAM을 사용하여 딥러닝 모델의 진단 결과를 해석하고 XAI가 해석한 결론을 필터 설계를 통해 확인하고자 한다.

3. 하드웨어 및 데이터셋

본 논문에서는 모터-기어박스-베어링으로 이루어진 풍력발전기를 모사한 간단한 자체 설계 회전 시스템 테스트베드를 사용하였다. 테스트베드는 크게 블레이드 부분, 증속기 부분, 발전기 부분으로 3가지로 나눌 수 있다. 풍력 발전기의 구조에서 증속기-발전기 연결부 로터를 지지하는 베어링에 인위적인 고장을 인가하고 베어링의 하우징에 부착된 가속도계에서 취득한 진동 데이터셋을 사용하였다. Fig. 1은 테스트베드 하드웨어의 사진이다. 일반적으로 풍력 발전기 내부 증속기의 회전 속도는 약 1000~1800rpm이기 때문에 1200rpm의 회전 속도로 모터를 운전하였다. 학습데이터/테스트 데이터의 비율은 각각 80%, 20%로 설정하였으며 모터의 스펙 및 계측 관련 설정은 Table 1과 같다. Fig. 2는 각 유형별 진동 데이터의 일부이다.

4. 머신러닝 기반 고장진단 비교연구

4.1 특징 추출

표 2 통계적 특징 목록

Table 2 Statistical feature list

번호

특징

약어

1

Root mean square

RMS

2

Square root of the amplitude

SRA

3

Kurtosis value

KV

4

Skewness value

SV

5

Peak to peak value

PPV

6

Crest factor

CF

7

Impulse factor

IF

8

Margin factor

MF

9

Shape factor

SF

10

Kurtosis factor

KF

11

Frequency center

FC

12

RMS frequency

RMSF

13

Root variance frequency

RVF

4.1.1 통계적 특징 추출

머신러닝 기반 베어링 결함 분류의 전체 과정은 Fig. 3에서 정리하였다. 진동 신호를 시간 영역과 주파수 영역의 결함의 특성을 반영할 수 있는 대표적인 통계적 지표를 추출하였다. 통계적 지표는 (8)에서 사용된 시간 및 주파수 영역의 특징을 사용하였다. 특히 시간 영역의 특징들은 여러 베어링 고장 진단 연구에서 많이 사용되고 있다(22,23). Table 2는 본 연구에서 사용한 통계적 특징의 리스트이다.

4.1.2 포락선 신호 특징 추출

결함 베어링의 진동 신호는 베어링의 구름 요소가 베어링 내부의 결함 부위에 부딪히면서 발생하는 결함 신호와 공진 신호가 진폭 변조된 형태로 나타난다. 변조된 신호로부터 고장에 대한 정보를 가지고 있는 결함 신호를 복조하기 위해 포락선 분석 기법이 주로 사용된다. Fig. 4는 공진에 의해 변조된 신호와 변조되기 전의 내륜 고장 신호의 파형을 나타낸다. 진동 신호의 포락선을 계산하는 대표적인 방법으로는 힐버트 변환이 있다. 힐버트 변환은 h(t) 은 다음 (1)식과 같이 정의된다.

그림 4 내륜 결함 베어링의 포락선 추출 결과

Fig. 4 Envelope extraction of inner fault signal

../../Resources/kiee/KIEE.2022.71.9.1315/fig4.png

(1)
$h_{a}(t)=h(t)+i\widetilde h(t)$

신호에서 추출된 포락선 신호에서는 주로 고장 특성 주파수와 관련한 특징을 추출하여 사용한다. 본 논문에서는 고장 특성 주파수를 중심으로 1% 대역폭의 에너지를 특징으로 추출하였다(9).

4.1.3 웨이블렛 패킷 분해 기법

웨이블렛 변환은 시간과 주파수 해상도가 고정된 푸리에 변환의 단점을 보완한 신호 변환 기법이다. 웨이블렛 분해는 모 웨이블렛을 기저 함수로 신호를 변환하여 중심 주파수를 기준으로 신호를 고주파(Detail)와 저주파(Approximation)로 분해한 뒤, 다시 저주파 영역에서 새로운 중심 주파수를 기준으로 고주파와 저주파로 분해하기를 반복하는 신호 분해 기법이다. Fig. 5는 3단계 웨이블렛 분해의 모식도이다. 본 연구에서는 고주파 영역 또한 절반으로 분해하는 웨이블렛 패킷 분해를 레벨 4로 16개의 신호를 생성하며 분해된 신호의 에너지 값을 특징 값으로 활용하였다(8).

4.2 특징 선택 기법

본 연구에서는 특징 선택으로 필터 방법과 래퍼 방법을 사용하였다. 필터 방법은 통계적 테스트 점수로 특징 간의 상관관계를 계산하여 영향력이 높은 특징을 선택하는 특징 선택 방법이다. 계산 속도가 빠르다는 장점이 있지만 비교적 정확도가 떨어져 래퍼 방법을 사용하기 이전에 전처리 방법으로 사용되기도 한다. 래퍼 방법에는 전진 선택 (Sequential Forward Selection)과 후방 제거(Sequential Backward Selection) 두 가지 방법이 있는데, 전진 선택은 특징을 0개 가진 상태에서 특징을 하나씩 추가하며 모델의 정확도를 계산하여 모델의 성능을 높이는 특징 집합을 찾는다. 반대로 후진 제거는 전체 특징을 다 가진 상태에서 시작하여 특징을 하나씩 제거하며 최적의 특징 집합을 찾는 방법이다.

그림 5 레벨 3의 웨이블렛 패킷 분해

Fig. 5 Level 3 wavelet packet decomposition

../../Resources/kiee/KIEE.2022.71.9.1315/fig5.png

표 3 고장 특성 주파수 계수

Table 3 Defect frequencies coefficient

Inner race

Outer race

7.71

5.29

4.3 분류기

4.3.1 K-NN(K-Nearest Neighbor)

새로운 입력 데이터가 주어지면 기존에 분류된 데이터와의 거리를 측정하여 상대적으로 가까운 K개의 데이터의 라벨로 분류하는 거리 기반 지도 학습 모델이다. K-NN 방법은 학습이 필요 없는 게으른 학습(lazy learning)이기 때문에 학습에 소요되는 시간은 없으나, 새로운 데이터를 분류할 때에 계산량이 많다는 단점이 있다. 본 연구에서는 k를 5로 설정하여 모델링하였다.

4.3.2 서포트 벡터 머신(Support Vector Machine)

서포트 벡터 머신은 서포트 벡터와 경계면의 거리를 최대화하거나 최소화하여 데이터를 분류, 혹은 회귀하는 머신 러닝 기법이다. 서포트 벡터는 이상치를 제외한 결정 경계와 가장 가까이 위치한 데이터이며, 데이터의 분류를 위해서는 서포트 벡터와 경계면의 거리, 즉 마진을 최대화하는 최적의 결정 경계를 찾고 결정 경계를 기준으로 새로운 데이터의 클래스를 예측한다.

그림 6 선택된 특징 수에 ᄄᆞ른 K-NN 정확도

Fig. 6 K-NN accuracy according to the number of selected features

../../Resources/kiee/KIEE.2022.71.9.1315/fig6.png

4.3 분류 결과 비교

통계적 분석 기법, 포락선 추출 특징, 웨이블렛 패킷 특징 3가지 방법 모두 전체 데이터를 1초 간격으로 분할하여 각 부분마다 특징을 추출하였다. 통계적 특징의 경우 Table 2에 나열된 RMS, SRA 등의 13가지의 통계적 특징값이 출력되었다. 진동 신호의 포락선을 추출하여 복조된 스펙트럼에서 증폭된 고장 주파수 성분을 중심으로 1% 대역폭의 에너지를 포락선 분석 특징으로 사용하였다. 고장 주파수는 Table 3에 명시된 결함별 계수에 축의 회전 주파수를 곱한 값이며 각 고장별로 제6고조파까지 특징 추출에 사용하였다. 웨이블렛 패킷 분해 특징은 진동 신호를 레벨 4로 분해하고, 분해된 신호 중 가장 말단 노드 16개의 신호의 에너지를 특성으로 추출하였다.

특징 선택 기법은 필터 방법과 래퍼 방법을 사용하였고, 래퍼 방법 중 가장 대표적인 전진 선택, 후방 제거 방법을 사용하였다. 래퍼 방법에서 특징을 선택/제거하기 위해 모델의 정확도를 평가하는 기준으로는 SVM과 K-NN의 결과를 사용하였다. Fig. 6은 선택/제거한 특징 추출의 수에 따른 전체 특징 모델의 성능을 나타낸 그림이다. 전진 선택, 후방 제거 두 가지 경우 다 특징을 전부 선택/제거했을 때 성능이 저하됨을 확인할 수 있다. 두 방법 모두 특징 선택 3개 이상부터는 특징을 전부 사용한 모델과 유사한 정확도를 보였다. 그에 비해 필터 방법으로 선택된 특징들은 5개의 특징을 선택하는 시점에서 99.4%로 전체 특징 집합과 유사한 정확도를 보였다. 이 결과를 통해 모델의 정확도를 저하시키지 않으면서 연산량을 낮추기 위해서는 래퍼 방법이 필요하다고 파악하였다.

그림 7 딥러닝 기반 베어링 고장 진단 전체 흐름도

Fig. 7 Overall framework of bearing fault classifcation using deep learning method

../../Resources/kiee/KIEE.2022.71.9.1315/fig7.png

표 4 머신러닝 기반 분류 결과

Table 4 Accuracy of machine learning classification result

Feature

Classifi-cation method

Accuracy

All feature

Filter method

Wrapper method

Statistical feature

SVM

0.816

0.780

0.794

K-NN

0.950

0.868

0.942

Envelope feature

SVM

0.986

0.873

0.986

K-NN

0.992

0.882

0.987

Wavelet fature

SVM

0.990

0.944

0.986

K-NN

0.990

0.961

0.983

Gloabal feature

SVM

0.996

0.988

0.996

K-NN

0.991

0.988

0.996

머신러닝 기반 특성 추출 기법과 분류 모델의 성능을 비교하였다. Table 4에 SVM과 K-NN으로 평가한 각 특징 모델과 특징 선택 기법의 성능을 정리하였다. 특징 모델 중에서는 모든 특징을 전부 사용한 전체 특징 모델이 99.6%의 정확도로 가장 높은 성능을 보였으며, 그 다음으로는 웨이블렛 분해 특징 모델이 99.0%로 우수한 성능을 보였다. 분류기 중에서는 대체로 K-NN이 SVM보다 다소 높은 정확도를 보였다.

그림 8 CNN의 오차행렬

Fig. 8 Confusion matrix of CNN

../../Resources/kiee/KIEE.2022.71.9.1315/fig8-1.png../../Resources/kiee/KIEE.2022.71.9.1315/fig8-2.png

5. 딥러닝 기반 고장진단 연구

5.1 CNN(Convolutional Neural Network)

Fig. 7은 딥러닝 기반 베어링 고장진단의 전체 프레임워크이다. CNN 기법은 주로 영상이나 이미지를 분석하기 위한 목적으로 가장 많이 사용되는 딥러닝 기법 중 하나이다. 일반적인 심층 신경망은 입력으로 1차원 정보를 사용하기 때문에 2차원, 혹은 3차원 데이터인 이미지는 평탄화(flatten) 과정에서 각 데이터 포인트간의 공간 정보 손실이 일어난다. CNN은 이러한 공간 정보를 유지하면서 인접한 이미지와의 관계를 고려한 특징 계층을 추출 및 분류하는 신경망 구조이다. 입력 이미지에 필터를 스트라이드(stride)만큼 이동하면서 합성곱을 진행하고, 그 결과로 출력된 계층에 다시 필터와 합성곱하는 과정을 반복한 후 최종적으로 완전 연결 계층으로 평탄화하여 이미지의 클래스를 분류한다. 본 연구에서는 CNN의 입력 이미지로 STFT(Short Time Fourier Transform,) 결과와 CWT(Continuous Wavelet Transform) 결과를 사용하였다. 본 연구에서 사용한 CNN의 구조는 (18)에서 설계한 구조를 참고하였으며, Table 5에 정리하였다.

5.2 Grad-CAM(Gradient Class Activation Map)

설명 가능한 AI 기법 중 하나인 CAM(Class Activation Map)은 CNN의 결과에 영향을 미친 픽셀의 위치를 시각화함으로써 신경망을 설명하는 모델이다.(19) CNN의 마지막 합성곱 계층을 전역 평균 풀링(GAP, Global Average Pooling)을 통해 완전 연결 계층으로 만들고, 각 완전 연결 계층의 포인트들을 활성화 계층의 가중치로 사용해 이미지의 클래스를 분류한다. 합성곱 모델이 판단에 사용한 이미지의 위치를 시각화하기 위해서는 마지막 합성곱 계층의 각 특징맵마다 해당 특징맵의 평균값을 곱하고, 곱해진 채널들을 전부 더해 히트맵을 만들 수 있다. 완전 연결 계층 사용으로 인해 성능 저하가 일어나고, 마지막 합성곱 계층에서만 사용할 수 있는 CAM의 단점을 보완한 모델이 Grad-CAM이다.(24) CAM은 전역 평균 풀링의 가중치를 각 특징맵에 곱해 히트맵을 출력하지만, Grad-CAM은 가중치 대신 역전파 기울기를 이용해 히트맵을 만든다. Grad-CAM의 가중치와 수식은 다음과 같다.

표 5 베어링 고장 분류를 위한 CNN 구조

Table 5 Structure of CNN for bearing fault classification

Layer

Filter size

Stride

No. of filters/nodes

Activation function

Conv. 1

9×9

2×2

4

ReLu

Conv. 2

9×9

2×2

8

ReLu

Avg. Pool

4×4

Conv. 3

4×4

2×2

16

ReLu

Conv. 4

4×4

2×2

32

ReLu

Avg. Pool

2×2

Flatten

Fully-

Conn.

128

ReLu

Fully-

Conn.

32

ReLu

Fully-

Conn.

4

Softmax

(2)
$L_{Grad-CAM}^{C}(i,\:j)=Re Lu\left(\sum a_{k}^{c}f_{k}(i,\:j)\right)$

(3)
$a_{k}^{c}=\dfrac{1}{z}\sum\sum\dfrac{\partial S^{c}}{\partial f_{k}(i,\:j)}$ \begin{align*} z=\nu mber of i *\nu mber of j\\ S= soft\max score\\ C=class\nu mber\\ f_{k}(i,\:j)=feature map(i,\:j) \end{align*}

그림 9 STFT와 Grad-CAM 결과

Fig. 9 STFT and Grad-CAM result

../../Resources/kiee/KIEE.2022.71.9.1315/fig9.png

그림 10 CWT와 Grad-CAM 결과

Fig. 10 CWT and Grad-CAM result

../../Resources/kiee/KIEE.2022.71.9.1315/fig10.png

5.3 분류 결과 및 해석

그림 11 Grad-CAM 결과와 시간-주파수 이미지의 3d 플롯

Fig. 11 3d plot of time-freq. image overlapped with Grad-CAM result

../../Resources/kiee/KIEE.2022.71.9.1315/fig11.png

특성 추출 기법과 분류 모델의 성능을 비교하였다. Table 6에 각 이미지 변환 기법에 따른 CNN 모델의 성능, Table 7에서는 머신러닝 기법과 딥러닝 기법의 정확도를 비교하였다. CNN 모델의 경우에는 STFT, CWT를 입력 이미지로 사용한 모델 모두 우수한 성능을 보였으며, STFT 모델이 CWT 모델보다 다소 정확도가 높음을 확인할 수 있었다. 머신러닝 모델과 비교했을 때 딥러닝 기법인 CNN 모델이 전반적으로 분류 정확도가 우수함을 확인할 수 있었다. Table 7을 통해 Global 특징 모델의 성능이 가장 우수하고, STFT를 사용한 CNN 모델이 Global 특징 모델과 다음으로 가장 성능이 좋은 모델임을 확인할 수 있다. 하지만 CNN은 딥러닝 모델이기 때문에 모델이 판단을 내린 근거를 설명할 수 없다는 한계점이 있다. 따라서 본 연구에서는 Grad-CAM을 활용하여 CNN 모델의 결과를 분석 및 설명한다.

표 6 CNN 모델의 분류 결과

Table 6 Classification Result of CNN model

Input Image

Accuracy

STFT

0.994

CWT

0.978

Fig. 8은 각각 STFT와 CWT 이미지로 CNN을 학습시켰을 때 혼동 행렬(Confusion matrix)이고, Fig. 9, 10은 각 유형의 베어링 신호-주파수 이미지에 Grad-CAM을 적용시킨 결과이다. Fig. 11은 각 시간-주파수 이미지를 3d로 플로팅하여 Grad-CAM을 적용한 결과이다. CWT 이미지 CNN 결과가 STFT에 비해 정확도가 다소 낮음을 확인하였다. 정상, 내륜 고장, 외륜 고장 세 가지 경우에 CNN 모델의 가중치가 높은 주파수 영역이 상이함을 확인할 수 있다. Grad-CAM결과에 의하면 정상 상태 베어링은 STFT와 CWT 이미지 모두 1~3.5kHz 이상의 고주파 영역을 분류에 주로 사용했는데, 정상 베어링의 진동 신호에서는 뚜렷한 고장 신호가 확인되지 않고 특히 고주파 영역에서는 고장 베어링에 비해 깨끗한 진동 파형을 가지고 있기 때문에 고주파 영역을 주로 사용한 것으로 보인다. 고장 베어링의 경우에는 STFT와 CWT이미지의 학습 결과가 반대되는 양상을 보인다. STFT 이미지로 CNN을 학습시킨 결과, 내륜 고장 베어링은 0~500Hz 영역을 집중적으로 사용하고, 외륜 고장 베어링에서는 내륜 고장 베어링보다 높은 대역인 1~2kHz를 분류에 사용함을 확인하였다. Fig. 11에서 가중치가 높은 주파수 대역을 확인하면, 외륜 베어링의 STFT 이미지는 250Hz, 1750Hz 주변에서 크게 증가하기 때문에 해당 영역에서 Grad-CAM의 가중치도 크게 증가한 것으로 보인다. 내륜 베어링의 STFT 이미지 또한 250Hz 주변에서 높은 값을 가지고 있지만 외륜 베어링에 비해 상대적으로 그 크기가 작고, 700Hz 이상 영역에 0에 가깝기 때문에 500Hz 이하만 집중적으로 분류에 사용하였다고 판단된다. 고장 베어링의 주파수 그러나 CWT 이미지에서는 내륜 고장 베어링이 1.5~2.5kHz대역으로 상대적으로 고주파, 외륜 고장이 0~500Hz로 저주파 영역을 사용한 것으로 관찰된다.

표 7 머신러닝 및 딥러닝 분류 정확도

Table 7 Accuracy of machine learning and deep learning classification result

Feature

/Model

Classification method

/Input image

Accuracy

All feature

Filter method

Wrapper method

ML Model

Statistical feature

SVM

0.816

0.780

0.794

K-NN

0.950

0.868

0.942

Envelope feature

SVM

0.986

0.873

0.986

K-NN

0.992

0.882

0.987

Wavelet fature

SVM

0.990

0.944

0.986

K-NN

0.990

0.961

0.983

Gloabal feature

SVM

0.996

0.988

0.996

K-NN

0.991

0.988

0.996

DL Model

CNN

STFT

0.994

CWT

0.978

표 8 Grad-CAM 기반 전처리 필터의 차단주파수

Table 8 Cut-off frequency of Grad-CAM based preprocessing filter

HPF

LPF

Cut off frequency

1.5 kHz

2.5 kHz

그림 12 딥러닝 해석 기반 필터 설계 전체 흐름도

Fig. 12 Overall framework of designing filter based on deep learning interpretation

../../Resources/kiee/KIEE.2022.71.9.1315/fig12.png

STFT, CWT 경우 모두 베어링에서 고장이 발생하면 2kHz 이하의 저주파 영역에서 주로 고장 신호가 감지되고, 정상 신호는 모든 주파수 성분의 진폭이 작기 때문에 고장 베어링과 구사료된다. STFT와 CWT 이미지 모두 정상 베어링과 고장 베어링을 구분하는 정확도는 100%이지만 고장 베어링 중에서 고장 유형을 분류하는 성능은 상대적으로 다소 낮았다. 그러나 각 고장 유형별로 중요도가 높은 스펙트럼의 영역이 명확히 구분되기 때문에 CNN이 올바르게 판단을 내린 것으로 결론 내릴 수 있다.

6. Grad-CAM 결과 검증

Grad-CAM에서 표시된 주파수 영역이 실제로 베어링 상태 분류에서 유의미한 부분인지 간단한 머신러닝 분류기를 이용해 검증했다. 분류 정확도가 높았던 STFT 이미지로 학습한 모델에서 정상/고장 유형별 Grad-CAM 강조 영역을 사용했다.

표 9 Grad-CAM 기반으로 필터링한 분류 결과

Table 9 Classffication result filtered using Grad-CAM

Feature

Accuracy

Without Filter

With Filter

Statistical feature

0.816

0.889

Envelope feature

0.986

0.992

Wavelet feature

0.990

0.989

Global feature

0.996

0.992

Grad-CAM으로 확인한 주요 주파수 대역은 정상 베어링의 경우 1.5kHz 이상의 고주파, 고장 베어링은 2.5kHz 이하의 저주파 대역이었고, 해당 주파수 대역을 기준으로 필터를 설계하였다. 필터의 차단 주파수(Cut-off frequency)는 Table 8에 명시하였다. 필터가 두 종류이기 때문에 저주파 통과 필터(Low Pass Filter, LPF)로 필터링한 신호의 특징, 고주파 통과 필터(High Pass Filter, HPF)로 필터링한 신호의 특징 두 가지 특징을 합쳐 한 모델의 특징으로 사용하였다. Fig. 12는 필터 설계의 전체 과정을 나타낸 프레임워크이다. Table 9는 필터링된 신호로 특징 추출 후 K-NN을 사용해 베어링 상태를 분류한 정확도와 필터링 하지 않은 원신호를 사용했을 때 분류 정확도이다. 분류 결과, 통계적 특징과 포락선 추출 특징에서 정확도가 유의미하게 향상되었으며, 웨이블렛 특징과 Global 특징의 경우에도 필터링한 신호와 원신호의 차이는 매우 작았다. 통계적 특징에서 가장 높게 성능이 향상된 이유는 포락선 추출 특징과 웨이블렛 패킷 분해 특징은 신호를 다양한 주파수 성분으로 분해하여 특징을 추출하는 데에 반해 통계적 특징은 전체 주파수 성분을 사용하기 때문에 필터링이 더 효과적인 것으로 판단된다. 따라서 Grad-CAM을 통해 확인한 CNN 모델의 주요 주파수 대역은 베어링 건전성 진단에 유의미한 영역이라고 결론 내릴 수 있다.

7. Conclusion

베어링은 직접적인 검사가 어렵기 때문에 일반적으로 진동 신호 분석을 통해 간접적인 상태 검사가 필요하다. 진동 신호를 분석하는 방법에는 진동 신호의 특징을 추출해 머신러닝 분류기를 사용하는 방법과 특징을 스스로 추출 및 분류하는 딥러닝을 사용하는 방법이 있다. 본 논문에서는 풍력발전기를 모사한 회전기기 테스트베드를 구축하고 베어링의 진동 신호에 머신러닝 및 딥러닝 분류 기법을 적용하여 비교 및 분석을 통해 해당 시스템에 적절한 진단 기법을 선정하였다. 또한 딥러닝 모델의 결과를 Grad-CAM으로 해석하고 이를 기반으로 필터를 설계함으로써 검증하였다. 분류 기법 중에서는 대부분의 경우에 K-NN이 SVM보다 정확도가 높았으나, Global 특징에서는 다소 정확도가 감소하였다. 딥러닝 기법인 CNN 모델의 분류 결과는 STFT 이미지와 CWT 이미지 모두 거의 100%에 가까운 정확도를 보였고, STFT 이미지가 99.4%로 다소 더 높은 성능을 보였다. 머신러닝 모델과 비교하면 Global 특징 모델이 STFT 이미지 기반 CNN보다 다소 높은 성능을 보였으나, 그 외의 머신러닝 특징 모델들은 정확도가 다소 떨어지는 데에 반해 CNN은 입력 이미지에 관계없이 높은 정확도를 확보하였다. CNN 모델이 가장 우수한 성능을 보였지만 모델의 신뢰도를 높이기 위해 Grad-CAM을 적용하여 모델의 분류 결과를 해석하였다. Grad-CAM이 분석한 주파수 영역을 검증하기 위해 해당 주파수 영역을 기준으로 전처리 필터를 설계하고 간단한 머신러닝 모델을 이용해 필터링 과정이 최대 7%까지 정확도를 향상시킴을 확인했다.

본 연구를 통해서 회전기기기 베어링의 고장 진단에 주로 사용되는 머신러닝 및 딥러닝 기법을 적용하고 비교 및 분석하여 해당 시스템에 가장 적절한 베어링 건전성 기법을 선정하고, 베어링의 직접 검사 없이도 진동 신호 기반으로 베어링 결함을 분류할 수 있다는 것을 확인하였다.

Acknowledgements

이 성과는 2020년도 정부(교육부)의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구사업임(No. 2020R1I1A3074036)

References

1 
S. Nandi, H. A. Toliyat, X. Li, 2005, Condition monitoring and fault diagnosis of electrical motors—a review, IEEE transactions on energy conversion, Vol. 20, No. 4, pp. 719-729DOI
2 
R. B. Randall, J. Antoni, 2011, Rolling element bearing diagnostics—a tutorial, Mechanical systems and signal processing, Vol. 25, No. 2, pp. 485-520DOI
3 
M. Lebold, K. McClintic, R. Campbell, C. Byington, K. Maynard, 2000, Review of vibration analysis methods for gearbox diagnostics and prognostics, in Proceedings of the 54th meeting of the society for machinery failure prevention technology, vol. 634. Virginia Beach, Vol. va, pp. 16Google Search
4 
D.-T. Hoang, H.-J. Kang, 2019, A survey on deep learning based bearing fault diagnosis, Neurocomputing, Vol. 335, pp. 327-335DOI
5 
L. Ren, Y. Sun, H. Wang, L. Zhang, 2018, Prediction of bearing remaining useful life with deep convolution neural network, IEEE access, Vol. 6, pp. 13 041-13 049DOI
6 
A. B. Arrieta, N. D ́ıaz-Rodr ́ıguez, J. Del Ser, A. Bennetot, S. Tabik, A. Barbado, S. Garc ́ıa, S. Gil-L ́opez, D. Molina, R. Benjamins, 2020, Explainable artificial intelligence (xai): Concepts, taxonomies, opportunities and challenges toward responsible ai, Information fusion, Vol. 58, pp. 82-115DOI
7 
Case Western Reserve University. Bearing datacenter web - site: bearing datacenter seeded fault test data[EB/OL]. [2007-11-27] .http://www/eecs/cwru/edu/laboratory/bearing/.Google Search
8 
Z. Xia, S. Xia, L. Wan, S. Cai, 2012, Spectral regression based fault feature extraction for bearing accelerometer sensor signals, Sensors, Vol. 12, No. 10, pp. 13 694-13 719DOI
9 
T. W. Rauber, F. de Assis Boldt, F. M. Varej ̃ao, 2014, Heterogeneous feature models and feature selection applied to bearing fault diagnosis, IEEE Transactions on Industrial Electronics, Vol. 62, No. 1, pp. 637-646DOI
10 
J. Tian, C. Morillo, M. H. Azarian, M. Pecht, 2015, Motor bearing fault detection using spectral kurtosis-based feature extraction coupled with k-nearest neighbor distance analysis, IEEE Transactions on Industrial Electronics, Vol. 63, No. 3, pp. 1793-1803DOI
11 
V. S. Priya, P. Mahalakshmi, V. Naidu, 2015, Bearing health condition monitoring: Wavelet decomposition, Indian Journal of Science and Technology, Vol. 8, No. 26, pp. 1-7Google Search
12 
I. Guyon and A. Elisseeff, 2003, An introduction to variable and feature selection, Journal of machine learning research, Vol. 3, No. mar, pp. 1157-1182Google Search
13 
P. Konar and P. Chattopadhyay, 2011, Bearing fault detection of induction motor using wavelet and support vector machines (svms), Applied Soft Computing, Vol. 11, No. 6, pp. 4203-4211DOI
14 
M. Safizadeh and S. Latifi, 2014, Using multi-sensor data fusion for vibration fault diagnosis of rolling element bearings by accelerometer and load cell, Information fusion, Vol. 18, pp. 1-8DOI
15 
D. Neupane and J. Seok, 2020, Bearing fault detection and diagnosis using case western reserve university dataset with deep learning approaches: A review, IEEE Access, Vol. 8, pp. 93 155-93 178DOI
16 
D. Wang, Q. Guo, Y. Song, S. Gao, Y. Li, 2019, Application of multiscale learning neural network based on cnn in bearing fault diagnosis, Journal of Signal Processing Systems, Vol. 91, No. 10, pp. 1205-1217DOI
17 
X. Ding and Q. He, 2017, Energy-fluctuated multiscale feature learning with deep convnet for intelligent spindle bearing fault diagnosis, IEEE Transactions on Instrumentation and Measurement, Vol. 66, No. 8, pp. 1926-1935DOI
18 
H.-Y. Chen and C.-H. Lee, 2020, Vibration signals analysis by explainable artificial intelligence (xai) approach: Application on bearing faults diagnosis, IEEE Access, Vol. 8, pp. 134 246-134 256DOI
19 
B. Zhou, A. Khosla, A. Lapedriza, A. Oliva, A. Torralba, 2016, Learning deep features for discriminative localization, in Proceedings of the IEEE conference on computer vision and pattern recognition, pp. 2921-2929Google Search
20 
M. Menikdiwela, C. Nguyen, H. Li, M. Shaw, 2017, Cnn-based smal object detection and visualization with feature activation mapping, in 2017 International Conference on Image and Vision Computing New Zealand (IVCNZ). IEEE, pp. 1-5DOI
21 
H. Panwar, P. Gupta, M. K. Siddiqui, R. Morales- Menendez, P. Bhard-waj, V. Singh, 2020, A deep learning and grad-cam based color visualization approach for fast detection of covid-19 cases using chest x-ray and ct-scan images, Chaos, Solitons & Fractals, Vol. 140, pp. 110190DOI
22 
B. Sreejith, A. K. Verma, A. Srividya, 2008, Fault diagnosis of rolling element bearing using time-domain features and neural networks, in 2008 IEEE region 10 and the third international conference on industrial and information systems. IEEE, pp. 1-6DOI
23 
S. Sassi, B. Badri, M. Thomas, 2007, A numerical model to predict damaged bearing vibrations, Journal of Vibration and Control, Vol. 13, No. 11, pp. 1603-1628DOI
24 
R. R. Selvaraju, M. Cogswell, A. Das, R. Vedantam, D. Parikh, D. Batra, 2017, Grad-cam: Visual explanations from deep networks via gradient-based localization, in Proceedings of the IEEE international conference on computer vision, pp. 618-626Google Search

저자소개

김예진 (Yejin Kim)
../../Resources/kiee/KIEE.2022.71.9.1315/au1.png

She received the B.E. in Mechanical and Control Engineering from Handong Global University, Korea, in 2021.

Her main research topics are related to Prognostics and Health Management for rotationary machine.

전현직 (Hyeonjick Jeon)
../../Resources/kiee/KIEE.2022.71.9.1315/au2.png

He received the B.E. in Mechanical and Control Engineering from Handong Global University, Korea, in 2022.

His research interests includes Prognostics and Health Management for rotationary machine.

김영근 (Young-Keun Kim)
../../Resources/kiee/KIEE.2022.71.9.1315/au3.png

He received his M.S, Ph.D. degrees in mechanical engineering from the Korea Advanced Institute of Science and Technology (KAIST), Daejeon, South Korea, in 2010, 2014, respectively.

Since 2014, he has been with the Department of Mechanical and Control Engineering, Handong Global University, where he is currently an Associate Professor.

His research interests include industrial AI, machine vision for smart factory and deep learning for 2D/3D images.