이하 내용은 논문 [Deep learning models for predictive maintenance: a survey, comparison, challenges and prospect] 의 내용을 정리한 것이다.
ACM Reference Format:
Oscar Serradilla, Ekhi Zugasti, and Urko Zurutuza. 2020. Deep learning models for predictive maintenance: a survey, comparison, challenges and prospect. 1, 1 (October 2020), 34 pages. https://doi.org/10.1145/nnnnnnn.nnnnnnn
0. 예지보전(Predictive Maintenance) 모델 설계 단계
0) 공정 관련 도메인 지식 습득 (Domain Knowledge)
1) 데이터 탐색 및 전처리 (Diagnosis & Preprocessing)
2) 데이터 특징 추출 (Feature Engineering)
3) 이상 탐지 (Anomaly Detection)
4) 고장 위험요인 분석 (Failure Diagnosis)
5) 예측 진단 모델 개발 (Prognosis Model Development)
6) 유지보수 진행 (Mitigation by technicians)
1. 데이터 탐색 및 전처리 (Diagnosis & Preprocessing)
- 예지보전 모델 개발을 위한 데이터를 준비하는 단계
- 전처리 기법을 선택할 때, 예지보전 모델의 목적을 고려해야 함
- 대표적인 데이터 전처리 기법
1) synchronization : 시계열/주기성 데이터를 만들기 위해 다른 시점에 수집된 데이터를 하나로 수집
2) cleaning : 결측치를 제거하거나 보간함
3) oversampling : 고장 데이터의 수가 적거나, 작은 데이터셋을 다룰 때 데이터의 불균형을 해결하기 위해 데이터 샘플을 늘림
4) encoding and discretization : 모델이 처리하기 쉬운 차원으로 변환
5) segmentation : 큰 데이터셋을 분석하고 병렬화 지원하기 위해 데이터를 분할
6) feature scaling (normalization, standardization) : 비교가 가능하도록 모든 특징을 같은, 비슷한 크기로 조절 (표준화 정규화)
7) noise handling : 데이터 내 노이즈를 처리
2. 데이터 특징 추출 (Feature Engineering)
- 문제를 해결하기에 적합한 특징 데이터를 추출하는 과정
- 통계 및 머신 러닝 모델의 성능을 향상 (딥러닝 모델은 문제에 맞는 대표 특징을 자동적으로 추출 가능)
- 대표적인 데이터 특징 추출(FE) 기법
1) statistical features extraction in time and frequency domain: 데이터의 시간적/주기적 연관성을 추출
2) based on projection to new space : 관련 있는 정보를 유지하며 차원(dimension)을 낮춤 (ex) principal component analysis (PCA)
3) concatenation and fusion : 기존 데이터를 통합해 새로운 특징을 만듬
4) feature selection : 새로운 정보를 제공하지 않으면서 데이터의 복잡성만 증가시키는 낮은 분산, 중복 및 비상관성 데이터를 제외
- 딥러닝 모델은 대표 특징 (representative feature)를 자동적으로 추출할 수 있지만, 종종 모델의 성능을 높이기 위해 데이터 전처리 및 특징 추출을 진행하기도 한다.
- 이는 단기간에 모델의 성능을 높이는 것에 도움이 될 수 있어보이지만, 실제로는 더 복잡한 구조 혹은 많은 학습 시간이 주어졌을 때 자동적으로 학습할 수 있을 중요한 정보를 제거해버리는 결과를 낳을 수 있다.
- 하지만 반대로, 도메인 지식을 이용해서 중요한 데이터를 가지고 특징 추출 및 전처리를 하는 경우에는 긍정적인 결과를 도출할 수도 있다.
- 도메인 지식이 없을 경우에 모델은 데이터로부터 모든 비선형 관계를 학습해 높은 계산 복잡도와 소요시간을 필요로 하게 되지만, 도메인 지식을 활용해 이 과정을 어느 정도 필터링해줄 경우에는 모델의 차원 복잡성을 낮추어 간단하면서도 더 정확한 모델을 생성할 수 있게 된다.
- 따라서, 딥러닝 모델을 위한 데이터 특징 추출 및 전처리 과정은 해당 정보를 필터링했을 때 얻을 수 있는 결과에 대해 신중히 생각해본 뒤이루어져야 한다.
3. 이상 탐지 (Anomaly Detection)
- 데이터 내 이상치와 정상 데이터를 구분하는 단계
- 이상 탐지 단계에서 이상 데이터에 대한 잘못된 가정을 할 시, 이후 단계에서 높은 성능을 기대하리란 어렵다
- 즉, 이후에 진행되는 예지보존 모델 설계 과정은 해당 이상 탐지 단계를 어떻게 진행하느냐에 따라 성능이 달라질 수 있을만큼 해당 과정은 중요하다
- 이상 탐지의 정확도를 높이기 위해, 다수의 이상 탐지 기법을 함께 병행해 사용하는 것도 또 하나의 방법이 될 수 있다
- 데이터 라벨링 유무에 따른 이상 탐지 기법
① classification : 서로 다중 클래스 라벨링이 되어 있을 때
② one-class classification : 하나의 클래스만 라벨링이 되어 있을 때 (주로 정상 데이터가 라벨링됨)
③ clustering : 데이터 라벨링이 되어 있지 않을 때]
4. 고장 위험요인 분석 (Failure Diagnosis)
- 이전 Anomaly Detection 단계에서 발견해낸 이상치가 실제 기계의 고장 요인과 관련이 있는 것인지를 판단하는 단계
- FMEA (Failure modes and effects analysis ) 혹은 FMECA 를 통해 전문가 지식을 기반으로 기계의 고장유형/빈번도/수명에 대한 정보를 얻을 수 있다.
- * FMEA란?
- 설계, 공정, 품질보증 등 각 부문에 산재한 문제점을 정량적으로 관리하기 위한 기법
- 제품/프로세스 설계에서 발생할 수 있는 잠재적 고장/불량 유형/문제점 등을 파악하고 원인별로 Risk(위험도)를 평가
즉, 데이터를 분석하는 것 뿐만 아니라, 도메인 지식을 가진 전문가와 협의하여 제품/프로세스 설계에서 발생할 수 있는 잠재적 고장/불량 유형/문제점 등을 파악하고 원인별로 Risk(위험도)를 평가하는 과정이 이후 모델 설계 단계에서 시간 단축과 성능을 높이기 위해 필수적이다
5. 예측 진단 모델 개발 (Prognosis Model Development)
6. 유지보수 진행 (Mitigation by technicians)
- 고장 발생 전에 빠르게 기계를 올바른 작업 상태로 복원하여 장비가 멈춘 시간으로 인한 손실 비용을 절감하는 데 필요한 단계를 설계 및 수행하는 단계
- 유지보수 계획 수립 및 시행을 담당하는 유지관리 기술자가 유지관리 및 제조작업 관리 프로세스 수행
- PDM 모델은 정보를 생성하여 도메인 기술자에게 유지보수를 위한 처방전을 제공해야 한다 (ex) 몇번 공정에서 문제 발생 가능성)
참고자료
Oscar Serradilla, Ekhi Zugasti, and Urko Zurutuza. 2020. Deep learning models for predictive maintenance: a survey, comparison, challenges and prospect. 1, 1 (October 2020), 34 pages. https://doi.org/10.1145/nnnnnnn.nnnnnnn