해당 글은 예지보전 시스템 구축과 관련된 기존 자료 조사와 함께 필자의 아이디어를 바탕으로 작성된 것이므로, 참고용으로만 봐주셨으면 합니다.
I. 고장 데이터의 활용이 가능한 경우 (고장 데이터 수가 충분, 각 유형별 라벨링이 존재할 때)
1) 장비가 이후 며칠 내에 고장이 일어날 것인지 True/False에 대한 Binary Classification 모델
가장 간단한 방법
output : x day/cycle 내에 고장이 날 것인지 아닌지에 대한 True/False
개발 방법 : 고장 시점 x day (ex)하루 전) 데이터에 대해 1로 라벨링하고, 나머지는 0으로 원핫 인코딩
예지보전 알람 방법 : output이 1이 나오는 시점에 바로 알람을 주어 유지보수를 진행할 수 있도록 함
한계 : 고장 원인에 대해서 알 수 없음, 학습한 고장 원인 파라미터에 가중치가 오버피팅될 수 있으므로, 다양한 고장 유형을 학습해야 함
활용 가능 모델 : LSTM Siamese Network 등
2) 장비의 잔여 수명(Remaining Useful Life, RUL)을 출력하는 Regression 모델
해당 모델을 개발하기 위해서는, 충분한 데이터 양과, 장비에 모든 일어나는 이벤트(유지보수, 고장 등)가 라벨링 되어있어야 함
각 공정 파라미터별 고장 케이스를 확보해야 함
장비의 노후(degradation)이 선형적이어야 함
한계: RUL 라벨의 신뢰도가 확보되어야 함
A. 모든 공정 데이터로 하나의 RUL 모델을 개발하는 경우
한계: 고장 유형에 대해 알기 어려움, 새로운 고장 원인이 발생 시 맞추기 어려움
예를 들어, cryo pump로 인한 고장의 RUL을 학습시킨 경우, cryo pump 파라미터에 대한 가중치가 높게 부여되어 있기 때문에 이외 파라미터로 인한 고장 예측 (RUL)이 제대로 산출되지 않을 가능성이 있음
B. 각 공정별 RUL 모델을 개별적으로 개발하는 경우
필요조건 : 공정별 고장 데이터가 주어져야 함
3) 며칠 내에 어떤 공정이 일어날 것인지 고장 유형에 대한 Multiple Classification 모델
output : 고장 유형에 대한 label number
고장 원인에 대해 파악 가능
필요조건 : 공정별 고장 케이스에 대한 정보
2. 고장 데이터의 활용이 불가능한 경우 (고장 데이터가 없을 때)
1) 각 파라미터를 실시간으로 regression 예측하는 모델
정상 데이터를 학습해서 regression을 할 경우엔, normal range in , normal range out
따라서, 예측한 normal range와 차이가 나면 위험도 상승 BM 필요성 알람
A. 예측 값과 차이 나는 일이 누적되면(threshold를 넘어가면) -> 유지보수 진행하라는 알람
B. 예측 값에 이상치가 있다면 알람
C. risk score를 라벨링 -> 라벨이 정확하려면 normal range를 정확히 측정하는 모델을 개발해야함