728x90
- 시계열 데이터에서 이상치 탐지를 하기 위해 변수간 correlation matrix를 생성하고 이를 입력으로 활용
- -> noise에 대해 robust한 성능을 가짐
- reconstructed matrix와 원본 matrix와의 residual을 residual matrix로 표현하고, 이 행렬의 element-wise square의 합을 loss function으로 정의
- anomaly score는 residual matrix의 요소 중 그 제곱값이 threshold보다 큰 요소의 개수로 설정하여, 특정 시점의 residual matrix의 anomaly score가 크다면, 해당 시점에서의 변수들의 상관관계가 정상일 때와 다름을 의미하고, 따라서 이상치로 판단
- CNN은 x, y 양방향에서 dependency가 있는 이미지에 사용이 됩니다. 그런데 시계열 데이터의 경우 time 축에 대해서만 의존적이기 때문에 양방향 의존성을 주기 위한 의도로 이렇게 아이디어를 내지 않았나 생각해봅니다
- Loss function은 마지막 step의 5개의 input의 차이의 값을 L2 loss로 정의
Reference
http://dsba.korea.ac.kr/seminar/?pageid=1&mod=document&keyword=multi&uid=1434
반응형