Data Science (44) 썸네일형 리스트형 [논문읽기/시계열데이터를 이미지화하기] Sensor Classification Using Convolutional Neural Network by Encoding Multivariate Time Series as Two-Dimensional Colored Images 해당 글은 논문 [Sensor Classification Using Convolutional Neural Network by Encoding Multivariate Time Series as Two-Dimensional Colored Images] 내용을 기반으로 작성된 글입니다. 또한, 본 글은 논문에서 multivariate 시계열 데이터를 2D 컬러 이미지로 변환시킨 과정까지만을 요약하고 있습니다. (이미지를 ConvNet에 학습시켜 classification을 진행한 내용은 포함시키지 않았으므로 자세한 내용이 궁금하신 분은 해당 논문을 찾아 읽어보시면 좋겠습니다) Methodology (1) dimension reduction of multi variate time series by Piecewi.. [논문읽기/시계열 데이터를 이미지화하기] TIME SERIES TO IMAGES: MONITORING THE CONDITION OF INDUSTRIAL ASSETS WITH DEEP LEARNING IMAGE PROCESSING ALGORITHMS 해당 글을 논문 [TIME SERIES TO IMAGES: MONITORING THE CONDITION OF INDUSTRIAL ASSETS WITH DEEP LEARNING IMAGE PROCESSING ALGORITHMS]의 내용을 바탕으로 요약한 글이다. APA : Garcia, G. R., Michau, G., Ducoffe, M., Gupta, J. S., & Fink, O. (2020). Time series to images: Monitoring the condition of industrial assets with deep learning image processing algorithms.arXiv preprint arXiv:2005.07031 Abstract 시계열 데이터의 시간적 특성은.. [시계열 데이터를 이미지화하기] Gramian Angular Field(GAF) Imaging 개념이해 Gramian Angular Field (GAF) 개요 시계열 데이터를 비-데카르트 좌표계(non-Cartesian coordinates system)의 이미지로 표현한 것 데카르트 좌표계를 사용하지 않는 대신에, 각각의 좌표 값들은 극좌표계(Polar Ordinate system)의 방식으로 계산됨 이로 인해, 각 시점의 시간적 상관관계(temporal correlation)를 표현 가능 GAF는 왼쪽 상단에서 오른쪽 하단으로 이동함에 따라 시간이 증가하기 때문에 시간 종속성을 보존한다 주대각선은 원시 데이터의 값과 각도 정보를 포함하기 때문에 이를 이용하여 원시 데이터를 복구할 수 있다 따라서, 변환된 이미지는 왼쪽 위(top-left)에서 오른쪽 아래(bottom-right) 방향으로 원 시계열에 .. Gram Matrix (그람 행렬) 개념 이해 1) 개념 Linear Algebra(선형대수학)과 Geometry (기하학)에서 자주 사용됨 벡터의 linear dependence를 계산하기 위해 주로 사용됨 n 벡터에 대한 Gram Matrix : a matrix defined by the dot-product of every couple of vectors 2) Gram Matrix를 왜 사용하는가? The Gram Matrix preserves the temporal dependency Since time increases as the position moves from top-left to bottom-right, the time dimension is encoded into the geometry of the matrix. 내적(inner product, dot product, scalar product, projection product) 개념 이해 1) 내적의 표기 (notation and symbol of the inner product) 두 벡터의 내적(inner product)은 「.」(dot)으로 표기하며, 이래서 점곱(dot product)이라고도 말함 혹은, (a, b)와 같이 표기함 결과값이 (벡터가 아닌) 스칼라이기 때문에 스칼라곱(scalar product)이라고도 함 벡터의 cosine값(해당 벡터을 선으로 보고, 해당 선에 직사광선이 쏘아졌을 때(projection되었을 때)의 그림자의 길이)를 사용해 계산하기 때문에 영사곱(projection product)이라고도 함 2) 내적의 계산 각 vector component끼리 곱해서 모두 더함 2차원에서는 다음과 같이 표현됨 또는 아래와 같이 표현 가능 단위 벡터(unit vec.. 회귀(regression) 모델 성능 지표 (MAE, MSE, RMSE, R2 score) 1) MAE (Mean Absolute Error) score - 모델의 예측값과 실제값의 차이(절댓값)를 모두 더함 - MAE score가 높을수록 성능 낮음 - 다만, 차이의 절댓값을 사용하기 때문에 실제값과 음적(-)으로 차이나는지, 양적(+)으로 차이나는지 알 수 없음 2) MSE (Mean Squared Error) - 모델의 예측값과 실제값 차이의 면적(제곱)의 합 - MSE score 높을수록 성능 낮음 - 면적으로 계산하기 때문에 특이치에 민감 3) RMSE (Root Mean Squared Error) - MSE값에 루트를 씌운 값 - RMSE score 높을수록 성능 낮음 4) R2 Score (Coefficient of Determination) - R2 Score 높을수록 성능 높음 [ML] Informer 사용 https://github.com/zhouhaoyi/Informer2020 zhouhaoyi/Informer2020 The GitHub repository for the paper "Informer" accepted by AAAI 2021. - zhouhaoyi/Informer2020 github.com Colab 코드 사용 코드 사용 주의사항 1) custom 데이터셋 적용 - custom 데이터셋을 사용하고 싶을 때는 args.data = "custom" - 이러면 args에 입력한 대로 custom dataset을 자동으로 만들어서 적용시킴 2) timestamp column - timestamp column의 이름은 date 이어야 하며 - timestamp column이 가장 첫번째 column.. [딥러닝 환경설정/ Linux] 1. 장착된 GPU 모델 확인 방법 (lspci -k 명령어로 모델명이 보이지 않을때 해결방법) 아래의 명령어를 이용하여 GPU 모델과 커널 모듈 정보를 확인 lspci -k 출력된 많은 코드 중에, 아래와 같이 VGA compatible controller: ~로 시작하는 코드가 보인다면 대괄호[ ] 안에 적혀 있는 것이 본인의 GPU 모델명이다. (예시 : GeForce RTX 3070) VGA compatible controller: NVIDIA Corporation GA104 [GeForce RTX 3070] (rev a1) 정확한 모델명이 안나오고 Device 2484등이 출력될 때, 다음 명령어 입력 후, 다시 확인 sudo update-pciids lspci -k 이전 1 2 3 4 5 6 다음