본문 바로가기

728x90

Data Science/Time series data

(18)
[논문읽기/시계열데이터를 이미지화하기] Sensor Classification Using Convolutional Neural Network by Encoding Multivariate Time Series as Two-Dimensional Colored Images 해당 글은 논문 [Sensor Classification Using Convolutional Neural Network by Encoding Multivariate Time Series as Two-Dimensional Colored Images] 내용을 기반으로 작성된 글입니다. 또한, 본 글은 논문에서 multivariate 시계열 데이터를 2D 컬러 이미지로 변환시킨 과정까지만을 요약하고 있습니다. (이미지를 ConvNet에 학습시켜 classification을 진행한 내용은 포함시키지 않았으므로 자세한 내용이 궁금하신 분은 해당 논문을 찾아 읽어보시면 좋겠습니다) Methodology (1) dimension reduction of multi variate time series by Piecewi..
[논문읽기/시계열 데이터를 이미지화하기] TIME SERIES TO IMAGES: MONITORING THE CONDITION OF INDUSTRIAL ASSETS WITH DEEP LEARNING IMAGE PROCESSING ALGORITHMS 해당 글을 논문 [TIME SERIES TO IMAGES: MONITORING THE CONDITION OF INDUSTRIAL ASSETS WITH DEEP LEARNING IMAGE PROCESSING ALGORITHMS]의 내용을 바탕으로 요약한 글이다. APA : Garcia, G. R., Michau, G., Ducoffe, M., Gupta, J. S., & Fink, O. (2020). Time series to images: Monitoring the condition of industrial assets with deep learning image processing algorithms.arXiv preprint arXiv:2005.07031 Abstract 시계열 데이터의 시간적 특성은..
[시계열 데이터를 이미지화하기] Gramian Angular Field(GAF) Imaging 개념이해 Gramian Angular Field (GAF) 개요 시계열 데이터를 비-데카르트 좌표계(non-Cartesian coordinates system)의 이미지로 표현한 것 데카르트 좌표계를 사용하지 않는 대신에, 각각의 좌표 값들은 극좌표계(Polar Ordinate system)의 방식으로 계산됨 이로 인해, 각 시점의 시간적 상관관계(temporal correlation)를 표현 가능 GAF는 왼쪽 상단에서 오른쪽 하단으로 이동함에 따라 시간이 증가하기 때문에 시간 종속성을 보존한다 주대각선은 원시 데이터의 값과 각도 정보를 포함하기 때문에 이를 이용하여 원시 데이터를 복구할 수 있다 따라서, 변환된 이미지는 왼쪽 위(top-left)에서 오른쪽 아래(bottom-right) 방향으로 원 시계열에 ..
[ML] Informer 사용 https://github.com/zhouhaoyi/Informer2020 zhouhaoyi/Informer2020 The GitHub repository for the paper "Informer" accepted by AAAI 2021. - zhouhaoyi/Informer2020 github.com Colab 코드 사용 코드 사용 주의사항 1) custom 데이터셋 적용 - custom 데이터셋을 사용하고 싶을 때는 args.data = "custom" - 이러면 args에 입력한 대로 custom dataset을 자동으로 만들어서 적용시킴 2) timestamp column - timestamp column의 이름은 date 이어야 하며 - timestamp column이 가장 첫번째 column..
[데이터 전처리/Data Science] 데이터 평활(smoothing) 데이터 평활을 수행하는 데는 다양한 이유가 있고, 현실의 시계열 데이터는 분석 전에 평활되는 것이 보통 특히 데이터를 쉽게 이해하는 목적으로 시각화 자료를 만들기 위해 평활을 진행하는 경우가 있음 1. 평활이란? 시간에 따라 수집된 시계열 데이터에는 무작위적인 변화량이 있다. 평활(Smoothing)이란, 이렇게 무작위적 변화로 생기는 효과를 줄이는 방법들 중 흔히 사용되는 기법 중 하나다. 예를 들어, 주어진 시계열 자료에 평균을 취하는 것은 가장 단순한 평활법이다. 하지만, 평균은 모든 과거 관측값을 동일한 가중치로 다루기 때문에, 추세(Trends)가 존재하는 경우 좋은 지표가 될 수 없다. 평활을 이용해 시계열을 세 가지 구성성분으로 분해하거나, 예측을 수행할 수 있다. 2. 평활의 목적 A. 데..
[데이터 전처리/Data Science] 업샘플링(upsampling)과 다운샘플링(downsampling) 해당 글은 시계열 데이터 관점에서의 업샘플링과 다운샘플링의 개념을 다룹니다 업샘플링(upsampling)과 다운샘플링(downsampling) 타임스탬프의 빈도를 늘이거나 줄이는 방법 pandas의 resample 메소드는 업샘플링과 다운샘플링을 위한 유용한 기능을 제공함 (index가 datetime형식이어야 지원 가능) import pandas as pd df = pd.DataFrame() df.resample(rule='S') (rule에는 매초(s), 매시간(H), 매년(A) 등 다양한 시간 분할자를 넣을 수 있다 1. 다운샘플링(downsampling) 이란? 원본 시계열보다 타임스탬프가 더 낮은 빈도로 발생하게끔 데이터의 부분집합을 만드는 것 다운샘플링이 이루어지는 경우 1) 원본 데이터의 시..
시계열 데이터셋(Time series Dataset) 구하는 방법 시계열 데이터셋 구하는 방법 1) UCI 머신러닝 저장소 UCI Machine Learning Repository Welcome to the UC Irvine Machine Learning Repository! We currently maintain 588 data sets as a service to the machine learning community. You may view all data sets through our searchable interface. For a general overview of the Repository, please visit ou archive.ics.uci.edu 2) UEA 및 UCR 시계열 분류 저장소 Time Series Classification Websit..
[Time Series Forecasting] Multistep 시계열 데이터 예측을 위한 RNN기반 Encoder-Decoder 모델 해당 글은 아래 Reference의 [Encoder-Decoder Model for Multistep Time Series Forecasting Using PyTorch] 글을 참고했습니다. Encoder-Decoder 모델은 최근 연구에서 언어 번역 등과 같은 sequence to sequence NLP (자연어 처리) 문제를 효과적으로 해결하는 결과를 보여줬다. multistep 시계열 데이터 예측 문제도 seq2seq 문제와 같이 다뤄질 수 있기 때문에, encoder-decoder 모델도 사용될 수 있다 DATASET(데이터셋) 해당 reference 글에서는 다음 물품 판매량에 대한 Kaggle 데이터셋을 사용했다 Store Item Demand Forecasting Challenge Predi..

반응형