본문 바로가기

728x90

분류 전체보기

(129)
[AutoML] Auto-Sklearn (V1, V2) : AutoML을 위한 파이썬 라이브러리 Auto-ML holds the promise of eliminating the tedious manual tuning of hyperparameters and model selection. One example is the Auto-Sklearn API, which provides a simplistic high-level interface to automatically evaluate multiple preprocessing and model fitting pipelines. A key ingredient to previous Auto-ML systems has been the use of so-called meta-features, which are initially computed for the ..
[Sputter 예지보전] 오버피팅 문제 원인 분석 및 learning rate scheduler 사용 문제 train accuracy와 valid accuracy가 차이남 원인 분석 및 개선 방향 1. data imbalance 문제 정상 데이터에 비해 비정상 데이터가 현저히 적음 해결방안 1) data imbalance 문제 해결을 위한 data loader sampler 사용 해결방안2) 시계열을 slice하는 윈도우를 shift해 전체 데이터 양을 늘림 (x축의 시간을 유지하면서 학습시키는 데이터를 늘림) 2. 라벨링 문제 현재 알람 정보가 시작한 기점으로 비정상이라고 라벨링을 함 but, 알람 정보가 시작한 시점 이전에 이상 조짐이 있었을 가능성이 있음 해결방안을 찾아야함,,,, 이상과 관련 없는 알람 정보가 라벨링에 고려됨 해결방안 : 알람정보와 관련된 마스터시트를 전달받을 때까지 일일히 파악하..
데이터 사이언스를 위한 파이썬 라이브러리 https://towardsdatascience.com/nine-emerging-python-libraries-you-should-add-to-your-data-science-toolkit-in-2021-85ce3d239846
[논문읽기/ 시계열 이미지 인코딩] A Deep Neural Network for Unsupervised Anomaly Detection and Diagnosis in Multivariate Time Series Data 시계열 데이터에서 이상치 탐지를 하기 위해 변수간 correlation matrix를 생성하고 이를 입력으로 활용 -> noise에 대해 robust한 성능을 가짐 reconstructed matrix와 원본 matrix와의 residual을 residual matrix로 표현하고, 이 행렬의 element-wise square의 합을 loss function으로 정의 anomaly score는 residual matrix의 요소 중 그 제곱값이 threshold보다 큰 요소의 개수로 설정하여, 특정 시점의 residual matrix의 anomaly score가 크다면, 해당 시점에서의 변수들의 상관관계가 정상일 때와 다름을 의미하고, 따라서 이상치로 판단 CNN은 x, y 양방향에서 dependenc..
[Sputter 예지보존] Sputter 장비 이해 1. Sputter Process Chamber (고 진공 반응 공간)에 Ar (아르곤, 불항성) 가스를 주입하면, Ar+와 전자로 나뉘어지며 Ar+ 플라즈마(이온화된 기체)가 형성됨 Ar+을 타겟 도체금속에 충돌시켜 그 충격으로 생성되어 떨어지는 타겟 물질의 미립자(작은 입자)를 Wafer 표면에 증착시키는 방법 2. Sputter 구조 및 과정 - UBM(Under Bump Metallugy) : sputtering에 의해 증착된 metal - wafer의 패턴에 따라 범프(납땜이라 생각하면 됨)를 균일하게 도포하는 것이 중요 (21.04.05. 심플랫폼 미팅 내용) - sputtering이 잘 진행되었는가는 이후에 육안으로 1) uniformity 2) disposition sickness를 검사함..
Wafer 제조 공정 이해 Wafer란? 웨이퍼는 실리콘(Si), 갈륨 아세나이드(GaAs) 등을 성장시켜 만든 단결정 기둥을 적당한 두께로 얇게 썬 원판을 의미 웨이퍼라는 얇은 기판 위에 다수의 동일 회로를 만들어 반도체 집적회로가 탄생되는 만큼, 웨이퍼는 반도체의 기반인 셈 제조 공정 1) 잉곳(Ingot) 만들기 모래에서 추출한 실리콘을 반도체 재료로 사용하기 위해서는 순도를 높이는 정제 과정이 필요 잉곳(Ingot) : 실리콘 원료를 뜨거운 열로 녹여 고순도의 실리콘 용액을 만들고 결정 성장시켜 굳혀 만들어진 실리콘 기둥 수 나노미터(nm)의 미세한 공정을 다루는 반도체용 잉곳은 실리콘 잉곳 중에서도 초고순도의 잉곳을 사용 2) 얇은 웨이퍼를 만들기 위해 잉곳 절단하기(Wafer Slicing) 둥근 팽이 모양의 잉곳을 원..
[Sputter 예지보전] 이미지 인코딩을 이용한 Anomaly Detection - unsupervised 방법론 CNN- Autoencoder를 사용 정상 이미지의 특징을 CNN으로 추출해 학습-> 학습한 정상 데이터의 특징을 기반으로 Autoencoder가 이미지를 복원 -> 복원한 이미지와 실제 이미지가 크게 다를 경우, 이상 데이터로 간주 장점 : 정상 데이터만 학습하면 됨 (이상 데이터가 필요 없음) 되도록 많은(다양한) 정상 데이터를 학습할수록 좋으며, 정상 데이터에 비정상 데이터가 포함되면 안됨 CNN-Autoencoder 방식이 더 적절할 것으로 예상됨 Sputter의 경우, 정상 데이터에 비해 비정상 데이터가 현저히 부족(SPU-01 장비 고장 시점 라벨링 총 5개) 하며, 비정상 데이터의 라벨링이 어려움 -> classification 모델로 접근하기 어려움 고장 시점 주변 데이터라고해서 모..
[Sputter 예지보전] 이미지 인코딩을 이용한 Anomaly Detection - classification 목적 Sputter 데이터는 온도, 기압, 전류 등 다양한 센서 데이터가 포함된 multivariate-time series data이다. 이러한 multivariate-time series 데이터를 처리하기 위해 이미지 인코딩 방식을 채택해 Image Classification으로 정상, 비정상, 비가동 데이터를 구분해 Anomaly Detection 문제를 해결하고자 한다. 최종적으로 비정상 데이터로 분류된 이미지의 confidence score를 위험도(anomaly score)로 해석해 장비의 실시간 위험 정보를 파악하여 예지보전 모델을 개발할 수 있다 방법론 1. 데이터 전처리 1) 분석에 사용될 센서 데이터 파라미터만 필터링 카테고리값 제거 lot ID, substrateID, slot, re..

반응형