지난 주에는 NASA Bearing Dataset과 CWRU bearing Dataset 에 대해서 살펴 보았습니다.
진동 데이터 셋이긴 하지만 저희가 활용했을 때 성능이 좋고 ( github에 나와 있는 대부분의 자료들도 성능이 좋습니다) 워낙 데이터가 클린하다 보니 전처리도 크게 필요하지 않았습니다.
가장 큰 이유가 안정적인 환경에서 실험을 하여 외부 충격과 같은 Noise가 전혀 없기 때문으로 파악 됩니다.
따라서 저는 추가적인 실험을 위해 (실제 그랜드뷰 서비스에서 만날 데이터와 유사한 데이터를 찾기 위해) 데이터 셋을 추가 조사하는 과정을 진행했습니다.
원점으로 돌아가서 우리에게 가장 필요한 데이터는 무엇일까? 라는 고민을 했었는데요, 위의 3가지로 요약이 되었습니다.
1. 진동센서 도메인
2. Raw data
3. 과도기 시점
이렇게 3가지 데이터를 충족하는 데이터를 찾기 위해서 열심히 구글링을 했었습니다. 그 중에서도 고장 진단과 관련된 학회인 phm 그리고 매년 문제를 출제하는 phm data challenge-dataset 들을 살펴 보았습니다.
PHM 학회 홈페이지와 관련 데이터를 살펴보았습니다. 2013 ~ 2020 까지의 데이터는 아쉽게도 모두 진동 데이터가 아니여서 활용이 적합하지 않았지만 2012 데이터는 진동 데이터이면서 저희가 원하는 형식의 데이터로 보였습니다.
2012 데이터 셋의 설명을 살펴 보면!! 초기의 불량이 세팅되지 않아서 자연스럽게 발생한 defect 이며 그렇기 때문에 다양한 defect type이 존재한다고 합니다.
CWRU Bearing dataset에서는 결함을 만들어 놓고 실험을 하여서 아쉬운 부분이 많았는데 그 부분을 해결해 주는 데이터 셋 이였습니다.
또한 오른쪽의 그림처럼 "과도기 시점"의 데이터가 포함되어 있었습니다.
과도기 시점이란 정상에서 불량으로 가는 과정을 의미합니다. bearing의 이상탐지를 목적으로 하는 skt grandview 서비스에 탑재가 되려면 이상신호를 탐지하여야 하기 때문에 "과도기 시점" 과정이 꼭 필요합니다.
간단하게 컬럼을 확인해 보았습니다.
데이터셋이 활용하기에 좋은 이유는 LABEL이 존재한다는 것입니다. NASA Bearing Dataset은 LABEL이 존재하지 않아서명확한 평가지표를 만드는 것이 조금 어려웠습니다.
회의 결과 데이터를 사용하기로 결정이 되었고 앞으로 추가적으로 분석 & 평가를 할 예정입니다.
다음은 최영제 연구원이 모델 부분에 있어서 발표를 진행해 주셨습니다. USAD 모델 구축 & 저희의 고유 아이디어인 AGP 테스트를 진행해 주셨습니다.
또한 TadGan 구축과 & TadGAN_AGM (제안 아이디어) 실험을 열심히 진행해주시고 계십니다.
구축하고 있는 코드들은 최영제 연구원의 github에서 확인하실 수 있습니다.
https://github.com/yjchoi-95/SKT_AI_fellowship_3rd/tree/main/Orion
마지막으로 8월 중간 발표까지의 목표를 재설정 했었습니다.
Two-Track으로 진행하여 두가지 측면에서 꼭! 좋은 성과를 내고 싶습니다.
'Data Science > SKT AI Fellowship 3기' 카테고리의 다른 글
[SKT AI Fellowship 3기][8 & 9 주차] Phm Bearing Data Challenge 수상 솔루션 분석 & 구현된 모델 TEST (0) | 2021.08.06 |
---|---|
[SKT AI Fellowship 3기][7주차] PHM Bearing Dataset 데이터 상세 분석 (0) | 2021.08.06 |
[SKT AI Fellowship 3기][3주차] NASA , CWRU BEARING DATASET (1) | 2021.07.07 |
[SKT AI Fellowship 3기][4주차] 1차 활동 기록 공유 SKT DEVOCEAN 공유 (0) | 2021.07.06 |
[SKT AI Fellowship] 3기 선정 후기 (0) | 2021.06.06 |
댓글