본문 바로가기
Data Science/SKT AI Fellowship 3기

[SKT AI Fellowship 3기][3주차] NASA , CWRU BEARING DATASET

by titaniumm 2021. 7. 7.

3명으로 이루어진 저희 팀은 "데이터 전처리" , "SOTA 모델 구현", "제안 아이디어 구현" 3개의 부분을 각각 담당하고 있습니다. 저는 데이터 전처리를 담당하고 있어서 실제 그랜드뷰 서비스에 활용이 되기전에 검증할 데이터 셋이 타당한지 검토를 하고 있었습니다.

 

3주차 내용은 CWRU (Case Western Reserve University) 의 Bearing Dataset을 분석을 하면서 적용 타당성을 검토를 했었습니다. 

 

1. CWRU DATASET 2. CWRU+DWT 3. 차주 계획 이렇게 3가지 내용을 공유 했었습니다. 

베어링 데이터가 정말 안정적인 환경에서 수집이 된 것을 확인 할 수 있습니다.

A와 C 부분 두개의 영역에 베어링 데이터 셋이 존재했습니다. 

CWRU 데이터셋의 가장 큰 특징은 베어링의 결함이 어떤 결함인지 LABEL 이 존재한다는 것이였습니다.

이렇게 LABEL이 가능했던 이유가 자연적인 결함이 아니라 특정 부분이 고장난 베어링을 설치하고 나서 실험을 했기 때문입니다. 

왼쪽은 1~2주차에 분석을 했던 NASA Bearing DataSet 입니다. 자연적인 결함이기에 중간에 결함 상황을 파악 할 수 가 있지만 오른쪽 처럼 CWRU 데이터 셋은 정상과 비정상이 완전히 구분 되는 모습을 보입니다. 

 

불량 데이터 셋이 상당히 많이 존재하고 특히 OUTER Race 방향에서 결함이 발생한 것은 위치에 따라 3가지 결함 상황에 따라 측정한 데이터셋 인것을 확인 할 수 있습니다. 

다음의 내용은 DWT를 적용한 결과 입니다. 저희의 목표는 비지도 학습을 통해서 지도학습의 결과 만큼 내는 것입니다. 지도 학습을 사용하지 않는 이유는 실제 그랜드뷰 서비스를 적용할 때 혹은 현장에서는 불량에 대한 label이 존재 하지 않는 경우가 대부분이기 때문에 비지도 학습으로 접근하는 방향으로 잡았습니다. 

DWT 를 통해서 주파수 변환을 적용해 본 결과 오른쪽 처럼 여러 형태로 바뀌는 것을 확인 할 수 가 있습니다.

왼쪽의 raw데이터를 input으로 넣는 것보다 오른쪽의 여러 주파수 성분으로 분해해서 INPUT으로 활용하는 것이 성능이 좋다고 합니다. 

 

마지막으로 CWRU 데이터셋을 분석하면서 과연 이 데이터가 활용 가치가 있는지에 대해서 고민을 했었습니다.

회의 결과 !!! CWRU 데이터셋은 부적절한 것으로 파악이 되었습니다.

 

그 이유는 그랜드뷰 서비스는 이상을 조기 탐지 하는것으로 정상에서 고장 상황으로 넘어가는 "과도기 시점" 의 데이터가 필요합니다. 하지만 CWRU 데이터셋은 과도기 데이터가 존재 하지 않습니다.

 

댓글