본문 바로가기
[SKT AI Fellowship 3기][3주차] NASA , CWRU BEARING DATASET 3명으로 이루어진 저희 팀은 "데이터 전처리" , "SOTA 모델 구현", "제안 아이디어 구현" 3개의 부분을 각각 담당하고 있습니다. 저는 데이터 전처리를 담당하고 있어서 실제 그랜드뷰 서비스에 활용이 되기전에 검증할 데이터 셋이 타당한지 검토를 하고 있었습니다. 3주차 내용은 CWRU (Case Western Reserve University) 의 Bearing Dataset을 분석을 하면서 적용 타당성을 검토를 했었습니다. 1. CWRU DATASET 2. CWRU+DWT 3. 차주 계획 이렇게 3가지 내용을 공유 했었습니다. 베어링 데이터가 정말 안정적인 환경에서 수집이 된 것을 확인 할 수 있습니다. A와 C 부분 두개의 영역에 베어링 데이터 셋이 존재했습니다. CWRU 데이터셋의 가장 큰 특.. 2021. 7. 7.
[머신러닝] Linear Regression, Lasso, Ridge with python,sklearn 공정데이터를 전처리하여 Linear Regression, lasso, Ridge 모델들로 성능을 최적화 시키는 실습이였다. 데이터 전처리를 연습하고, K-fold, pca 등 활용해 볼 수 있는 실습이였다. 성능을 높이기 위해서 중요했던 것은 다음과 같다. 1. 데이터 전처리 (시계열 특성 반영) 2. K-fold로 성능 검증 ( 일반적인 랜덤 샘플링 이용한 방법 , cross-validation 모듈 결과가 조금씩 달랐다.) 3. PCA 차원 수 정하기 4. Ridge 와 Lasso의 alpha값 이해하고 최적의 값 찾기 DATA LOAD¶ In [12]: import numpy as np import pandas as pd from sklearn.linear_model import LinearRegr.. 2021. 4. 19.
[쥬피터 노트북] pdf 변환 시 한글 깨짐 해결방법 https://hoho325.tistory.com/15 jupyter notebook(주피터 노트북) LaTex Pdf 변환시 한글 깨짐 해결 안녕하세요 호호만두에요 오늘은 주피터 노트북을 이용해볼거에요 저번에는 LaTex를 주피터 노트북에서 적용하는 방법에 대해서 알아보았는데요 이번에는 LaTex를 적용하여 PDF 생성시 한글 깨짐 hoho325.tistory.com 블로그에서 빠진 부분이 .tex 설명이다.. .tex파일을 쥬피터 노트북에서 pdf 만드는 곳으로 클릭해서 위쪽을 보면 tex 파일을 저장할 수 있다. 그것을 다운 받으면 알집과 이미지들이 압축되어 저장이 되고, 압축된것을 풀고 tex 파일을 열어서 위의 블로그가 추가해주라고 한 문구를 추가해주고 PLAY 처럼 생긴 버튼을 누르면 pdf .. 2020. 10. 4.
[케라스] early_stopping 개념 사용법 3months.tistory.com/424 Early Stopping 의 개념과 Keras 를 통한 구현 Early Stopping 이란 무엇인가? 딥러닝을 비롯한 머신러닝 모델의 한 가지 중요한 딜레마는 다음과 같다. 너무 많은 Epoch 은 overfitting 을 일으킨다. 하지만 너무 적은 Epoch 은 underfitting 을 일으킨다... 3months.tistory.com 2020. 10. 3.
[딥러닝 기초] Kaggle 연습 문제 Melbourne house pricing 예제를 통해서 전체 과정에 골격을 공부 할 수 있다. 1. 데이터 로딩 # Path of the file to read iowa_file_path = '../input/home-data-for-ml-course/train.csv' # Fill in the line below to read the file into a variable home_data home_data = pd.read_csv(iowa_file_path) pd.read_csv와 path 설정하는 것에 익숙해지자 2. 데이터 살펴보는 방법 home_data.describe() home_data.info() home_data.head() home_data.columns #columns OUTPUT Index(['Id', 'MSSubClass'.. 2020. 8. 4.
[LSTM] 시계열 데이터셋을 활용한 기온 예측 문제 1. 문제 정의 & 데이터 다운 -독일 예나 시에 있는 막스 플랑크 생물지구화학 연구소의 지상 관측소 수집 데이터 -14개의 관측치 데이터가 10분마다 기록되어 있음(2009~2016 데이터를 활용) #데이터 살펴보기 import os data_dir = 'C:/Users/82109/Desktop/example' #다운받은 폴더 경로 설정 fname = os.path.join(data_dir, 'jena_climate_2009_2016.csv') #파일 경로 설정 f = open(fname) # r, w, a 모드가 존재 data = f.read() f.close() print(type(data)) #str 형식으로 데이터가 저장되어 있다. #CSV 파일 형식 행은 "콤마" 로 열을 "\n"으로 나눠서 .. 2020. 7. 29.
[Bus Classification] ⑤ 결과 및 향후 연구 방향 결과에 말했지만, 실제로 사용되기에는 부족한 점이 많다. 시즌2처럼 2학기에는 거리+버스 번호판 인식등을 활용하여 시각장애인들에게 도움이 될만한 정보들을 제공하는 것을 목표로 해보겠다. 2020. 7. 12.
[Bus Classification] ④ 실험 2 mapo08ornot (binary classification) 버스 정류장에는 수많은 버스가 동시에 온다. 그 중에서 내가 타야할 버스를 찾아준다면 시각장애인들에게 도움이 될 수 있을 것이라고 생각했다. 아직 미흡하지만, 실제 촬영을 한 데이터를 활용해 볼 수 있었다. 2020. 7. 12.
[Bus Classification] ② Background knowledge 소규모 데이터를 잘 활용하기 위해, dataa rgumentation, feature extraction, imagenet을 통해 사전 훈련된 신경망 등을 활용하여 성능을 높여보려고 한다. 2020. 7. 11.