본문 바로가기
Data Science/머신러닝&딥러닝 기초 이론

[머신러닝] Linear Regression, Lasso, Ridge with python,sklearn

by titaniumm 2021. 4. 19.

공정데이터를 전처리하여 Linear Regression, lasso, Ridge 모델들로 성능을 최적화 시키는 실습이였다. 

데이터 전처리를 연습하고, K-fold, pca 등 활용해 볼 수 있는 실습이였다.

 

성능을 높이기 위해서 중요했던 것은 다음과 같다.

 

1. 데이터 전처리 (시계열 특성 반영)

2. K-fold로 성능 검증 ( 일반적인 랜덤 샘플링 이용한 방법 , cross-validation 모듈 결과가 조금씩 달랐다.)

3. PCA 차원 수 정하기

4. Ridge 와 Lasso의 alpha값 이해하고 최적의 값 찾기  

 

댓글