[ABOUT] 석사 1학기 마무리 & 여름 방학 계획 빠르다면 빨랐고 느리다면 느렸던 한 학기가 벌써 끝이 나고 있습니다. 생각보다 수업들이 힘들었고 과제가 정말 많았습니다. 3과목을 들었는데 2과목은 거의 매주 과제가 있었던 것 같습니다.. 입학을 하고 2월에 세웠던 1학기 목표를 보면서 1학기 생활에 대한 피드백을 해보려고 합니다. https://titanumm.tistory.com/119?category=957662 [ABOUT] 연세대학교 산업공학과 석사 1학기 목표 생각보다 석사 생활이 짧기 때문에 학기별로 목표를 뚜렷히 하는 것이 좋을 것 같다. 나는 석사 생활동안 논문 작성(제조 데이터 관련), 수상(캐글,Dacon), 자격증 (ADSP, ADP, 빅데이터 기사) 등을 목 titanumm.tistory.com 사실 1학기의 목표는 논문보다는 공.. 2021. 6. 6. [DACON][1위 수상] 로그 분석을 통한 보안 위험도 예측 AI 경진대회 조금 걱정을 했지만!!! 다행히 Private에 이어서 수상을 하게 되었습니다. 데이터 분석 대회에서 처음 1등을 했습니다. 앞으로도 더 열심히 해야 겠다는 생각이 듭니다. ㅎㅎ 코드 및 상세 내용은 github에 있습니다. https://github.com/hyeonggulim/DACON_LOG_Outlier_dectection/blob/main/README.md 2021. 5. 16. [NLP] Matrix Factorization + logistic Regression with python 이전의 결과물인 Matrix factorization으로 d차원 축소한 벡터들로 logistic regression 문제를 풀었다. 파이썬으로 logistic regression을 구현할 때에는 아래의 블로그를 많이 참고 하였다. wiserloner.tistory.com/780 Logistic Regression 개인정리 (파이썬 코드 구현) // 앞서 배운 로지스틱 회귀를 파이썬 코드로 구현해봅시다. [구현 순서] 1. training 데이터 준비 : slicing 또는 list comprehension 등을 이용하여 입력 x와 정답 t를 numpy 타입으로 분리합니다.(t는 0 또는 1 wiserloner.tistory.com 마지막 결과는 train의 비율에 따라 f1-score의 향상을 나타내는 .. 2021. 4. 29. [머신러닝] Linear Regression, Lasso, Ridge with python,sklearn 공정데이터를 전처리하여 Linear Regression, lasso, Ridge 모델들로 성능을 최적화 시키는 실습이였다. 데이터 전처리를 연습하고, K-fold, pca 등 활용해 볼 수 있는 실습이였다. 성능을 높이기 위해서 중요했던 것은 다음과 같다. 1. 데이터 전처리 (시계열 특성 반영) 2. K-fold로 성능 검증 ( 일반적인 랜덤 샘플링 이용한 방법 , cross-validation 모듈 결과가 조금씩 달랐다.) 3. PCA 차원 수 정하기 4. Ridge 와 Lasso의 alpha값 이해하고 최적의 값 찾기 DATA LOAD¶ In [12]: import numpy as np import pandas as pd from sklearn.linear_model import LinearRegr.. 2021. 4. 19. [데이터 분석 준전문가] ADSP 시험 합격 후기 공부는 한달정도 하루에 조금씩 공부했다. 사실 학부가 산업공학이 아니라, 데이터 분석이나 산업공학적인 무엇인가(?)를 공부할겸 ADP 를 따기 위해서 시험을 봤다. 생각보다 PART 1, PART2 는 처음 보는 내용들에 당황했고, R을 한번도 다뤄보지 않은 것 때문인지 고득점으로 이어지진 않았다. (다행히 ADP는 파이썬만 알아도 되는걸로 알고 있다) ADP이론을 공부하면서, 이번엔 내용을 조금 충실히 정리하면서 공부해 보려고 한다. 2021. 4. 9. 이전 1 다음