본문 바로가기
[DACON][6위 수상] 인공지능 비트 트레이더 경진대회 시즌2 https://dacon.io/competitions/official/235740/leaderboard 인공지능 비트 트레이더 경진대회 시즌3 출처 : DACON - Data Science Competition dacon.io 운좋게 최종 6위를 수상했습니다. 2021. 6. 16.
[NLP] Matrix Factorization + logistic Regression with python 이전의 결과물인 Matrix factorization으로 d차원 축소한 벡터들로 logistic regression 문제를 풀었다. 파이썬으로 logistic regression을 구현할 때에는 아래의 블로그를 많이 참고 하였다. wiserloner.tistory.com/780 Logistic Regression 개인정리 (파이썬 코드 구현) // 앞서 배운 로지스틱 회귀를 파이썬 코드로 구현해봅시다. [구현 순서] 1. training 데이터 준비 : slicing 또는 list comprehension 등을 이용하여 입력 x와 정답 t를 numpy 타입으로 분리합니다.(t는 0 또는 1 wiserloner.tistory.com 마지막 결과는 train의 비율에 따라 f1-score의 향상을 나타내는 .. 2021. 4. 29.
[머신러닝] Decision Tree, KNN, logistic Regression 실습 with python, sklearn 코로나 데이터를 활용해서 분류 문제를 실습하였다. 데이터에서 변수들이 Y값과 값는 상관관계가 매우 낮아서 성능이 좋지 않았다. 다양한 전처리를 하더라도, 성능이 좋지 않았다. DATA & Library LOAD¶ In [1]: import numpy as np import pandas as pd from sklearn.linear_model import LogisticRegression from sklearn.preprocessing import MinMaxScaler from sklearn.metrics import f1_score from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import train_test_s.. 2021. 4. 19.
[머신러닝] Linear Regression, Lasso, Ridge with python,sklearn 공정데이터를 전처리하여 Linear Regression, lasso, Ridge 모델들로 성능을 최적화 시키는 실습이였다. 데이터 전처리를 연습하고, K-fold, pca 등 활용해 볼 수 있는 실습이였다. 성능을 높이기 위해서 중요했던 것은 다음과 같다. 1. 데이터 전처리 (시계열 특성 반영) 2. K-fold로 성능 검증 ( 일반적인 랜덤 샘플링 이용한 방법 , cross-validation 모듈 결과가 조금씩 달랐다.) 3. PCA 차원 수 정하기 4. Ridge 와 Lasso의 alpha값 이해하고 최적의 값 찾기 DATA LOAD¶ In [12]: import numpy as np import pandas as pd from sklearn.linear_model import LinearRegr.. 2021. 4. 19.
[NLP] 파이썬으로 backpropagation 구현하기 (with different hidden layers) Data Load and Split¶ In [1]: import numpy as np data = np.loadtxt("training.txt") test_data = np.loadtxt("test.txt") print(data.shape) #shuffling the data np.random.shuffle(data) #spliting Data train_x = data[:,0:2] train_y = data[:,-1] print("train_x shape:"+str(train_x.shape)) print("train_y shape:"+str(train_y.shape)) val_x = test_data[:,0:2] val_y = test_data[:,-1] print("val_x shape:"+str(v.. 2021. 3. 31.
[LSTM] 시계열 데이터셋을 활용한 기온 예측 문제 1. 문제 정의 & 데이터 다운 -독일 예나 시에 있는 막스 플랑크 생물지구화학 연구소의 지상 관측소 수집 데이터 -14개의 관측치 데이터가 10분마다 기록되어 있음(2009~2016 데이터를 활용) #데이터 살펴보기 import os data_dir = 'C:/Users/82109/Desktop/example' #다운받은 폴더 경로 설정 fname = os.path.join(data_dir, 'jena_climate_2009_2016.csv') #파일 경로 설정 f = open(fname) # r, w, a 모드가 존재 data = f.read() f.close() print(type(data)) #str 형식으로 데이터가 저장되어 있다. #CSV 파일 형식 행은 "콤마" 로 열을 "\n"으로 나눠서 .. 2020. 7. 29.
[백준][파이썬] 2193번 이친수 규칙은 N-2번째까지의 합 + N0000 의 경우의 수를 합친것이였다. N = int(input()) #담을 공간 생성 numlist = [0 for i in range(91)] #초기값 설정 numlist[1] = 1 numlist[2] = 1 numlist[3] = 2 #규칙 찾기 for i in range(4,N+1): tem = 0 for j in range(i-1): tem += numlist[j] numlist[i] = tem+1 print(numlist[N]) 2020. 7. 28.
[백준][파이썬] 11057 오르막 수 쉬운 계단 수 문제와 거의 동일한 문제다. N = int(input()) #각 수마다 10개씩 값을 갖는다 dp = [[0 for i in range(10)] for j in range(1001)] #첫 시행 초기화 for i in range(0,10): dp[1][i] = 1 #점화식 규칙 for i in range(2,N+1): for j in range(10): tmp = 0 for k in range(j+1): tmp += dp[i-1][k] dp[i][j] = tmp print(sum(dp[N]) % 10007) 2020. 7. 28.
[Pandas] 기본 문법 1. Dataframe, series? import pandas as pd list_tmp = [1,2,3] #리스트를 통해 시리즈 생성 s1 = pd.core.series.Series([1,2,3]) s2 = pd.core.series.Series(['one','two','three']) #데이터 프레임 생성 pd.DataFrame(data = dict(num=s1,word=s2)) DataFrame - 2차원 시리즈 - 각각의 콜롬 2. csv 파일 읽어오기 import pandas as pd df = pd.read_csv('desktop/name.csv') print(df) #전체 출력 df.head(2) #앞에서 부터 보여주기 df.tail(3) #뒤에서 부터 보여주기 # 콤마가 아닌 TAP으로 .. 2020. 7. 26.