'Data Science/NLP' 카테고리의 글 목록

본문 바로가기

[NLP] Deepwalk + logistic Regression with python 이전의 결과물인 Deepwalk으로 d차원 축소한 벡터들로 logistic regression 문제를 풀었다. 파이썬으로 logistic regression을 구현할 때에는 아래의 블로그를 많이 참고 하였다. wiserloner.tistory.com/780 Logistic Regression 개인정리 (파이썬 코드 구현) // 앞서 배운 로지스틱 회귀를 파이썬 코드로 구현해봅시다. [구현 순서] 1. training 데이터 준비 : slicing 또는 list comprehension 등을 이용하여 입력 x와 정답 t를 numpy 타입으로 분리합니다.(t는 0 또는 1 wiserloner.tistory.com 마지막 결과는 train의 비율에 따라 f1-score의 향상을 나타내는 그래프이다. 데이터의 .. 2021. 4. 29.

[NLP] Matrix Factorization + logistic Regression with python 이전의 결과물인 Matrix factorization으로 d차원 축소한 벡터들로 logistic regression 문제를 풀었다. 파이썬으로 logistic regression을 구현할 때에는 아래의 블로그를 많이 참고 하였다. wiserloner.tistory.com/780 Logistic Regression 개인정리 (파이썬 코드 구현) // 앞서 배운 로지스틱 회귀를 파이썬 코드로 구현해봅시다. [구현 순서] 1. training 데이터 준비 : slicing 또는 list comprehension 등을 이용하여 입력 x와 정답 t를 numpy 타입으로 분리합니다.(t는 0 또는 1 wiserloner.tistory.com 마지막 결과는 train의 비율에 따라 f1-score의 향상을 나타내는 .. 2021. 4. 29.

[NLP] Matrix Factorization 구현하기 with 파이썬 추천 시스템의 바탕이 되는 Matrix factorization 이다. 결국 N 차원을 d 차원으로 축소했다가 다시 N 차원으로 만드는 과정이다. 하지만, N차원을 d차원으로 축소 한것이 N 차원을 잘 표현(?)해야한다... PCA(차원 축소) 오토 인코더와 비슷한점 차이점을 알면 좋을 것 같지만,, 차차 알아가보도록 하겠다. 이론적인 부분을 아래의 블로그를 참고했다. yeomko.tistory.com/5 갈아먹는 추천 알고리즘 [3] Matrix Factorization 지난 글 갈아먹는 추천 알고리즘 [1] 추천 알고리즘의 종류 갈아먹는 추천 알고리즘 [2] Collaborative Filtering 들어가며 지난 글에서 Collaborative Filtering에 대하여 자세히 알아보았습니다. 세부.. 2021. 4. 10.

[NLP] 파이썬으로 backpropagation 구현하기 (with different hidden layers) Data Load and Split¶ In [1]: import numpy as np data = np.loadtxt("training.txt") test_data = np.loadtxt("test.txt") print(data.shape) #shuffling the data np.random.shuffle(data) #spliting Data train_x = data[:,0:2] train_y = data[:,-1] print("train_x shape:"+str(train_x.shape)) print("train_y shape:"+str(train_y.shape)) val_x = test_data[:,0:2] val_y = test_data[:,-1] print("val_x shape:"+str(v.. 2021. 3. 31.

[NLP] 파이썬으로 backpropagation 구현하기 (without bias) NLP를 본격적으로 공부하기 전에, 딥러닝의 기본을 공부 할 수 있는 BACKPROPAGATION 을 구현해 보았다. 시그모이드 function을 활성화 함수로 활용하였고, SGD로 W1,W2 파라미터들을 업데이트 했다 8-hidden-layer 로 구성되어있다. Data Load and Split¶ In [1]: import numpy as np data = np.loadtxt("training.txt") print(data.shape) #shuffling the data np.random.shuffle(data) #spliting Data train_x = data[:,0:2] train_y = data[:,-1] print("train_x shape:"+str(train_x.shape)) print.. 2021. 3. 31.

이전 1 다음

티스토리툴바