본문 바로가기
[파이썬] 폴더에 있는 엑셀(excel) 읽기, format 활용하기 상황에 따라서 수백~수만개의 엑셀 파일을 판다스 dataframe로 받아서 사용해야 한다. 이럴때 listdir을 사용한다. listdir은 파일에 있는 엑셀 이름을 모두 읽어 오고 그 이름들을 가지고 파일을 순차적으로 리스트에 저장한다. 이름들을 불러오고 리스트에 저장해서 순서를 바꾸거나 하면 원하는 파일순으로 데이터를 불러 올 수 있다. 2020. 10. 24.
[파이썬][pandas] 엑셀 모여있는 폴더에서 필요한 정보들 추출하기 http://hleecaster.com/excel-crawling-with-python/ 파이썬으로 여러개의 엑셀 파일에서 필요한 값들만 한 번에 가져오기 (엑셀 크롤링) - 아무튼 워� 파이썬으로 동일한 양식의 엑셀파일에서 필요한 값만 긁어 모아 새로운 엑셀파일로 저장하는 코드를 짜보았다. hleecaster.com 2020. 9. 28.
[파이썬][pandas] 쥬피터 노트북에서 생략 없이 보는 방법 http://pertinency.blogspot.com/2019/03/pandas.html Pandas를 쓰다가 찾게 된 것들 0. 엑셀 쓰면 되는거 아닌가? 왜 Pandas같은걸 쓰는거지? 싶다가.. 강력한 파이썬의 기능들을 응용할 수 있다는 점, 내가 맘대로 데이터를 주무를 수 있다는 점 등등 때문에 결국 Pandas를 사용하게 �� pertinency.blogspot.com 2020. 9. 28.
[파이썬] Matplotlib 그리는 방법 - 참고용 https://bcho.tistory.com/1201 파이썬을 이용한 데이타 시각화 #1 - Matplotlib 기본 그래프 그리기 파이썬을 이용한 데이타 시각화 #1 - Matplotlib 기본 그래프 그리기 조대협 (http://bcho.tistory.com) 백앤드 엔지니어와 백그라운드를 가진 경험상, 머신러닝을 공부하면서 헷갈렸던 부분중 하나가, 데�� bcho.tistory.com 2020. 9. 16.
[panas] 결측치 채우기 - 설명 블로그 https://m.blog.naver.com/youji4ever/221791455668 2020. 9. 2.
[Pandas] 기본 문법 1. Dataframe, series? import pandas as pd list_tmp = [1,2,3] #리스트를 통해 시리즈 생성 s1 = pd.core.series.Series([1,2,3]) s2 = pd.core.series.Series(['one','two','three']) #데이터 프레임 생성 pd.DataFrame(data = dict(num=s1,word=s2)) DataFrame - 2차원 시리즈 - 각각의 콜롬 2. csv 파일 읽어오기 import pandas as pd df = pd.read_csv('desktop/name.csv') print(df) #전체 출력 df.head(2) #앞에서 부터 보여주기 df.tail(3) #뒤에서 부터 보여주기 # 콤마가 아닌 TAP으로 .. 2020. 7. 26.
[파이썬] random 모듈 randint, randn, rand https://nittaku.tistory.com/443 python random모듈 3개 정리 (randint, rand, randn) 블로그정리 1. np.random모듈 numpy 의 np.random. randint vs rand/randn ¶ np.random.seed seed를 통한 난수 생성 np.random.randint 균일 분포의 정수 난수 1개 생성 np.random.ran.. nittaku.tistory.com 2020. 4. 30.
[파이썬] gzip , rb, savez mnist에서 파일을 저장하고 읽을 때 gzip 과 정체로를 'rb'를 따라서 입력했었다. gzip은 압축파일을 다룰 때 사용하는 것이고 rb 는 저장형식(?) 으로 볼 수 있다. R:read W: write a:추가 +: 수정 t : text b : 바이너리 따라서 'rb' 는 읽기전용 바이너리 파일로 저장하라는 뜻이다. 디폴트는 rt라고 한다. 밑에 minst를 zip에서 불러와서 저장 하는 코드이다. import gzip import numpy as np fnames =['train-images-idx3-ubyte.gz','train-labels-idx1-ubyte.gz','t10k-images-idx3-ubyte.gz','t10k-labels-idx1-ubyte.gz'] with gzip.open.. 2020. 4. 29.
[파이썬] matplotlib 기본 그리기 연습 익숙해질때까지~ import numpy as np import matplotlib.pyplot as plt #간단한 그래프 그리기 x = np.arange(0,6,0.1) y = np.sin(x) plt.plot(x,y) plt.show() x = np.arange(0,10,0.1) y = np.sin(x) plt.plot(x,y) plt.show() #pyplot x = np.arange(0,6,0.1) y1 = np.sin(x) y2 = np.cos(x) plt.plot(x,y1,label='sin') plt.plot(x,y2,linestyle="--",label = "cos") #점선 plt.xlabel("x") plt.ylabel("y") plt.title("sin & cos") plt.legen.. 2020. 4. 22.