한번사는 인생 화끈하게!

전체 글

인생2막 2016. 11. 4. 19:06

2016. 11. 4. 19:06

출처: http://stackoverflow.com/questions/12190874/pandas-sampling-a-dataframe

Pandas에서 random sampling 할 수 있도록 함수 제공

- sample 함수이용

- df.sample(n=몇개의 row를 샘플할 것인지/sample 갯수 값)

인생2막 2016. 11. 4. 19:00

2016. 11. 4. 19:00

출처: http://stackoverflow.com/questions/22019763/pandas-writing-dataframe-columns-to-csv

header = ["Time", "User", "IP Address"]
df.to_csv('output.csv', columns = header)

- header라는 변수에 export하고 싶은 컬럼을 적어주면 원하는 컬럼만 csv로 export 할 수 있음

인생2막 2016. 11. 4. 18:55

2016. 11. 4. 18:55

출처 : https://www.dezyre.com/data-science-in-r-programming-tutorial/k-means-clustering-techniques-tutorial

- wss

출처: https://datasciencelab.wordpress.com/2013/12/12/clustering-with-k-means-in-python/

- 파이썬으로 구현한 k-means

출처: http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html

- scikit에서의 k-means 설명

출처: https://www.packtpub.com/books/content/k-means-clustering

- R에서 wssplot 그리는 것