반응형
출처: http://stackoverflow.com/questions/12190874/pandas-sampling-a-dataframe
Pandas에서 random sampling 할 수 있도록 함수 제공
- sample 함수이용
- df.sample(n=몇개의 row를 샘플할 것인지/sample 갯수 값)
반응형
출처: http://stackoverflow.com/questions/12190874/pandas-sampling-a-dataframe
Pandas에서 random sampling 할 수 있도록 함수 제공
- sample 함수이용
- df.sample(n=몇개의 row를 샘플할 것인지/sample 갯수 값)
출처: http://stackoverflow.com/questions/22019763/pandas-writing-dataframe-columns-to-csv
header = ["Time", "User", "IP Address"] df.to_csv('output.csv', columns = header) |
- header라는 변수에 export하고 싶은 컬럼을 적어주면 원하는 컬럼만 csv로 export 할 수 있음
출처 : https://www.dezyre.com/data-science-in-r-programming-tutorial/k-means-clustering-techniques-tutorial
- wss
출처: https://datasciencelab.wordpress.com/2013/12/12/clustering-with-k-means-in-python/
- 파이썬으로 구현한 k-means
출처: http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html
- scikit에서의 k-means 설명
출처: https://www.packtpub.com/books/content/k-means-clustering
- R에서 wssplot 그리는 것