목록AI 개인 기초공부 (8)
공부집
보호되어 있는 글입니다.
df.fillna(value=0)nan을 0으로 채움 df3.apply(lambda x: x.max() - x.min())각 열의 최대-최소 , axis=1)각 행의 최대-최소 Pandas에서 제공하지 않는 기능을 추가하는 방법은 apply()를 쓰
arr = [ {'col1':1, 'col2':4}, {'col1':1, 'col2':9}, {'col1':3, 'col2':7}, {'col1':2, 'col2':8},] arr2 = pd.DataFrame(arr) print(arr2[ arr2['col1']==1 ]) ------------------------------- col1 col2 0 1 4 1 1 9
feature engineering #age가 Nan일때 Title별로 Age에 median을 써서 평균냄train["Age"].fillna(train.groupby("Title")["Age"].transform("median"), inplace=True)
import pandas as pdimport numpy as npfrom sklearn.cluster import KMeansimport matplotlib.pyplot as pltimport seaborn as snsget_ipython().run_line_magic('matplotlib', 'inline') df = pd.DataFrame(columns=['x', 'y'])#데이터 프레임 만들기 x축, y축df.loc[0] = [3,1]df.loc[1] = [4,1]df.loc[2] = [3,2]df.loc[3] = [4,2]df.loc[4] = [10,5]df.loc[5] = [10,6]df.loc[6] = [11,5]df.loc[7] = [11,6]df.loc[8] = [15,1]df.loc[9..
supervised 학습 : 이미 데이터를 제공 Un-supervised learning 가격은 앞의 3개 조건에 따라 변화하는 결과인데, 이 지역,평수,층수와 같은 조건을 Feature 또는 Attribute 라고 하며, 이 Feature에 따라 결정되는 값을 Targeted value(목적값)이라고 한다. regression : 연속적인 속성 값을 예측하려는 것 Classification problem : 몇 가지 값으로 한정Regression problem : 연속된 값 unsupervised learning은 data set을 기반으로 그룹을 나눈다 (클러스터링 알고리즘)정확한 답은 제시하지 않음 음성 분석 분리?[W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1)...
http://hunkim.github.io/ml https://www.facebook.com/notes/enjoydl/deep-leaning-video-links/1227281394020895 http://bcho.tistory.com/1150http://bcho.tistory.com/967?category=555440 코넬 대학 강의 http://www.cs.cornell.edu/courses/cs4780/2013fa/스탠포드 Cousera https://www.coursera.org/course/ml머신 러닝에 대해서 잘 정리해놓은 자료 http://sanghyukchun.github.io/ 코세라 앤드류교수님 강의를 정리해놓은 노트가 있어서 같이 보면 좋음Naive Bayes classificati..