목록데이터 분석/머신러닝 교과서 with 파이썬, 사이킷런, 텐서플로 (3)
고래밥 이야기

머신러닝 교과서 with 파이썬, 사이킷런, 텐서플로를 참고하여 작성하였습니다. # 안보고 코드를 구현하려고 노력하였기에 변수가 각각 틀릴 수도 있습니다.. # 코드 다 암기하기. 실력이 급하다. # 10.2의 데이터를 불러와 사용하였습니다. 경사 하강법으로 회귀 모델의 파라미터 구하기 import numpy as np class LinearRegressionGD: def __init__(self, lr=0.001, n_iter=50): self.lr = lr self.n_iter = n_iter # 초기 값 설정, learning rate는 0.001로, n_iter=50으로 잡는다. def fit(self, X, y): self.w_ = np.zeros(1 + X.shape[1]) # w0, w1 ...

머신러닝 교과서 with 파이썬, 사이킷런, 텐서플로를 참고하여 작성하였습니다. # 안보고 코드를 구현하려고 노력하였기에 변수가 각각 틀릴 수도 있습니다.. # 코드 다 암기하기. 실력이 급하다. 데이터 불러오기 import pandas as pd df1 = pd.read_csv('https://raw.githubusercontent.com/rickiepark/' 'python-machine-learning-book-3rd-edition' '/master/ch10/housing.data.txt',sep="\s+",header=None) # header = None은 column이름을 지정하지 않겠다는 소리이며, sep="\s+"는 빈칸(space bar)을 기준으로 나누겠다는 소리이다. print(df1..

머신러닝 교과서 with 파이썬, 사이킷런, 텐서플로를 참고하여 작성하였습니다. # 안보고 코드를 구현하려고 노력하였기에 변수가 각각 틀릴 수도 있습니다.. # 코드 다 암기하기. 실력이 급하다. 단일 분류기보다 앙상블이 더 오차가 적다는 것을 이항 분포를 통해서 보이기 from scipy.special import comb # 조합을 활용할 때 사용된다. combination의 comb이다. import math def ensemble_error(n_classifier, error): k_start = math.ceil(n_classifier / 2) # 분류기 개수의 절반 이상이 예측이 틀린다면, 전체가 틀렸다고 할수 있으므로..! 가령 11개라면 6개 이상이 틀려야만이 앙상블이 틀린 것이다. pro..