목록데이터 분석/Practical Statistics for Data Scientist (5)
고래밥 이야기

# 데이터 불러오기 library(ggplot2) loans_income

데이터 불러오기 kc_tax = read.csv("kc_tax.csv") kc_tax0

데이터 불러오기 및 패키지 설치 install.packages("corrplot") library(corrplot) sp500_px = read.csv("sp500_data.csv",header=T,row.names = 1) sp500_sym = read.csv("sp500_sectors.csv",stringsAsFactors =F) etfs "2012-07-01",sp500_sym[sp500_sym$sector=="etf","symbol"]] row.names =1은 1번째 행을 row.names로 하겠다는 소리. 지정을 안하면 명칭이 'x'인 column이 생겨버린다. stringAsFactors는 말그대로 string을 Factor로 만들겠다는 소리이다. 여기서 row.names(sp500_px)>..

1-8 두 개 이상의 변수 탐색하기 데이터 불러오기 kc_tax = pd.read_csv("kc_tax.csv") kc_tax0 = kc_tax.loc[(kc_tax.TaxAssessedValue 100) & (kc_tax.SqFtTotLiving

1.7 상관관계 - 데이터 불러오기 import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt sp500_sym = pd.read_csv("sp500_sectors.csv") sp500_px = pd.read_csv("sp500_data.csv", index_col=0) index_col = 0 은 첫번째 열을 index로 지정하겠다는 소리이다. 실제로 결과를 확인해 본다면, sp500_px.index = Index(['1993-01-29', '1993-02-01', '1993-02-02', '1993-02-03', '1993-02-04', '1993-02-05', '1993-02-08', '199..