트리맵
GNI2014 국민총소득 데이터셋으로 트리맵 작성하기
사각타일의 형태로 구성되어 있으며,
각 타일의 크기와 색깔로 데이터의 크기를 나타냄
# 트리맵
install.packages("treemap")
#treemap 패키지 불러오기기
library("treemap")
data("GNI2014")
head(GNI2014)
dim(GNI2014)
treemap(
GNI2014,
index = c("continent", "iso3"), #계층구조 설정(대륙-국가)
vSize = "population", #타일의 크기(인구수)
vColor = "GNI", #타일의 컬러
type = "value", #타일의 컬러링(index, comp, dens)
bg.labels = "yellow",
title = "세계국가별 인구 소득"
)
# 인구는 아시아가 제일 높다.
# 소득은 미국과 유럽이 많이 높다.
# state.x77 데이터셋으로 트리맵 작성
# 메트릭스를 데이터프레임으로 변환
st <- data.frame(state.x77)
head(st)
# 주이름 열로 추가 (stname)
st <- data.frame(st, stname=rownames(st))
treemap(
st,
index = c("stname"), #계층구조 설정(주이름)
vSize = "Area", #타일의 크기(Area)
vColor = "Income", #타일의 컬러
type = "dens", #타일의 컬러링(index, comp, dens)
title = "미국 주별 면적 및 소득"
)
# 타일의 면적은 주의 면적
# 타일의 색은 주의 소득
# 알레스카가 면적도 크고 소득도 높다.
# ---------------------------------------------------
# 버블차트(buble chart) : 산점도 위에 버블의 크기로
# 정보를 표시하는 시각화 방법
# 3개의 변수정보를 하나의 그래프에 표시.
head(st)
st <- data.frame(state.x77)
symbols(st$Illiteracy, st$Murder, #원의 x,y좌표의 열
circles = st$Population,
inches = 0.3, #원의 크기
fg = "white", #원의 테두리 색
bg = "lightgray", #원의 바탕색
lwd = 1.5, #원의 테두리
xlab = "문맹률",
ylab = "범죄율",
main = "문맹률에 따른 범죄"
)
# 버블차트 글표시하기
text(st$Illiteracy, st$Murder,
rownames(st), #출력할 텍스트
cex = 0.6, #폰트 크기
col = "brown", #폰트 컬러
)
# 전반적으로 문맹률이 높아질수록 범죄율이 증가하는 추세.
# 인구수가 많은 주가 대첼고 범죄율도 높은 것을 확인.
# 범죄율이 가장 낮은 주는 North Dakota
#--------------------------------------------------------
# 모자이크 플롯 (mosic plot)
# : 다중변수 범주형 데이터에 대해 각 변수의 그룹별 비율을
# 면적으로 표시하여 정보를 전달.
head(mtcars)
mosaicplot(~gear+vs, # 대상변수 지정함. ~다음변수가 x축방향 표시,
# +다음변수가 y축방향으로 표시됨.
data = mtcars, #대상 데이터셋 지정함
color = c("green", "blue"), #y축 변수의 그룹별 음영을 달리 표시
main = "기어와 엔진"
)
# 기어의 개수가 가장 많은 경우는 3개이다.
# 기어의 개수가 5개는 드물다.
# 엔진의 형태는 0, 1정도가 반반정도 된다.
# 기어의 개수가 홀수인 경우는 0타입이 많고, 짝수인
# 경우 1이 훨씬 많다.