RLab05
# 선그래프의 작성
month <- c(1:12)
late <- c(5,8,7,9,4,6,12,13,8,6,6,4) #지각생생
length(late)
# 선그래프는 시계열자료의 내용을 파악하는 가장 기본적 방법
plot(
x = month,
y = late,
type = "l", #그래프의 종류(알파벳:l,o,s)
main = "지각생 통계",
lty = 1, #선의 종류 (line type:1,2..)
lwd = 1, #선의 굵기 (1, 2, 3..)
xlab = "달",
ylab = "지각 건수",
ylim = c(1,15) #y축의 범위 지정
)
month <- c(1:12)
late1 <- c(5,8,7,9,4,6,12,13,8,6,6,4) #지각생
late2 <- c(4,6,5,8,7,8,10,11,6,5,7,3)
length(late2)
plot(
x = month,
y = late1,
type = "o",
main = "지각생 통계",
lty = 1,
lwd = 1,
col = "red",
xlab = "달",
ylab = "지각 건수",
ylim = c(1,15)
)
# 기존 선그래프에 선그래프를 하나더 추가하는 방법으로
lines(
x = month,
y = late2,
type = "b",
col = "blue",
)
late3 <- c(1,2,3,4,5,1,10,15,2,4,2,2)
length(late3)
lines(
x = month,
y = late3,
type = "b",
col = "black",
)
# 2015년~2026년까지 예상 인구수 추계자료
year <- c(2015:2026)
pop <- c(51014, 51245, 51446, 51635, 51811, 51973,
52123, 52261, 52888, 52504, 52777, 51771)
length(year)
length(pop)
plot(
x = year,
y = pop,
main = "인구수 추계",
type = "b",
col = "red",
xlab = "연도",
ylab = "인구수",
)
library(ggplot2)
library(dplyr)
mpg <- as.data.frame(ggplot2::mpg)
#혼자서 해보기
# 상자 그림 그리기
df <- mpg %>%
filter(class %in% c("compact", "subcompact","suv"))
df
ggplot(data = df,
aes(x = class, y = cty))+
geom_boxplot()
RLab06
# 데이터 시각화 하기
# 산점도 만들기
x <- rnorm(100)
y <- 2 * x + rnorm(100)
plot(x, y, pch = 16,
main = "점 스타일 적용한 산점도")
plot(x, y,
pch = ifelse(x*y > 1, 16, 1),
main = "조건별로 점 스타일을 적용한 산점도")
z <- sqrt(1+x^2) + rnorm(100)
plot(x, y, pch =1,
xlim = range(x),
ylim = range(y,z),
xlab = "x",
ylab = "value")
points(x, z, pch = 17)
title("두 데이터 시리즈의 산점도")
plot(x, y, pch = 16, col = ifelse(y >= mean(y),"red","green"),
main = "조건별로 색상을 적용한 산점도")
# 선그래프 만들기
# 시계열 데이터는 선 그래프가 시간에 따른 추세와
# 변동을 모아 주기에 유용함
t <- 1:50
y <- 3 * sin(t * 60 + rnorm(t))
plot(t, y, type = "l",
main = "간단한 선 그래프")
install.packages("nycflights13")
install.packages("babynames")
data("flights", package = "nycflights13")
carriers <- table(flights$carrier)
carriers
sorted_carriers <- sort(carriers,decreasing = T)
sorted_carriers
barplot(head(sorted_carriers, 8),
ylim = c(0, max(sorted_carriers) * 1.1),
xlab = "carrier",
ylab = "flights",
main = "가장 많은 항공 편수를 기록한 상위 8개 항공사")
flight_speed <- flights$distance / flights$air_time
hist(flight_speed, main = "비행 속도의 히스토그램")