RLab03
# 상관 분석에 대해서 이해하기
# 음주량
beers <- c(5,2,9,8,3,7,3,5,3,5)
# 혈중 알콜 농도
bal <- c(0.1, 0.03, 0.19, 0.12, 0.04, 0.0095, 0.07, 0.06, 0.02, 0.05)
length(beers)
length(bal)
data <- data.frame(beers,bal)
# 산점도 그리기
library(ggplot2)
library(dplyr)
plot(bal~beers, data = data)
# lm() : 회귀식을 구하는 함수
res <- lm(bal~beers, data = data)
res
#abline() : 회귀선을 그리는 함수
abline(res)
# cor() : 상관계수를 구하는 함수
# -1 <=1 r <=1
# -0.5보다 작거나 혹은 1에 가까울수록 상관도 높다.
cor(beers, bal)
# iris 데이터 셋 4개의 변수의 상관관계
cor(iris[,1:4])
mtcars
# 연비를 가져옴
mpg <- mtcars$mpg
# 배기량을 가져옴
disp <- mtcars$disp
# 중량을 가져옴
wt <- mtcars$wt
# 산점도 그리기
plot(x = mpg, y = disp)
plot(x = mpg, y = wt)
# 연비와 배기량의 상관계수 : -1에 가깝다
cor(mpg, disp)
# 연비와 중량의 상관계수 : -1에 가깝다
cor(mpg, wt)
str(mtcars)
# 연비와 카브레터의 상관관계 :
carb <- mtcars$carb
plot(x = mpg, y = carb)
cor(mpg, carb)
# 혼자서 해보기 193p
library(ggplot2)
library(dplyr)
mpg <- as.data.frame(ggplot2::mpg)
# 집단별 평균표구하기
df <- mpg %>%
filter(class == "suv") %>%
group_by(manufacturer) %>%
summarise(mean_cty = mean(cty)) %>%
arrange(desc(mean_cty)) %>%
head(5)
ggplot(data = df, aes(x = reorder(manufacturer, -mean_cty), y = mean_cty)) + geom_col()
# 2)
ggplot(data = mpg, aes(x = class))+ geom_bar()
RLab04
# 시계열 그래프 만들기
install.packages("ggplot2")
install.packages("dplyr")
library(dplyr)
library(ggplot2)
View(economics)
head(economics)
economics
ggplot(data = economics, aes(x = date, y = unemploy)) +
geom_line()
ggplot(data = economics, aes(x = d))
ggplot(data = economics, aes(x = date, y = psavert)) +
geom_bar()
ggplot(data = mpg, aes(x = class))+ geom_bar()