RLab03

    # 상관 분석에 대해서 이해하기
    
    # 음주량
    beers <- c(5,2,9,8,3,7,3,5,3,5)
    # 혈중 알콜 농도
    bal <- c(0.1, 0.03, 0.19, 0.12, 0.04, 0.0095, 0.07, 0.06, 0.02, 0.05)
    length(beers)
    length(bal)
    
    data <- data.frame(beers,bal)
    
    # 산점도 그리기
    library(ggplot2)
    library(dplyr)
    plot(bal~beers, data = data)
    
    # lm() : 회귀식을 구하는 함수
    res <- lm(bal~beers, data = data)
    res
    #abline() : 회귀선을 그리는 함수
    abline(res)
    
    # cor() : 상관계수를 구하는 함수
    # -1 <=1 r <=1
    # -0.5보다 작거나 혹은 1에 가까울수록 상관도 높다.
    cor(beers, bal)
    
    # iris 데이터 셋 4개의 변수의 상관관계
    cor(iris[,1:4])
    
    mtcars
    # 연비를 가져옴
    mpg <- mtcars$mpg
    # 배기량을 가져옴
    disp <- mtcars$disp
    # 중량을 가져옴
    wt <- mtcars$wt
    
    # 산점도 그리기
    plot(x = mpg, y = disp)
    plot(x = mpg, y = wt)
    
    # 연비와 배기량의 상관계수 : -1에 가깝다
    cor(mpg, disp)
    # 연비와 중량의 상관계수 : -1에 가깝다
    cor(mpg, wt)
    
    str(mtcars)
    # 연비와 카브레터의 상관관계 : 
    carb <- mtcars$carb
    plot(x = mpg, y = carb)
    cor(mpg, carb)
    
    # 혼자서 해보기 193p
    library(ggplot2)
    library(dplyr)
    
    mpg <- as.data.frame(ggplot2::mpg)
    # 집단별 평균표구하기
    df <- mpg %>% 
      filter(class == "suv") %>% 
      group_by(manufacturer) %>% 
      summarise(mean_cty = mean(cty)) %>% 
      arrange(desc(mean_cty)) %>% 
      head(5)
    
    ggplot(data = df, aes(x = reorder(manufacturer, -mean_cty), y = mean_cty)) + geom_col()
    
    # 2)
    ggplot(data = mpg, aes(x = class))+ geom_bar()

    RLab04

    # 시계열 그래프 만들기
    install.packages("ggplot2")
    install.packages("dplyr")
    library(dplyr)
    library(ggplot2)
    View(economics)
    head(economics)
    economics
    ggplot(data = economics, aes(x = date, y = unemploy)) + 
      geom_line()
    ggplot(data = economics, aes(x = d))
    
    ggplot(data = economics, aes(x = date, y = psavert)) + 
      geom_bar()
    
    ggplot(data = mpg, aes(x = class))+ geom_bar()

     

    • 네이버 블러그 공유하기
    • 네이버 밴드에 공유하기
    • 페이스북 공유하기
    • 카카오스토리 공유하기
    loading