1.데이터분석 process.R  //분석을 위한 6단계

    # 1. 월마트의 경쟁사 타겟(Target)의 데이터 분석 사례
    #   1)출산 예측 모델 개발
    #     - 목적 : 출산을 예측해서 유아용품 프로모션 제안하여 고객 선점
    #     - 필요한 데이터 : 영수증 데이터, 구매시점..
    # 
    # 2. 데이터 분석 process 
    #   1) 문제 인식 (도메인 지식)
    #   2) 가설 설정 
    #       ex) 출산이 임박하면 기존에 사용하던 식재료, 옷장, 비타민 종류등을 변경할것이다.
    #   3) 가설을 검증할 데이터 준비, 변수 설계
    #       ex) 최근 3개월간 구매한 비타민 중 신규 구매한 비타민 비율,
    #           최근 3개월간 유아용 가구 구매횟수
    #   4) 분석(가설 검정)
    #       : (머신러닝)알고리즘 적용, 모델링
    #   5) 결과 해석
    #       : 예측의 정확성 평가,
    #         변수별 중요도 파악 => 모델 개선에 활용
    #   6) 결과의 활용방안 도출
    #       ex) 출산 확률이 몇%일때 프로모션 진행할지 기준 설정
    #           =>너무 높게 잡으면 : 데상이 적어 효과감소
    #           =>너무 낮게 잡으면 : 수익률 감소, 고객의 클레임 발생.
    
    # 지역코드(LAWD_CD) 목록 생성
    library(dplyr)
    region_cd <- read.csv('region_cd.csv')
    View(region_cd)
    
    # %>% : 파이프 연산자(오퍼레이터)
    install.packages("stringr")
    library(stringr)
    LAWD_CD <- region_cd %>% filter(str_detect(region,"서울특별시"))
    head(LAWD_CD)
    
    
    
    
    
    • 네이버 블러그 공유하기
    • 네이버 밴드에 공유하기
    • 페이스북 공유하기
    • 카카오스토리 공유하기
    loading