1.데이터분석 process.R //분석을 위한 6단계
# 1. 월마트의 경쟁사 타겟(Target)의 데이터 분석 사례
# 1)출산 예측 모델 개발
# - 목적 : 출산을 예측해서 유아용품 프로모션 제안하여 고객 선점
# - 필요한 데이터 : 영수증 데이터, 구매시점..
#
# 2. 데이터 분석 process
# 1) 문제 인식 (도메인 지식)
# 2) 가설 설정
# ex) 출산이 임박하면 기존에 사용하던 식재료, 옷장, 비타민 종류등을 변경할것이다.
# 3) 가설을 검증할 데이터 준비, 변수 설계
# ex) 최근 3개월간 구매한 비타민 중 신규 구매한 비타민 비율,
# 최근 3개월간 유아용 가구 구매횟수
# 4) 분석(가설 검정)
# : (머신러닝)알고리즘 적용, 모델링
# 5) 결과 해석
# : 예측의 정확성 평가,
# 변수별 중요도 파악 => 모델 개선에 활용
# 6) 결과의 활용방안 도출
# ex) 출산 확률이 몇%일때 프로모션 진행할지 기준 설정
# =>너무 높게 잡으면 : 데상이 적어 효과감소
# =>너무 낮게 잡으면 : 수익률 감소, 고객의 클레임 발생.
# 지역코드(LAWD_CD) 목록 생성
library(dplyr)
region_cd <- read.csv('region_cd.csv')
View(region_cd)
# %>% : 파이프 연산자(오퍼레이터)
install.packages("stringr")
library(stringr)
LAWD_CD <- region_cd %>% filter(str_detect(region,"서울특별시"))
head(LAWD_CD)