lab08
# cat() 함수 : 숫자나 문자를 결합하여 출력하는데, 외부결과 출력용으로도 응용할수 있음.
connect <- file("result.txt", "m") # 파일 설정
x <- iris$Sepal.Length # 파일 설정
x
cat(summary(x),file = connect) # summery 함수의 결과를 파일에 기록
close(connect) # 파일 종료
#데이터셋 확인하기 주요 함수
head() : #데이터셋 앞부분 출력
tail() : #데이터셋 뒷부분 출력
str() : #데이터셋 구조 출력
summary() : #요약 통계량 출력력
View() : #소스 창으로 데이터와 구조 확인
dim() : #열과 행, 차원의 개수를 샘샘
ncol() : #열의 개수를 샘
nrow() : #행의 개수를 샘샘
length() : #백터 길이를 반환, 리스트나 데이터프레임에서도 사용가능
ls() : #지정된 전체변수(객체)를 보여줌줌
View(iris)
summary(iris)
# iris 데이터셋 구조
# 열이름 의미 클래스
# -----------------------------------------------------------
# species 품종 팩터구조조
# Sepal.Width 꽃바침 넒이 숫자형(number)
# Sepal.Length 꽃바침 길이 숫자형(number)
# Petal.Width 꽃잎 넒이 숫자형(number)
# Petal.Length 꽃잎 길이 숫자형(number)
head(iris)
head(iris,10)
tail(iris)
summary(iris)
# 요약 통계량 의미
# 요약 통계량 의미 설명
# -----------------------------------------------
# min 최소값 데이터에서 가장 작은값
# 1st Qu 1사분위수 하위 25%의 위치값
# median 중앙값 50% 중앙의 위치 값
# mean 평균 모든 값을 더해서 개수로 나눈 값
# 3rd Qu 3사분위수 하위 75%의 위치 값
# Max 최대값 데이터에서 가장 큰 값
summary(iris$Sepal.Length)
str(iris)
dim(iris) #R에서 기본 출력 기준은 행부터임.
nrow(iris)
ncol(iris)
length(iris) #iris의 열의 길이 셈.
ls() #변수 목록을 확인인
# 데이터 조작 주요 함수
# 함수 설명
# -------------------------------------------------------------
# rbind() 데이터 값을 행으로 취급하여 합침
# cbind() 데이터 값을 열로 취급하여 합침
# split() 분리할 열 팩터를 기준으로 분리
# subset() 조건식으로 데이터를 추출
# substr() 데이터에서 일부 문자열을 선택해서 추출출
# merge() 데이터프레임을 행이름이나 열이름으로 합침
# sort() 데이터 값의 순서를 정렬, 기본은 오름차순.
# order() 데이터 값의 순서 인덱스를 반환, 기본은 오름차순
# unique() 유일값을 반환
# rm() 변수(개체)를 삭제
x <- c(1,2,3,4,5)
y <- c(6,7,8,9,10)
rbind(x,y)
cbind(x,y)
split(iris, iris$Species)
subset(iris, iris$Sepal.Length >= 7) #조건에 만족하는것만 출력력
substr(iris$Species,1,3) #특정 문자열만 선택
plot(iris$Petal.Length) #꽃잎길이 이미지로
pairs()
hist(iris$Sepal.Width) #꽃받침 넓이
boxplot(iris$Sepal.Width) #최소값 최대값