lab01
# 플롯팅
# plot()함수를 이용하여 만든다.
data()
women
w <- women$weight
plot(w)
h <- women$height
plot(h)
#par() : 그래프의 모양을 다양하게 조정할수 있는 그래프의 인수들을 설정,조회 하는 함수수
par(bg='yellow')
par(fg="red")
plot(h,w,xlab = "키",ylab = "몸무게게",main = "여성의 평균키와 몸무게",sub="미국의 70년대 기준")
plot(h,w,xlab = "키",ylab = "몸무게게",main = "여성의 평균키와 몸무게",sub="미국의 70년대 기준",
type= "l") # l : 그래프 모양을 선으로 표시
plot(h,w,xlab = "키",ylab = "몸무게게",main = "여성의 평균키와 몸무게",sub="미국의 70년대 기준",
type= "p") # p : 그래프 모양을 점으로 표시
plot(h,w,xlab = "키",ylab = "몸무게게",main = "여성의 평균키와 몸무게",sub="미국의 70년대 기준",
type= "b") # p : 그래프 모양을 선과 점으로 표시
plot(h,w,xlab = "키",ylab = "몸무게게",main = "여성의 평균키와 몸무게",sub="미국의 70년대 기준",
type= "s") # s : 그래프 모양을 계단형으로 표시
plot(0:10, 0:10, main = "PLOT",
sub = "TEST",
xlab = "x-Label",
ylab = "y-Label",
type = "n",)
par(bg="transparent")
plot(0:10, 0:10, main = "PLOT",
sub = "TEST",
xlab = "x-Label",
ylab = "y-Label",
type = "n",)
# points() 함수 : 점을 그리는 함수
p <- c(9,1)
points(p,pch=1,cex=2)
points(p,pch=2,cex=2)
points(p,pch=3,cex=2)
points(p,pch=23,cex=2)
weight <- women$weight
height <- women$height
plot(height, weight, xlab = "키",
ylab="몸무게", pch=20,
cex=2.5, col="blue", bg="yellow")
lab02
# 다중변수 자료의 분석과 탐색
# 선점도 : 2개의 변수로 구성된 자료의 분포를 알아보는 그래프
mtcars
View(mtcars)
class(mtcars)
str(mtcars)
summary(mtcars)
head(mtcars)
wt <- mtcars$wt #중량자료 추출
mpg <- mtcars$mpg #연비 추출
# plot() : 2개의 변수를 가지고 산점도를 그림.
plot(x= wt,
y= mpg,
main = "중량-연비 그래프",
xlab ="중량",
ylab ="연비",
col="red",
pch = 19)
# 다중 변수들간의 산점도를 그릴떄 사용 함수 : pairs()
vars <- c("mpg", "disp", "drat", "wt")
target <- mtcars[,vars]
class(target)
pairs(x = target,
main = "다중변수 산점도")
lab03
# 데이터 그리기
# 1. plot() : 산정도 그래프
# 2. pairs() : 행렬 산정도 그래프
# 3. hist() : 히스토그램 그래프
# 4. barplot() : 막대 그래프
# 5. pie() : 파이 그래프
# 6. boxplot : 상자그림 그래프
# 데이터 그리기 주요 옵션
# main : 그래프 이름
# col : 색상
# xlab, ylab : x축과 y축 이름
# xlim, ylim : x축과 y축 범위
# pch : 점의 종류
# cex : 점 크기
# type : 그래프 유형, 점(p), 선(l), 점선모두(b)
# lty : 선유형 (dotted)
# plot() : 산점도 그리기 (데이터를 x축 y축에 점으로 표시하는 그래프프)
plot(iris$Petal.Length) #꽃잎길이
plot(iris$Petal.Length, iris$Petal.Width,
main = "iris data",
xlab = "꽃잎길이",
ylab = "꽃잎넓이",
col = iris$Species) #꽃잎길이, 꽃잎넓이
head(iris)
pairs(~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
data = iris,
col = iris$Species)
#hist() : 히스토그램
# 값의 범위마다 빈도를 표현한 것
# 데이터가 모여 있는 정도(분포)를 확인하기에 좋음
hist(iris$Sepal.Width, freq = F)
# barplot() : 데이터 크기를 막대 길이로 표현한 것
# 집단 간 차이를 확인하고자 할때 유용함
# 품종별 꽃잎 길이의 평균 구함.
x <- aggregate(Petal.Length ~ Species, iris, mean)
barplot(x$Petal.Length, names = x$Species)
# pie() : 데이터 비율을 표현하는데 유용함
# 품종별로 꽃잎 길이 합
x <- aggregate(Petal.Length ~ Species, iris, sum)
# 품종 이름을 붙여 파이그래프로 그림
pie(x$Petal.Length, label = x$Species)
# boxplot() : 상자그림 그리기
boxplot(iris$Sepal.Width) # 꽃 받침 넓이의 데이터 분포를 볼수 있다.