코딩초보 김씨
[R] 단일변수 자료의 분석 - 복습 문제 & 정답 본문
[문제 1] 학생 A의 과목별 성적이 다음과 같을 때 각 문제를 해결하기 위한 R 코드를 작성하시오.
(1) 위 데이터를 score 벡터에 저장하시오(과목명은 데이터 이름으로 저장).
(2) score 벡터의 내용을 출력하시오.
(3) 전체 성적의 평균과 중앙값을 각각 구하시오.
(4) 전체 성적의 표준편차를 출력하시오.
(5) 가장 성적이 높은 과목의 이름을 출력하시오.
(6) 성적에 대한 상자그림을 작성하고, 이상치에 해당하는 과목이 있으면 출력하시오.
(7) 다음 조건을 만족하는 위 성적에 대한 히스토그램을 작성하시오. (그래프 제목: 학생 성적, 막대의 색: 보라색)
[답변 1]
(1) 위 데이터를 score 벡터에 저장하시오(과목명은 데이터 이름으로 저장).
score <- c(90,85,73,80,85,65,78,50,68,96)
names(score) <- c("KOR","ENG","ATH","HIST","SOC","MUSIC","BIO","EARTH","PHY","ART")
(2) score 벡터의 내용을 출력하시오.
score
(3) 전체 성적의 평균과 중앙값을 각각 구하시오.
# 평균값
mean(score)
# 중앙값
median(score)
> # 평균값
> mean(score)
[1] 77
> # 중앙값
> median(score)
[1] 79
(4) 전체 성적의 표준편차를 출력하시오.
sd(score)
> sd(score)
[1] 13.49074
(5) 가장 성적이 높은 과목의 이름을 출력하시오.
which.max(score)
> which.max(score)
ART
10
(6) 성적에 대한 상자그림을 작성하고, 이상치에 해당하는 과목이 있으면 출력하시오.
이상치 없음!!
boxplot(score, main="성적")
(7) 다음 조건을 만족하는 위 성적에 대한 히스토그램을 작성하시오. (그래프 제목: 학생 성적, 막대의 색: 보라색)
hist(score,
main="학생 성적",
xlab ="성적",
ylab="빈도수",
border="black",
col="purple")
[문제 2] R에서 제공하는 trees 데이터셋에 대해 다음 문제를 해결하기 위한 R 코드를 작성하시오.
(1) trees 데이터셋의 앞쪽 일부 데이터만 출력하시오.
(2) 나무 지름(Girth)의 평균값, 중앙값, 절사평균값(절사범위: 15%), 표준편차를 각각 구하시오.
(3) 나무 지름(Girth)에 대해 히스토그램을 작성하시오.
(4) 나무 지름(Girth)에 대해 상자그림을 작성하시오.
(5) 나무 높이(Height)의 평균값, 중앙값, 절사평균값(절사범위: 15%), 표준편차를 각각 구하시오.
(6) 나무 높이(Height)에 대해 히스토그램을 작성하시오.
(7) 나무 높이(Height)에 대해 상자그림을 작성하시오.
[답변 2]
(1) trees 데이터셋의 앞쪽 일부 데이터만 출력하시오.
head(trees)
(2) 나무 지름(Girth)의 평균값, 중앙값, 절사평균값(절사범위: 15%), 표준편차를 각각 구하시오.
mean(trees$Girth)
median(trees$Girth)
mean(trees$Girth, trim=0.15)
sd(trees$Girth)
> mean(trees$Girth)
[1] 13.24839
> median(trees$Girth)
[1] 12.9
> mean(trees$Girth, trim=0.15)
[1] 13.04348
> sd(trees$Girth)
[1] 3.138139
(3) 나무 지름(Girth)에 대해 히스토그램을 작성하시오.
hist(trees$Girth,
main="나무 지름(Girth)",
xlab ="Girth",
ylab="Frequency",
border="black",
col="brown",
breaks=5)
(4) 나무 지름(Girth)에 대해 상자그림을 작성하시오.
boxplot(trees$Girth, main="나무 지름(Girth)")
(5) 나무 높이(Height)의 평균값, 중앙값, 절사평균값(절사범위: 15%), 표준편차를 각각 구하시오.
mean(trees$Height)
median(trees$Height)
mean(trees$Height, trim=0.15)
sd(trees$Height)
> mean(trees$Height)
[1] 76
> median(trees$Height)
[1] 76
> mean(trees$Height, trim=0.15)
[1] 76.3913
> sd(trees$Height)
[1] 6.371813
(6) 나무 높이(Height)에 대해 히스토그램을 작성하시오.
hist(trees$Height,
main="나무 높이(Height)",
xlab ="Height",
ylab="Frequency",
border="black",
col="brown",
breaks=5)
(7) 나무 높이(Height)에 대해 상자그림을 작성하시오.
boxplot(trees$Height, main="나무 높이(Height)")
'R' 카테고리의 다른 글
[R] 다중변수 자료의 분석 - 복습 문제 & 정답 (0) | 2021.06.21 |
---|---|
[R] 다중 변수 자료의 분석 (0) | 2021.06.21 |
[R] 조건문, 반복문, 함수 - 복습 문제 & 정답 (0) | 2021.06.19 |
[R] 행렬과 데이터프레임 - 복습 문제 & 정답 (0) | 2021.06.19 |
[R] 단일변수 자료의 분석,탐색 방법 (0) | 2021.06.18 |