코딩초보 김씨
[R] 다중변수 자료의 분석 - 복습 문제 & 정답 본문
[문제 1] 다음은 대학생 10명의 성적과 주당 TV 시청시간을 조사한 자료이다. 산점도와 상관계수를 구하고, 성적과 TV 시청시간 사이에 어떤 상관관계가 있는지 설명하시오.
[답변 1]
상관계수가 -1에 가깝기 때문에 음의 상관관계이며, 이는 tv 시청 시간이 길수록 성적이 안좋다고 볼 수 있다.
# 데이터 생성
score <- c(77.5,60,50,95,55,85,72.5,80,92.5,87.5)
tv_time <- c(14,10,20,7,25,9,15,13,4,21)
table <- data.frame(score,tv_time)
# scatter plot
plot(score, tv_time,
main="성적-tv 시청시간",
xlab="성적",
ylab="tv 시청시간",
col="red",
pch=19)
# 회귀식 도출
regressor_line <- lm(tv_time~score,data=table)
# 회귀선 그리기
abline(regressor_line)
# correlation coefficient
cor(score, tv_time)
> cor(score, tv_time)
[1] -0.6283671
[문제 2] 다음은 2014년 4분기부터 2017년 3분기까지 남녀 경제활동참가율을 나타낸 통계자료이다. 연도를 x축으로 하고 남녀를 각각 다른 선과 색으 로 표시하는 그래프를 작성하시오(2014년 4분기는 20144, 2015년 1분 기는 20151과 같은 형식으로 입력).
[답변 2]
# 데이터 생성
year <- c(20144,20151,20152,20153,20154,20161,20162,
20163,20164,20171,20172,20173)
male <- c(73.9,73.1,74.4,74.2,73.5,73,74.2,74.5,73.8,
73.1,74.5,74.2)
female <- c(51.4,50.5,52.4,52.4,51.9,50.9,52.6,52.7,
52.2,51.5,53.2,53.1)
plot(year, male,
main='남녀 경제활동 참가율',
type='b',
lty=1,
col='blue',
lwd=1,
xlab='연도',
ylab='참가율',
xlim=c(20144,20175),
ylim=c(40, 80)
)
lines(year, female,
type='b',
col='red')
'R' 카테고리의 다른 글
[R] 단일변수 자료의 분석 - 복습 문제 & 정답 (0) | 2021.06.21 |
---|---|
[R] 다중 변수 자료의 분석 (0) | 2021.06.21 |
[R] 조건문, 반복문, 함수 - 복습 문제 & 정답 (0) | 2021.06.19 |
[R] 행렬과 데이터프레임 - 복습 문제 & 정답 (0) | 2021.06.19 |
[R] 단일변수 자료의 분석,탐색 방법 (0) | 2021.06.18 |
Comments