코딩초보 김씨

[R] 다중변수 자료의 분석 - 복습 문제 & 정답 본문

R

[R] 다중변수 자료의 분석 - 복습 문제 & 정답

초보김씨 2021. 6. 21. 17:14

[문제 1] 다음은 대학생 10명의 성적과 주당 TV 시청시간을 조사한 자료이다. 산점도와 상관계수를 구하고, 성적과 TV 시청시간 사이에 어떤 상관관계가 있는지 설명하시오.

 

 

[답변 1] 

상관계수가 -1에 가깝기 때문에 음의 상관관계이며, 이는 tv 시청 시간이 길수록 성적이 안좋다고 볼 수 있다.

# 데이터 생성
score <- c(77.5,60,50,95,55,85,72.5,80,92.5,87.5)
tv_time <- c(14,10,20,7,25,9,15,13,4,21)
table <- data.frame(score,tv_time)

# scatter plot
plot(score, tv_time,
     main="성적-tv 시청시간",
     xlab="성적",
     ylab="tv 시청시간",
     col="red",
     pch=19)

# 회귀식 도출
regressor_line <- lm(tv_time~score,data=table)

# 회귀선 그리기
abline(regressor_line)

# correlation coefficient
cor(score, tv_time)

> cor(score, tv_time)
[1] -0.6283671

 

 

 


 

[문제 2] 다음은 2014년 4분기부터 2017년 3분기까지 남녀 경제활동참가율을 나타낸 통계자료이다. 연도를 x축으로 하고 남녀를 각각 다른 선과 색으 로 표시하는 그래프를 작성하시오(2014년 4분기는 20144, 2015년 1분 기는 20151과 같은 형식으로 입력).

 

[답변 2]

# 데이터 생성
year <- c(20144,20151,20152,20153,20154,20161,20162,
          20163,20164,20171,20172,20173)
male <- c(73.9,73.1,74.4,74.2,73.5,73,74.2,74.5,73.8,
         73.1,74.5,74.2)
female <- c(51.4,50.5,52.4,52.4,51.9,50.9,52.6,52.7,
            52.2,51.5,53.2,53.1)

plot(year, male,
     main='남녀 경제활동 참가율',
     type='b',
     lty=1,
     col='blue',
     lwd=1,
     xlab='연도',
     ylab='참가율',
     xlim=c(20144,20175),
     ylim=c(40, 80)
)

lines(year, female,
      type='b',
      col='red')

Comments