어떤 반응값에 2가지의 설명변수만 넣었을때는 유의하지 않았던 인자가 ( PerfRatioMed,ADCepi)
같은 반응값에 4가지의 설명 변수를 넣었더니 유의하게 바뀌었습니다.
confounder effect로 생각해서 다중공선성을 살펴보았는데, 특별한 사항이 없었습니다.
어떻게 이해해야 할지 모르겠습니다.
> fit<-lm(DI0.3~PDR.in.central.ephysis+PerfRatioMed,data=LCP)
> summary(fit)
Call:
lm(formula = DI0.3 ~ PDR.in.central.ephysis + PerfRatioMed, data = LCP)
Residuals:
Min 1Q Median 3Q Max
-0.5291 -0.4136 -0.1998 0.3801 0.8964
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.2260148 0.1346602 1.678 0.1005
PDR.in.central.ephysis 0.0072108 0.0031079 2.320 0.0251 *
PerfRatioMed -0.0015097 0.0007537 -2.003 0.0515 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.453 on 43 degrees of freedom
Multiple R-squared: 0.1945, Adjusted R-squared: 0.1571
F-statistic: 5.192 on 2 and 43 DF, p-value: 0.009555
> fit<-lm(DI0.3~ADR.in.metaphysis+ADCepi,data=LCP)
> summary(fit)
Call:
lm(formula = DI0.3 ~ ADR.in.metaphysis + ADCepi, data = LCP)
Residuals:
Min 1Q Median 3Q Max
-1.1044 -0.2712 -0.1426 0.3596 0.7451
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.002722 0.120065 0.023 0.982018
ADR.in.metaphysis 0.007409 0.001860 3.983 0.000258 ***
ADCepi 0.000441 0.000871 0.506 0.615216
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.4209 on 43 degrees of freedom
Multiple R-squared: 0.3048, Adjusted R-squared: 0.2725
F-statistic: 9.429 on 2 and 43 DF, p-value: 0.0004024
> fit<-lm(DI0.3~PDR.in.central.ephysis+PerfRatioMed+ADR.in.metaphysis+ADCepi,data=LCP)
> summary(fit)
Call:
lm(formula = DI0.3 ~ PDR.in.central.ephysis + PerfRatioMed +
ADR.in.metaphysis + ADCepi, data = LCP)
Residuals:
Min 1Q Median 3Q Max
-0.83068 -0.20354 -0.08403 0.27185 0.64545
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.2357246 0.1359272 -1.734 0.09040 .
PDR.in.central.ephysis 0.0076449 0.0024446 3.127 0.00324 **
PerfRatioMed -0.0020127 0.0006146 -3.275 0.00215 **
ADR.in.metaphysis 0.0064848 0.0015599 4.157 0.00016 ***
ADCepi 0.0017448 0.0007808 2.235 0.03094 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.35 on 41 degrees of freedom
Multiple R-squared: 0.5416, Adjusted R-squared: 0.4969
F-statistic: 12.11 on 4 and 41 DF, p-value: 1.373e-06
> vif(fit)
PDR.in.central.ephysis PerfRatioMed ADR.in.metaphysis ADCepi
1.046292 1.124601 1.109561 1.267423
> sqrt(vif(fit))>2
PDR.in.central.ephysis PerfRatioMed ADR.in.metaphysis ADCepi
FALSE FALSE FALSE FALSE
Comment 3
-
cardiomoon
2015.04.17 18:06
-
cardiomoon
2015.04.17 18:33
제 생각에는 PDR.in.central.ephysis와 PerfRatioMed 중 하나가 ADCepi가 미치는 영향을 상쇄하지 않나 생각됩니다,. ADCepi와 PDR.in.central.ephysis, ADCepi와 PerfRatioMed 두개씩 해보실 것을 권합니다.
또한 다중회귀분석 전에 변수를 하나씩 넣은 회귀모형을 만들어 회귀모형진단을 해보실 것을 권합니다. 그리고 변수 4개가 있는 최종 모형도 회귀모형진단을 해보세요. web-r에 회귀모형 진단 부분은 아주 잘되어있읍니다. 회귀분석하실때 변수를 넣으시고 오른쪽위 체크박스를 모두 체크하시면 회귀모형진단을 할 수 있읍니다.
-
김승욱
2015.04.20 18:24
첫 번째와 두 번째 모델이 상당히 불안불안 하네요... 로버스트 회귀 정도 써보심이...
No. | Subject | Author | Date |
---|---|---|---|
34 | 표 작성시 질문 [1] | simsim | 2015.06.17 |
33 | print ztable [1] | 김영진 | 2015.06.17 |
32 |
오류 질문 - PDF 변환 안되는 file입니다.
[1] ![]() | 미소천사 | 2015.06.15 |
31 |
오류 질문 - 표작성시
[1] ![]() | 미소천사 | 2015.06.15 |
30 | Plot inset 만들기 | cardiomoon | 2015.06.09 |
29 | 웹에서 하는 R통계 - R코드 [2] | 김영진 | 2015.06.07 |
28 | R서버 설치 문의드립니다. [4] | 화모기 | 2015.05.13 |
27 | MS word문서 저장관련 [1] | 아자 | 2015.05.09 |
26 | 표만들기 관련 [2] | 현승협 | 2015.05.07 |
25 | 샤이니 앱에서 SQL 명령어 사용 방법 [2] | 김브링이 | 2015.05.06 |
24 | need finite 'xlim' values [3] | anthleemd | 2015.05.02 |
23 | Rstudio 사용법` [3] | 방랑자 | 2015.05.02 |
22 | RStudio v0.99 Preview: Code Diagnostics [1] | fermat39 | 2015.04.30 |
21 |
생존분석
[1] ![]() | toby | 2015.04.29 |
20 |
file 업로드 오류 관련 질문닙니다.
[1] ![]() | 미소천사 | 2015.04.27 |
19 | [행사] R User Conference in Korea 2015 | fermat39 | 2015.04.22 |
18 | 웹R 에서 데이터선택 에러 [1] | 화모기 | 2015.04.22 |
17 | 묻고답하기 게시판을 운영합니다 [1] | cardiomoon | 2015.04.20 |
16 | IBM Watson을 통한 헬스 클라우드 [1] | Ben | 2015.04.17 |
» | 이런 경우는 어떻게 해석해야 하는지요? [3] | orthojang | 2015.04.17 |
재미있는 경우인데요. 네가지 설명변수가 모두 임상적으로는 의미가 있는 건가요? 서로 독립적이구요?
나온 결과로만 해석하면 이렇게 할수 있겠군요.
먼저 첫번쨰 모형입니다. PDR.in.central.ephysis와 PerfRatioMed는 모두 상당한 의미가 있어보입니다. PerfRatioMed의 p값이 0.0515인것은 0,05이하가 아니라고 의미가 없는 것이 아니라 상당히 의미가 있어보입니다. 또한 모형의 adjusted-R2값을 보면 0.1571로 이 모형이 반응변수(종속변수) DIO.3의 15.7%를 설명하고 있음을 알 수 있읍니다.
두번째 모형인 ADR.in.metaphysis + ADCepi를 넣은 모형의 경우 adjusted-R2값이 0.2725로 두개의 영향변수를 넣은 모형이 DIO.3의 27.3%를 를 설명하고 있읍니다. ADCepi의 p값은 0.61로 의미가 없어보입니다. 두개의 영향변수를 넣고 다중회귀분석을 할때 해석은 다음과 같이 할수 있읍니다. ADR.in.metaphysis가 일정할때 ADCepi의 변동은 종속변수 DIO.3에 의미있는 영향을 미치지 않는다고 할수 있읍니다.
세번쨰 모형은 네개의 영향변수를 넣었더니 adjusted-R2 값이 무려 0.4969입니다. 즉 네개의 영향변수로 만든 회귀모형이 반응변수(종속변수)인 DIO.3의 49.7%나 설명하고 있읍니다. 그리고 네개의 영향변수가 모두 유의하게 나옵니다. 해석을 어떻게 해야 할까요? 원래 의미가 있었던 세개의 변수 말고 ADCepi를 중심으로 생각해보면 세개의 영향변수 PDR.in.epiphysis, PerfRatioMed, ADR.in.metaphysis 가 일정하다면 ADCepi가 변하면 DIO.3이 의미있게 변한다는 것입니다.