Rabu, 16 November 2011

Analisis Data Statistik Regresi Ganda Untuk Memperoleh Model Terbaik


Perusahaan busana di prancis yang mengimport barang dari tahun 1949- 1978 .Y= barang yang di impor (miliard franc Prancis),X1= barang yang dipesan(miliard franc Prancis),X2= persediaan barang(miliard franc Prancis),X3= barang yang dikonsumsi(miliard franc Prancis),X4= barang yang di lelang(miliard franc Prancis), dan X5= barang yang didistribusikan pada produsen(miliard franc Prancis).
Sumber: roelcup.files.wordpress.com/2010/.../22428727-uji-asumsi-regresi.pd...
Tabel barang import dan faktor- faktor yang mempengaruhinya
Tahun
X1
X2
X3
X4
X5
Y
1949
54
211
32
395
553
125
1950
56
200
12
373
547
122
1951
45
256
12
81
637
142
1952
58
250
13
393
698
130
1953
58
234
34
300
69
125
1954
41
256
14
384
645
100
1955
40
245
12
401
70
114
1956
40
250
21
386
732
117
1957
41
300
12
398
678
121
1958
45
225
12
397
791
123
1959
45
228
31
597
395
125
1960
46
263
12
929
373
100
1961
47
236
12
286
381
113
1962
48
241
14
603
393
140
1963
44
312
24
698
507
168
1964
40
320
13
659
52
125
1965
45
322
13
645
54
145
1966
53
356
22
70
553
147
1967
50
358
34
732
547
136
1968
52
357
13
678
637
146
1969
52
345
22
791
698
123
1970
56
289
12
954
659
102
1971
45
267
23
942
645
104
1972
46
214
14
429
70
125
1973
54
250
12
136
553
129
1974
38
263
21
392
547
178
1975
45
300
11
55
637
125
1976
54
312
21
233
698
156
1977
54
325
12
216
308
124
1978
52
345
32
381
312
142


Maka dilakukan seleksi model dan dicari model terbaik dengan menggunakan Best Subset Regression  , forward regression, backward regression dan Stepwise Regression maka menghasilkan analisis data sebagai berikut:

—————   11/10/2011 10:18:59 AM   ————————————————————

Best Subsets Regression: Y versus X1, X2, X3, X4, X5

Response is Y

                       Mallows          X X X X X
Vars  R-Sq  R-Sq(adj)       Cp       S  1 2 3 4 5
   1  11.9        8.7      3.4  17.737    X
   1   6.1        2.8      5.3  18.304      X
   2  21.1       15.3      2.3  17.091    X   X
   2  16.0        9.8      4.0  17.630    X X
   3  26.6       18.1      2.5  16.798    X X X
   3  21.6       12.5      4.2  17.367  X X   X
   4  28.0       16.5      4.0  16.966  X X X X
   4  26.6       14.9      4.5  17.127    X X X X
   5  28.0       13.0      6.0  17.316  X X X X X

Model  terbaik adalah Ŷ02X2+β3X3+β4X4+ε,karena memiliki nilai R2adj=18,1 terbesar,R2=26,6, Cp Mallows=2,5(≤6) dan S=16,798 terkecil
Dengan Forward Regression

Stepwise Regression: Y versus X1, X2, X3, X4, X5

Forward selection.  Alpha-to-Enter: 0.25


Response is Y on 5 predictors, with N = 30


Step            1       2       3
Constant    92.12   97.12   90.59

X2          0.133   0.153   0.142
T-Value      1.94    2.28    2.14
P-Value     0.062   0.031   0.042

X4                 -0.022  -0.024
T-Value             -1.78   -1.93
P-Value             0.087   0.064

X3                           0.57
T-Value                      1.40
P-Value                     0.174

S            17.7    17.1    16.8
R-Sq        11.87   21.10   26.60
R-Sq(adj)    8.73   15.26   18.14
Mallows Cp    3.4     2.3     2.5

Model  terbaik adalah Ŷ02X2+β3X3+β4X4+ε,karena memiliki nilai R2adj=18,14 terbesar,R2=26,60 terbesar, Cp Mallows=2,5(≤4) dan S=16,8 terkecil
Dengan Backward Regression

Stepwise Regression: Y versus X1, X2, X3, X4, X5

Backward elimination.  Alpha-to-Remove: 0.1


Response is Y on 5 predictors, with N = 30


Step             1       2       3       4
Constant    107.60  107.52   90.59   97.12

X1           -0.38   -0.38
T-Value      -0.68   -0.70
P-Value      0.505   0.492

X2           0.145   0.145   0.142   0.153
T-Value       2.12    2.17    2.14    2.28
P-Value      0.045   0.040   0.042   0.031

X3            0.63    0.63    0.57
T-Value       1.46    1.50    1.40
P-Value      0.157   0.147   0.174

X4          -0.025  -0.025  -0.024  -0.022
T-Value      -1.95   -1.99   -1.93   -1.78
P-Value      0.063   0.058   0.064   0.087

X5          -0.000
T-Value      -0.02
P-Value      0.982

S             17.3    17.0    16.8    17.1
R-Sq         28.01   28.01   26.60   21.10
R-Sq(adj)    13.01   16.49   18.14   15.26
Mallows Cp     6.0     4.0     2.5     2.3

Model  terbaik adalah Ŷ02X2 +β4X4+ε,karena memiliki nilai R2adj=15.26,R2=21.10, Cp Mallows=2.3(≤6) dan S=17.1
Dengan Stepwise Regression

Stepwise Regression: Y versus X1, X2, X3, X4, X5

  Alpha-to-Enter: 0.15  Alpha-to-Remove: 0.15


Response is Y on 5 predictors, with N = 30


Step            1       2
Constant    92.12   97.12

X2          0.133   0.153
T-Value      1.94    2.28
P-Value     0.062   0.031

X4                 -0.022
T-Value             -1.78
P-Value             0.087

S            17.7    17.1
R-Sq        11.87   21.10
R-Sq(adj)    8.73   15.26
Mallows Cp    3.4     2.3

Model  terbaik adalah Ŷ02X24X4+ε,karena memiliki nilai R2adj=15,26 terbesar,R2=21,10 terbesar, Cp Mallows=2,3(≤3) dan S=17,1 terkecil
Dengan mengambil model terbaik yaitu Y=β02X2+β3X3+β4X4+ε kemudian dilakukan pengecekan asumsi-asumsi dalam analisis regresi linear ganda. Dan dengan Mini-Tab menghasilkan analisis regresi sebagai berikut:

Regression Analysis: Y versus X2, X3, X4

The regression equation is
Y = 90.6 + 0.142 X2 + 0.568 X3 - 0.0241 X4


Predictor      Coef  SE Coef      T      P    VIF
Constant      90.59    19.07   4.75  0.000
X2          0.14198  0.06621   2.14  0.042  1.042
X3           0.5682   0.4070   1.40  0.174  1.027
X4         -0.02414  0.01248  -1.93  0.064  1.037


S = 16.7980   R-Sq = 26.6%   R-Sq(adj) = 18.1%


Analysis of Variance

Source          DF      SS     MS     F      P
Regression       3  2659.4  886.5  3.14  0.042
Residual Error  26  7336.5  282.2
Total           29  9995.9


Source  DF  Seq SS
X2       1  1186.8
X3       1   417.1
X4       1  1055.4


Unusual Observations

Obs   X2       Y     Fit  SE Fit  Residual  St Resid
 15  312  168.00  131.68    4.93     36.32      2.26R
 26  263  178.00  130.40    3.58     47.60      2.90R

R denotes an observation with a large standardized residual.


Durbin-Watson statistic = 1.92253



Dan di uji dengan asumsi-asumsi dalam anaslisi regresi linear ganda adalah:

Uji Linearitas
Kriteria: pada grafik plot tersebut asumsi linearitas terpenuhi karena pada grafik tersebut menunjukkan plot yang berpencar secar acak. Sehingga asumsi linearitas terpenuhi dalam regresi terpenuhi.
Uji Heterokedastisitas
Dari plot diatas dapat dilihat bahwa pada titik-titik pencar secara acak yang mengindikasikan homoskedastisitas.
Uji Normalitas
Pada grafik plot diatas terlihat titik-titik (sisaan) tidak disekitar garis diagonal dan tidak mengikuti arah garis diagonal, maka model regresi tidak memenuhi asumsi normalitas.
Uji Autokorelasi
1.       Hipotesis
Ho: r = 0 (Tidak ada autokorelasi)
H1:r < 0 (Ada autokorelasi negatif)
2.       Taraf nyata
α=0,05
3.       Kriteria keputusan
p= 6, n= 30
k= 6-1=5
dL=1,071       dU= 1,833
Ho diterima jika 4-d >dU
4-d> 1,833
4.       Perhitungan
d=  Durbin-Watson statistic = 1,63716
4-d = 4-1,92253= 2,07747
5.       Kesimpulan
Ho diterima karena 4 - d > 1,833
Jadi tidak ada autokorelasi
Sehingga data tersebut memenuhi karena tidak ada autokorelasi.
Karena terdapat pelanggaran pada asumsi pada data tersebut, maka dilakukan penanganan dengan cara menginvers data Y, X2, dan X3. Sehingga diperoleh data yang ditransformasikan seperti dibawah ini:
X2        X3                    X4        Y
0,0047393       0,0312500       395      0,0080000
0,0050000       0,0833333       373      0,0081967
0,0039063       0,0833333       81        0,0070423
0,0040000       0,0769231       393      0,0076923
0,0042735       0,0294118       300      0,0080000
0,0039063       0,0714286       384      0,0100000
0,0040816       0,0833333       401      0,0087719
0,0040000       0,0476190       386      0,0085470
0,0033333       0,0833333       398      0,0082645
0,0044444       0,0833333       397      0,0081301
0,0043860       0,0322581       597      0,0080000
0,0038023       0,0833333       929      0,0100000
0,0042373       0,0833333       286      0,0088496
0,0041494       0,0714286       603      0,0071429
0,0032051       0,0416667       698      0,0059524
0,0031250       0,0769231       659      0,0080000
0,0031056       0,0769231       645      0,0068966
0,0028090       0,0454545       70        0,0068027
0,0027933       0,0294118       732      0,0073529
0,0028011       0,0769231       678      0,0068493
0,0028986       0,0454545       791      0,0081301
0,0034602       0,0833333       954      0,0098039
0,0037453       0,0434783       942      0,0096154
0,0046729       0,0714286       429      0,0080000
0,0040000       0,0833333       136      0,0077519
0,0038023       0,0476190       392      0,0056180
0,0033333       0,0909091       55        0,0080000
0,0032051       0,0476190       233      0,0064103
0,0030769       0,0833333       216      0,0080645
0,0028986       0,0312500       381      0,0070423

Kemudian di analisis dengan analisis regresi menggunakan Mini-Tab, dan menghasilkan analisis sebagai berikut

Regression Analysis: Y versus X2; X3; X4

The regression equation is
Y = 0,00381 + 0,584 X2 + 0,0170 X3 + 0,000002 X4


Predictor        Coef     SE Coef     T      P    VIF
Constant     0,003813    0,001242  3,07  0,005
X2             0,5837      0,2813  2,07  0,048  1,041
X3           0,016987    0,008322  2,04  0,052  1,034
X4         0,00000180  0,00000070  2,55  0,017  1,048


S = 0,000942289   R-Sq = 33,7%   R-Sq(adj) = 26,1%


Analysis of Variance

Source          DF           SS           MS     F      P
Regression       3  1,17401E-05  3,91338E-06  4,41  0,012
Residual Error  26  2,30856E-05  8,87908E-07
Total           29  3,48258E-05


Source  DF       Seq SS
X2       1  3,31426E-06
X3       1  2,63194E-06
X4       1  5,79393E-06


Unusual Observations

Obs       X2         Y       Fit    SE Fit   Residual  St Resid
  6  0,00391  0,010000  0,007996  0,000193   0,002004      2,17R
 26  0,00380  0,005618  0,007546  0,000231  -0,001928     -2,11R

R denotes an observation with a large standardized residual.


Durbin-Watson statistic = 1,67891





Maka asumsi- asumsinya adalah:
Uji Linearitas
Kriteria: pada grafik plot tersebut asumsi linearitas terpenuhi karena pada grafik tersebut menunjukkan plot yang berpencar secar acak. Sehingga asumsi linearitas terpenuhi dalam regresi terpenuhi.
Uji Heteroskesdisitas
Dari plot diatas dapat dilihat bahwa pada titik-titik pencar secara acak yang mengindikasikan homoskedastisitas.




Uji Normalitas
Pada grafik plot diatas terlihat titik-titik (sisaan) disekitar garis diagonal dan mengikuti arah garis diagonal, maka model regresi memenuhi asumsi normalitas.
Uji Autokorelasi
1.       Hipotesis
Ho: r = 0 (Tidak ada autokorelasi)
H1:r < 0 (Ada autokorelasi negatif)
2.       Taraf nyata
α=0,05
3.       Kriteria keputusan
p= 6, n= 30
k= 6-1=5
dL=1,071       dU= 1,833
Ho diterima jika 4-d >dU
4-d> 1,833
4.       Perhitungan
d=  Durbin-Watson statistic = 1,67891
4-d = 4-1,67891=2,32109
5.       Kesimpulan
Ho diterima karena 4 - d > 1,833
Jadi tidak ada autokorelasi
Sehingga data tersebut memenuhi karena tidak ada autokorelasi.

0 komentar:

Posting Komentar