zum Directory-modus

Lineare Regression

Kovarianz der Regressionskoeffizienten

Gegeben sei eine Regressionsfunktion

y ^ = a 1 + a 2 x .

Sind die Regressionskoeffizienten a 1 und a 2 voneinander abhängig, dann muss die Kovarianz cov ( a ^ 1 , a ^ 2 ) bei der Fehlerschätzung der Regressionskoeffizienten a ^ 1 und a ^ 2 berücksichtigt werden. Die Kovarianzmatrix

C = S 2 ( a ^ 1 ) cov ( a ^ 1 , a ^ 2 ) cov ( a ^ 2 , a ^ 1 ) S 2 ( a ^ 2 )

ist mit der inversen Normalmatrix G T G -1 wie folgt verwand.t

C = s 2 ( y ) G T G -1

Dabei ist

s 2 ( y ) = m m -2 σ 2 ( y ) = 1 m -2 i = 1 m e i 2 = 1 m -2 i = 1 m y i - a ^ 1 - a ^ 2 x i 2

die beste Schätzung der Varianz einer einzelnen Messung y i und

G T G -1 = 1 m i = 1 m x i 2 - i = 1 m x i 2 i = 1 m x i 2 - i = 1 m x i - i = 1 m x i m .

Die Diagonalelemente der symmetrischen Matrix C ergeben die Quadratfehler (Varianzen) der Regressionskoeffizienten der kleinsten Quadrate, die nicht-diagonalen Elemente ergeben die Kovarianzen.

Beispiel

Die BET-Isotherme für die Adsorption eines Materials auf einer Oberfläche ergibt folgende lineare Beziehung der Form mit z als unabhängige und z / ( 1 - z ) V als abhängige beobachtete Variable

z ( 1 - z ) V = 1 c V mon + ( c - 1 ) c V mon z ,

wobei z = p / p * ist ( p = Gleichgewichtsdruck, p * = Dampfdruck der kompakten Flüssigkeit, V = Volumen des adsorbierten Materials, V mon = Volumen des adsorbierten Materials für ein mit einer Monoschicht bedecktes Substrat, c = k a k ' d / ( k ' a k d ) , k a bzw. k d sind die Geschwindigkeitskonstanten für die Adsorption bzw. Desorption der ersten Schicht und k ' a bzw. k ' d sind diejenigen für die anderen Schichten).

Aus den Regressionskoeffizienten

a ^ 1 = 1 c V mon und a ^ 2 = ( c - 1 ) c V mon

erhält man die gesuchten Parameter

c = 1 + a ^ 2 a ^ 1 und V mon = 1 a ^ 1 + a ^ 2 .

Aus entnimmt man, dass die Regressionskoeffizienten voneinander abhängig sind, womit cov ( a ^ 1 , a ^ 2 ) zur Fehlerberechnung der Parameter c und V mon benötigt wird. Die Fehler S ( c ) und S ( V mon ) sind mit den Varianzen (Quadratfehlern) S 2 ( a ^ 1 ) und S 2 ( a ^ 2 ) und der Kovarianz cov ( a ^ 1 , a ^ 2 ) folgendermaßen verwandt.

S 2 ( c ) = c a ^ 1 2 S 2 ( a ^ 1 ) + c a ^ 2 2 S 2 ( a ^ 2 ) + 2 c a ^ 1 c a ^ 2 cov ( a ^ 1 , a ^ 2 ) S 2 ( V mon ) = V mon a ^ 1 2 S 2 ( a ^ 1 ) + V mon a ^ 2 2 S 2 ( a ^ 2 ) + 2 V mon a ^ 1 V mon a ^ 2 cov ( a ^ 1 , a ^ 2 )

Mittels berechnet man die partiellen Ableitungen.

c a ^ 1 = - a ^ 2 a ^ 1 2 c a ^ 2 = 1 a ^ 1 V mon a ^ 1 = - 1 ( a ^ 1 + a ^ 2 ) 2 V mon a ^ 2 = - 1 ( a ^ 1 + a ^ 2 ) 2

Ohne Berücksichtigung der Kovarianz wären die Quadratfehler

S 2 ( c ) = c a ^ 1 2 S 2 ( a ^ 1 ) + c a ^ 2 2 S 2 ( a ^ 2 ) und S 2 ( V mon ) = V mon a ^ 1 2 S 2 ( a ^ 1 ) + V mon a ^ 2 2 S 2 ( a ^ 2 ) .

Die folgenden p - und V -Werte wurden gemessen:

Tab.1
Messwerte ( p * = 760 mbar )
p / mbar V / cm3 z z ( 1 - z ) V / cm-3
1,694067570,8513920,0022293,913480e-06
18,1441718,9966890,0238743,401645e-05
61,788776884,7286640,0813010,000100
108,254883906,7106110,1424410,000183
161,0822631054,5793570,211950,000255
218,958721183,4183170,2881040,000342
237,6499991220,0758960,3126970,000373

Die für die Tabellendaten berechneten Regressionskoeffizienten sind

a ^ 1 = 0,55914 10 -5 und a ^ 2 = 0,0011782.
Abb.1
Regressionsgerade

Die Kovarianzmatrix ist

C = 0,99735 10 -11 -0,41859 10 -10 -0,41859 10 -10 0,27575 10 -9 .

Die Fehler der Regressionskoeffizienten sind

S ( a ^ 1 ) = C 11 0,31581 10 -5 und S ( a ^ 2 ) = C 22 0,000016606.

Mittels und sind

c ^ = 211,71 und V ^ mon = 844,77 cm3.

Die Parameterfehler ohne Kovarianz sind gemäß

S ( c ^ ) = 121,39 und S ( V ^ mon ) = 10,143 cm3.

Die Fehler der Parameter mit Kovarianz sind gemäß

S ( c ^ ) = 119,05 und S ( V ^ mon ) = 12,063 cm3.

In diesem Fall sind die Unterschiede zwischen und klein, doch das Beispiel veranschaulicht das Konzept.

Seite 3 von 4