Bei der Linearen Regressionsanalyse wird die Gerade f(x) = a + bx gesucht, die am besten mit den Messwerten (x_i,y_i) übereinstimmt. Die x_i werden dabei als fehlerfrei angenommen und die Gerade so angepasst, dass die Abweichung (Residuen) \epsilon_i = y_i - f(x_i) im Quadrat in der Summe minimal werden.
Für den Fall dass die Fehler \sigma_i der y_i identisch sind1) erhält man
Der Fehler der Schätzung (Standard Error of the Estimate, Mean Square Error) 2)
gibt an, wie stark die Messwerte y_i um die Gerade f schwanken.
Die Koeffizienten a und b sind ebenfalls mit einer Unsicherheit behaftet
Das Bestimmungsmaß R^2 ist das Quadrat des
Korrelationskoeffizienten R:
R^2 kann auf zwei Arten interpretiert werden:
Daraus folgt, dass R^2 um so näher bei 1 ist
Die einzelnen Messwerte y_i weichen um einen Fehler (Residuum) \epsilon_i von der Gerade ab.
Das Maß der Übereinstimmung wird durch den quadratischen Fehler4) für jeden einzelnen Messwert bestimmt. Dabei wird angenommen, dass der Fehler der x_i verschwindend gering ist und der Fehler \sigma_i der y_i einer Gaußschen Statistik folgt. [485] (Kapitel 6).
Die Abweichungen von der Gerade werden mit der jeweiligen Streuung der Messwerte gewichtet und aufsummiert.
Die Parameter a und b werden so gewählt, dass \chi^2 minimal wird, d.h.
Das lineare Gleichungssystem
kann nach a und b aufgelöst werden.
Nimmt man für alle y_i den selben absoluten Fehler an, so lässt sich dieser aus dem Fit bestimmen:
Die Fehler von a und b ergeben sich mit den üblichen Methoden der Fehlerfortpflanzung aus den \sigma_i bzw. \sigma:
Setzt man f(x) = mx an erhält man
Alternativ kann man für jedes Wertepaar (x_i,y_i) das Verhältnis
bestimmen. Der Fehler der m_i ist
Der Mittelwert der m_i gewichtet mit den Fehlern \sigma_i (wobei nur der relative Wert w_i relevant ist) lautet ([489],S65ff)
Aus der Streuung der Punkte um die Gerade lässt sich der unkannte Faktor k und somit der absolute Fehler von m_i und \overline m bestimmen:
Um Daten zu behandeln die sowohl in x als auch y fehlerbehaftet sind, kann der kürzeste Abstand der Punkte zur Gerade minimiert werden (Wolfram Mathworld).
Oder die vertikalen Abstände gewichtet mit den Fehlern in x und y minimiert werden [489]
Ein Gruppe von Werten w_i schwankt um ihren Mittelwert
Wobei der Mittelwert so definiert ist, dass der mittlere quadratische Abstand zum Mittelwert minimal wird: \sum_i(w_i-\overline w)^2= minimal \Rightarrow \frac{\mathrm{d}}{\mathrm{d}\overline w}\sum_i (w_i-\overline w)^2=0.
Die Stärke der Schwankung wird durch die Varianz gegeben5)
wobei die Standardabweichung (der Einzelwerte)
das Intervall um \overline w angibt, in dem (sofern eine Normalverteilung der Messwerte vorliegt) 68% der Messwerte w_i verteilt sind.
Neben der Definition von \sigma_N gibt es auch die Definitionen \sigma_{N-1} und \sigma_{N-2} bei denen N im Nenner jeweils durch N-1 bzw. N-2 ersetzt wird. Es gilt \sigma_{N-2}\geq\sigma_{N-1}\geq\sigma_N. Diese Standardabweichungen werden verwendet wenn nur eine Stichprobe anstelle der Grundgesamheit betracht werden.
Die Standardabweichung des Mittelwerts, auch mittlerer quadratischer Fehler genannt,
Rechnet man aus zwei (oder mehrere) Messwerten x\pm\sigma_x und y\pm\sigma_y einen neuen Wert f(x,y) aus, so pflanzen sich die Fehler von x und y auf f fort. Der Fehler von f ist6):

Fragen, Kommentare, Hinweise, Korrekturen: