Bei der Linearen Regressionsanalyse wird die Gerade gesucht, die am besten mit den Messwerten übereinstimmt. Die werden dabei als fehlerfrei angenommen und die Gerade so angepasst, dass die Abweichung (Residuen) im Quadrat in der Summe minimal werden.
Für den Fall dass die Fehler der identisch sind1) erhält man
Der Fehler der Schätzung (Standard Error of the Estimate, Mean Square Error) 2)
gibt an, wie stark die Messwerte um die Gerade schwanken.
Die Koeffizienten und sind ebenfalls mit einer Unsicherheit behaftet
Das Bestimmungsmaß ist das Quadrat des
Korrelationskoeffizienten :
kann auf zwei Arten interpretiert werden:
Daraus folgt, dass um so näher bei 1 ist
Die einzelnen Messwerte weichen um einen Fehler (Residuum) von der Gerade ab.
Das Maß der Übereinstimmung wird durch den quadratischen Fehler4) für jeden einzelnen Messwert bestimmt. Dabei wird angenommen, dass der Fehler der verschwindend gering ist und der Fehler der einer Gaußschen Statistik folgt. [485] (Kapitel 6).
Die Abweichungen von der Gerade werden mit der jeweiligen Streuung der Messwerte gewichtet und aufsummiert.
Die Parameter und werden so gewählt, dass minimal wird, d.h.
Das lineare Gleichungssystem
kann nach und aufgelöst werden.
Nimmt man für alle den selben absoluten Fehler an, so lässt sich dieser aus dem Fit bestimmen:
Die Fehler von und ergeben sich mit den üblichen Methoden der Fehlerfortpflanzung aus den bzw. :
Setzt man an erhält man
Alternativ kann man für jedes Wertepaar das Verhältnis
bestimmen. Der Fehler der ist
Der Mittelwert der gewichtet mit den Fehlern (wobei nur der relative Wert relevant ist) lautet ([489],S65ff)
Aus der Streuung der Punkte um die Gerade lässt sich der unkannte Faktor und somit der absolute Fehler von und bestimmen:
Um Daten zu behandeln die sowohl in als auch fehlerbehaftet sind, kann der kürzeste Abstand der Punkte zur Gerade minimiert werden (Wolfram Mathworld).
Oder die vertikalen Abstände gewichtet mit den Fehlern in und minimiert werden [489]
Ein Gruppe von Werten schwankt um ihren Mittelwert
Wobei der Mittelwert so definiert ist, dass der mittlere quadratische Abstand zum Mittelwert minimal wird: minimal .
Die Stärke der Schwankung wird durch die Varianz gegeben5)
wobei die Standardabweichung (der Einzelwerte)
das Intervall um angibt, in dem (sofern eine Normalverteilung der Messwerte vorliegt) 68% der Messwerte verteilt sind.
Neben der Definition von gibt es auch die Definitionen und bei denen im Nenner jeweils durch bzw. ersetzt wird. Es gilt . Diese Standardabweichungen werden verwendet wenn nur eine Stichprobe anstelle der Grundgesamheit betracht werden.
Die Standardabweichung des Mittelwerts, auch mittlerer quadratischer Fehler genannt, gibt an wie sich die statistische Streuung der Messwerte als Fehler auf den Mittelwert auswirkt. Die Standardabweichung des Mittelwerts ist deutlich kleiner als die Standardabweichung der Einzelwerte, da sich durch Mittelung über viele Messungen die Unsicherheit verringert.
Rechnet man aus zwei (oder mehrere) Messwerten und einen neuen Wert aus, so pflanzen sich die Fehler von und auf fort. Der Fehler von ist6):