Kalibrierung Statistik

Aus Chemie-Wiki
Wechseln zu: Navigation, Suche

Quantifizierung hängt i.d.R. mit eibem funktionellen Signal zusammen.
Die Kalibrierung ermittelt meist diesen funktionalen Zusammenhang, meist mittels linearer Regression.
Die Standardisierung beschreibt verschiedene Kalibrierungsmethoden (Vgl. externer Standard. interner Standard, Standardaddition)
Und last but not least die Validierung. Diese beschreibt anhand statistischer Kenngrößen die Güte einer Methode.

Kalibrierung[Bearbeiten]

Kalibrierung beschreibt in der Analytik den Zusammenhang zwischen einem Messsignal und der Konzentration des Analyten. Das Signal kann sowohl ein photometrisches sein, man kann aber auch den Verbrauch einer Lösung mit der Konzentration korrelieren.
Im Idealfall handelt es sich im einen linearen Zusammenhang. Es gibt aber Methoden die nur für einen gewissen Konzentrationsbereich geeignet. Zu geringe Konzentrationen liegen unterhalb der Erfassungsgrenze, zu hohe Konzentrationen sprengen die Möglichkeiten der Auswertung.

Kalibrierkurve.png

Die Kalibrierung stellt eine Möglichkeit dar, die Konzentration eines Analyten in einer Probe zu bestimmen. Hierfür werden verschiedene Konzentrationen das Analyten hergestellt und z.B. photometrisch gemessen. Misst man nun die Probe mit dem unbekannten Gehalt kann man mittels einer Geradengleichung den Gehalt ablesen bzw. berechnen. Dafür muss eine lineare Abhängigkeit zwischen den Signalen und der Konzentration bestehen.
Die Kenngrößen der linearen Regression sind v.a. die Geradengleichung, der Korrelationskoeffizient, die Reststandardabweichung, die Verfahrensstandardabweichung und der Vertrauens- oder Prognoseintervall.

Die Geradengleichung[Bearbeiten]

Eine Gerade wird durch die Formel y = mx + c beschrieben.

Wobei y eine abhängige Größe, wie beispielsweise eine Extinktion (Photometrie) oder eine Peakfläche (Chromatographische Verfahren) darstellt.
x steht für eine unabhängige Größe, also beispielsweise eine Konzentration.
m ist die Steigung der Geraden und c ist der Ordinatenabschnitt.

Will man nun eine unbekannte Probenkonzentration bestimmen braucht man nur die Geradengleichung umzustellen und kann die bekannten Größen einsetzen:

x =

y ist das erhaltene Signal und die Größen m und c hat man ja aus der Kalibriergeraden erhalten.
x ist also dann der Gehalt der Probe.

Die Steigung m ist ein Maß für die Empfindlichkeit der Methode. Je größer die Steigung, desto empfindlicher, denn auch bei einer kleinen Änderung des Wertes x ergibt sich durch eine größere Steigung ein höherer Signalzuwachs.

Der Ordinatenabschnitt c wird bei einer Konzentration von 0 auch kalibrierter Blindwert genannt. In der Regel sollte man ja meinen, dass eine Methode bei einer Konzentration von 0 eine Ursprungsgerade erzeugt. Null drin = null Signal. Die ist nicht immer so. Vor allem bei photometrischen Messungen ergibt sich allein durch die Begleitchemikalien ein Signal. Daher ist es immer wichtig einen Blindwert "mitlaufen" zulassen! Der kalibrierte Blindwert wird meist kritisch betrachtet, er liefert jedoch wichtige Hinweise über die Richtigkeit der Analyse.

2 Dinge sollte man beachten:
c sollte 0 betragen, wenn man chromatographische Messungen hat, oder bei Messungen gegen den Blindwert, diesen vom ermittelten Ergebnis abzieht. Der Vertrauensbereich, denn man mit vielen Statistikprogrammen ausgeben kann, sollte den Ursprung jedoch einschließen. Vgl. Abbildung oben
Liefert die Analysen einen Blindwert, dann muss der Vertrauensbereich der Kalibrierung diesen Blindwert mit einschließen.

Korrelation[Bearbeiten]

Die Korrelationsrechnung erlaubt einen Nachweis, ob zwischen 2 Werten ein Zusammenhang besteht. Sie ermittelt die Stärke, Art und Richtung des Zusammenhangs. Die Korrelation besagt nur, ob ein Zusammenhand besteht. Sie sagt aber nicht ob es nicht noch einen anderen, einen besseren Zusammenhang gibt!
Ob es eine bessere Verbindung zwischen 2 Werten gibt kann man durch Regressionsrechnung ermitteln.

Korrelation.png

Die Abbildung soll das genannte etwas verdeutlichen. Wenn man für eine Kalibrierung 3 Signal/Konzentrations-Wertepaare ermittelt (A), könnte man davon ausgehen, dass diese in einem linearen Zusammenhang stehen (B). Wenn die Methode aber keine linearen Zusammenhänge aufweist, wenn sie also ungeeignet ist, um diesen spezifischen Parameter zu bestimmen erhält man eine Korrelation, wo eigentlich keine ist.

Aus diesem Grund muss man vorsichtig sein. Eine Kalibrierung muss min. 5 Kalibrierpunkte aufweisen und die Konzentration der Probe sollte relativ mittig zwischen diesen 5 Punkten liegen. Sonst kann es einem passieren, dass man Werte ermittelt, die jenseits von gut und böse liegen. Es gibt zwar auch die Möglichkeit einer Einpunktkalibrierung, aber dies ist nur für ausreichend evaluierte, also überprüfte, Methoden empfehlenswert. Wenn man eine neue Methode entwickelt reicht dies nicht aus.


Die Korrelationskoeffizient r wird über folgende Formel ermittelt:

r =

Ein hoher Korrelationskoeffizient ist ein notwendiges aber nicht hinreichendes kriterium für Linearität. Was soll das, denn jetzt schon wieder heißen?! Notwendig aber nicht hinreichend?! Das ist mathematischer Slang dafür, dass ein niedriger Wert anzeigt, dass keine Linearität besteht, es sagt aber weiterhin aus, dass ein hoher Wert nicht 100%ig sagen kann, ob wirklich ein linearer Zusammenhang besteht. Vergleiche hierzu die Abbildung. Mit den 3 unter A) ermittelten Werten kann man eine schöne Gerade erhalten. Noch besser wirds, wenn man nur 2 Punkte bestimmt hat, denn 2 Punkte ergeben in Verbindung IMMER eine Gerade. Wenn man aber kein linearer Zusammenhang besteht ist das Ergebnis immer falsch. Dies nennt man Scheinkorrelation.

Die analytische Praxis strebt Korrelationskoeffizienten von 0,999 an. Je nachdem wie gut eine Methode evaluiert ist sind diese Werte auch durchaus realistisch. Bei manchen Fragestellungen (Bsp. Pestizidanalytik) muss man sich aber auch mit weitaus schlechteren Koeffizienten zufrieden geben, da die Methode einfach nicht mehr hergibt.


Scheinkorrelation[Bearbeiten]

Eine Scheinkorrelation kommt häufig in epidemiologischen Studien vor. Es gibt aber auch viele andere Beispiele bei denen Scheinkorrelationen ermittelt werden können:

  • So kann der Rückgang der Geburtenrate direkt mit der verminderten Anzahl der Klapperstörche korreliert werden. Da ja jeder weiß, dass Babys von Störchen gebracht werden ist diese Korrelation auch direkt nachvollziehbar.
  • Ein weiteres Beispiel wäre folgendes: Es ist bekannt, dass Raucher gelbe Zähne haben und häufig Lungenkrebs bekommen. So kann man zu dem Schluß kommen, dass man Lungenkrebs bekommt, wenn man gelbe Zähne hat.

Diese Beispiele sind sehr überspitzt dargestellt, sie sollen jedoch die Gefahr einer Scheinkorrelation zeigen.

Um dies zu verhindern muss das Datenmaterial in jedem Fall visuell überprüft werden! Es sollten weiterhin Ausreißertests gemacht werden! Und man muss kucken ob die gemachte Relation wirklich realistisch ist.


Reststandardabweichung[Bearbeiten]

Die Reststandardabweichung wird mathematisch über folgende Formeln berechnet:

Sy =


Wobei


und


Der Term (N - 2) kommt dadurch zustande, da 2 Punkte benötigt werden, um eine Gerade zu bilden. N entspricht der Anzahl der Messwerte. m entspricht der Steigung der Ausgleichsgeraden. yi und xi entsprechen dem Signalwert und dem Konzentrationswert. c entspricht dem Ordinatenabschnitt.

Die Reststandardabweichung entspricht der Streuung der Messwerte oberhalb und unterhalb der Geraden. Sie ist mit der Standardabweichung, die die Streunung um den Mittelwert wiederspiegelt, vergleichbar.

Verfahrensstandardabweichung[Bearbeiten]

Dies ist ein Parameter der aus der Empfindlichkeit E (also der Geradensteigung m) und der Reststandardabweichung zusammengefasster Wert. Die Verfahrensstandardabweichung wird als Sx0 bezeichnet:

Teilt man Verfahrensstandardabweichung durch den Mittelwert erhält man den Verfahrensvariationskoeffizient Vx0:

Vertrauens- oder Prognosebereich[Bearbeiten]

Da der wahre Wert, wie schon bereits erwähnt, nur abgeschätzt werden kann, ist der ermittelte Wert eben nur ein Schätzwert. Dieser Schätzwert ist mit einem Kalibrierfehler behaftet der ebenfalls statistisch erfasst werden kann. Dieser Fehler ist von den folgenden Parametern abhängig:

  • Anzahl der Kalibrierlösungen
  • Anzahl der Probenbestimmungen (Doppel- oder Mehrfachbestimmungen)
  • Reststandardabweichungen
  • Steigung, also Empfindlichkeit, der Kalibriergeraden
  • Entfernung der Probenkonzentration von der mittleren Kalibrierkonzentration
Prognosebereich.png

Es wird bei der Streuung von Kalibrierdaten zwischen dem Prognosebereich und dem Vertrauensbereich unterschieden.
Der Prognosebereich ist geringfügig größer und bezieht zukünftige Messungen und die Anzahl an Mehrfachbestimmungen in die Berechnung mit ein. Er befindet sich an den Rändern der Kalibrierung.

Je steiler die Gerade desto schmaler ist der Prognosebereich, da hier ein geringer Konzentrationsunterschied eine größere Signaländerung zur Folge hat.

Die in der Abbildung gezeigten Hyperbeläste können über das Fehlerfortpflanzungsgesetz berechnet werden:

Wobei:
Sy = Reststandardabweichung
t = t-Faktor der t-Verteilung mit f = N - 2 und P = 95%
N = Anzahl der Kalibrierlösungen
= Anzahl der Parallelbestimmungen
= Arbeitsbereichsmitte
Qxx = Quadratsumme aller x

Kalibrierstrategien[Bearbeiten]

Um eine Kalibrierung herzustellen müssen mehrere Punkte berücksichtigt werden:
1. Arbeitsbereich festlegen, d.h. was und wieviel davon will ich messen
2. Größte und kleinste Konzentrationen 10mal messen
3. Überprüfung der Varianzenhomogenität
4. Alle Kalibrierstandards messen und Daten visuell prüfen
5. Ausreißertests
6. Überprüfung des Regressionsmodells
7. Bestimmung der Kenngrößen der Regression

Herstellung von Kalibrierlösungen[Bearbeiten]

Um eine Probe mit unbekannter Konzentration zu messen sollen 5 - 10 Kalibrierlösungen mit äquidistanten Konzentrationsintervallen angesetzt werden. Diese Lösungen sollten vollständig unabhängig voneinander hergestellt werden bzw. durch unabhängige Verdünnungen aus einer Stammlösung hergestellt werden. Häufig beruht eine photometrische Messung auf Farbreaktionen. Man darf also nicht eine Stammlösung mit dem Färbereagenz umsetzen und diese dann in verschiedene Konzentrationen verdünnen, sondern erst verdünnen und dann mit dem Färbereagenz umsetzen.
Der oben genannte Arbeitsbereich sollte dem der Probe entsprechen. Falls die Probe höher konzentriert ist, als es der Arbeitsbereich der Methode erlaubt, muss die Probe verdünnt werden. Man muss da evtl. etwas rumprobieren. Aber es ist am sinnvollsten, wenn die Probe im mittleren Bereich der Kalibrierlösungen liegt.
Der Bereich der in der Nähe der Nachweisgrenze liegt, zeigt meist größere Streuungen und sollte gegebenenfalls durch eine eigene Kalibrierung abgedeckt werden.
Auch wenn die Methoden seit langem validiert sind, darf man auf gar keinen Fall den Arbeitsbereich vergrößern! Dies geht nur, wenn man diesen vergrößerten Bereich erneut validiert.
Häufig wird für Kalibrierungen auch der Begriff Externer Standard verwendet.


Beurteilung von Kalibriergeraden[Bearbeiten]

IntStand-Grafik.jpeg

Die Abbildung zeigt eine Kalibriergerade die wohl eher nicht so optimal ist. Das verwendete Statistikprogramm gibt zwar einen Korrelationskoeffizient von 0,9998 und einen Verfahrensvariationskoeffizienten von 1,84% aus, doch ist dies nur der Fall, weil ein Wert weggelassen wurde. Der 4. Wert der Geraden wurde als Ausreißer identifiziert und somit nicht berücksichtigt.
Ein weiterer Nachteil dieser Kalibrierung ist, dass der ermittelte Analysenwert nicht mittig plaziert ist. Er liegt eher in der unteren Hälfte der Kalibriergeraden und dort sind die Varianzen stets größer als in der Mitte.