Bedeutung der Analysenergebnisse

Aus Chemie-Wiki
Wechseln zu: Navigation, Suche

Warum wird eigentlich etwas untersucht?[Bearbeiten]

Um zu wissen wie man auf eine gewisse Reaktion zu reagieren hat, müssen Grenzwerte ermittelt werden und geeignete Analysenmethoden ermittelt werden. Der Begriff Validierung steht für die Überprüfung der Gültigkeit von Werten in der Statistik. Eine Methodenvalidierung ist somit ein Nachweis, dass eine Methode geeignet ist, die gewünschten Parameter zu erfassen.
Die Analysenergebnisse, die ermittelt wurden, dienen als Grundlage für Entscheidungen oder Massnahmen die von großer wirtschaftlicher oder strafrechtlicher Bedeutung sein können.
Da von den Ergebnissen sehr viel abhängen kann, muss ein Analytiker nicht nur einwandfreie und korrekte Analysenergebnisse zu liefern, sondern er muss auch nachweisen, dass diese Ergebnisse richtig sind.
In der Analytik wird häufig die beurteilende Statistik angewendet. Hierbei werden durch Abschätzen der Wahrscheinlichkeit oder durch Überprüfen von Hypothesen Rückschlüsse auf die Gesamtheit des Systems zu ziehen versucht.
Es gibt natürlich mehrere Fragestellungen die man dabei berücksichtigen kann:

  • Liegt nur das Ergebnis dieser Stichprobe bei diesen Werten, oder kann ich damit auf die gesamte Charge rückschließen?
  • Ist ein Grenzwert überschritten?
  • Kann ich einen Parameter in Gurken genauso analysieren wie in Tomaten? Kurz: Kann ich 2 Ergebnisse vergleichen?
  • Ist die Kalibrierung stabil, oder muss ich bei jeder Analyse eine neue Kalibrierung herstellen?

usw...

Grundgesamtheit vs. Stichprobe[Bearbeiten]

Grundgesamtheit Ist die Gesamtheit aller möglichen Ergebnisse, die man bei einer Analyse erhalten kann. Also wenn man beispielsweise einen 1000 L Tank mit Milch hat und nun den Fettgehalt der 1000 L in mehreren Aliquoten bestimmt erhält man nicht jedes Mal genau den gleichen Fettgehalt. Sondern der analysierte Wert schwankt in gewissen Grenzen. Ziel ist es, durch sog. Stichproben auf die Gesamtheit zurückzuschließen. Man kann ja nicht den kompletten Tank (1000 L) untersuchen und ihn anschließend verkaufen. Man muss durch Analysen eines kleinen Teils (100 mL) zuverlässig den durchschnittlichen Fettgehalt ermitteln können.

Normalverteilung[Bearbeiten]

Normalverteilung.png

Das Beispiel in der Abbildung ist wie beschrieben, der Einfachheit halber, sehr klein gehalten. Das wären sozusagen die Stichproben. Würde man beispielsweise eine oder sogar 100 Kisten Äpfel, oder gar den ganzen LKW vermessen, das wäre dann die Grundgesamtheit, erhält man auch Größen wie 7,3 oder 4,1 etc... Doch es sollte sich so circa eine Gauß'sche Normalverteilung einstellen, wenn man die ermittelten Werte als Balkendiagramm aufträgt.
In der Abbildung betragen die sogenannten Klassenbreiten 1 cm. Sind die Klassenbreiten gleich 0 erhält man eine glatte Kurve, die theoretische Normalverteilung.

Mittelwert und Standardabweichung[Bearbeiten]

Das Maximum der Kurve ist der sogenannte Mittelwert. Addiert man alle Werte und teilt die Summe durch die Anzahl der Summanden erhält man den arithmetrischen Mittelwert.

Einfluss-Mittel-Standabw.png

Die Standardabweichung stellt den Wendepunkt der Kurve dar, bzw. steht für die Breite der Kurve.
68,27 % aller gemessenen Werte befinden sich im Bereich des Mittelwertes +/- der Standardabweichung. Will man 95,45 % der Werte erfassen, entspricht dies dem Mittelwert +/- 2 mal . Bei µ +/- 3* erfasst man 99,73 % der ermittelten Werte. (Vgl Abb.)

Bedeutung-Standardabweichung.png

Die Einheiten µ und sind Einheiten die der Grundgesamtheit zugeschrieben werden.
Handelt es sich um Stichproben wird der Mittelwert und die Standardabweichung mit und Sx bezeichnet.

Die Standardabweichung wird wie folgt berechnet:

Sx =

Wobei f = Anzahl der Freiheitsgrade, also die Anzahl der Proben minus 1 (N-1)

Beispiel für Berechnung der Standardabweichung von Hand[Bearbeiten]

Der Mittelwert ist meist trügerisch. Hier ein Beispiel, warum die Standardabweichung ein wesentlich besseres Beurteilungskriterium ist. Wir wollen 9 g Marmelade abfüllen. Bei der Abfüllung werden Stichproben genommen und ausgewogen.


Bei der ersten Abfüllung werden 3 Stichproben gewogen: Es werden 8, 9 und 10 g gewogen. Im Mittel sind dies 9 g. "Das ist ja toll!", denkt sich der Kontrolleur. Die nächsten 3 Stichproben ergeben die Gewichte 3, 10 und 14 g. Eigentlich keine tolle Abfüllung, wenn man 9 g abfüllen will. Doch auch hier ergibt sich das arithmetrische Mittel 9 g.


Man sieht also, um eine Charge zu beurteilen benötigt man etwas anderes...


In wenigen Schritten kann man die Standardabweichung bestimmen und so ein besseres Beurteilungskriterium erhalten:


1) Man zieht das arithmetrische Mittel von den Stichproben ab:


F = SP -  


8 - 9 = -1
9 - 9 = 0
10 - 9 = 1


3 - 9 = -6
10 - 9 = 1
14 - 9 = 5


2) Da man positive und negative Zahlen nicht mit einander vergleichen/verrechnen kann werden sie alle quadriert. Die Quadrate werden aufsummiert. Durch die Quadrierung werden große Abweichungen schwerer gewichtet.


 


-12 = 1
02 = 0
12 = 1
Als Summe ergibt sich 2. In der 2. Messreihe ergibt sich folgendes:


-62 = 36
12 = 1
52 = 25
Als Summe ergibt sich 62. Die Summen werden auch als Varianz oder Streung bezeichnet.


3) Nun werden die 2 Summen durch die Anzahl der Stichproben geteilt, um wieder auf einen gleichen Nenner zu kommen:




2/3 = 0,67
62/3 = 20,67
Auch hier bleibt noch ein deutlicher Unterschied übrig.


4) Da wir vorhin alles quadriert haben, wird nun wieder die Wurzel gezogen:


 


= 0,82
= 4,55


Die Standardabweichung Sx ist im ersten Beispiel kleiner als 1. Das bedeutet, das der Großteil der Werte (nämlich 68,3 %) zwischen 8 und 10 g liegen.
Im zweiten Beispiel beträgt die Standardabweichung Sx knapp 4,5. Der Großteil der produzierten Marmeladenbecher wird also 9 g +/- 4,5 g beinhalten.

Will man nun wissen wie die 2 Standardabweichungen zueinander stehen, dann teilt man Sx durch den Mittelwert und multipliziert mit 100. Dadurch erhält man den Variationskoeffizient.


VC = 


0,82/9 = 9,11%
4,5/9 = 50%


Ab einem Variationskoeffizienten von 50 % spricht man von einer großen Inhomogenität der Stichproben und somit von einer schlechten Abfüllung.

Die Standardabweichung lässt sich natürlich nicht nur auf Füllmengen anwenden. Auch die Güte von Kalibriergeraden können ermittelt werden.

Genaugenommen wird durch die oben genannte Methode die mittlere quadratische Abweichung berechnet. Die Standardabweichung berechnet sich laut FertigpackungsVO durch die unter Standardabweichung genannte Formel (also geteilt durch die Freiheitsgrade).

Prüfung auf Normalverteilung[Bearbeiten]

Um eine Datenreihe auf Normalverteilung hin zu überprüfen, kann man den Test nach David durchführen. Der Prüfwert PW wird wie folgt ermittelt:

PW =

Wobei R = Range, also xmax - xmin ist. Sx ist die schon bekannte Standardabweichung.

Aus einer Tabelle (Tabelle nach David) kann dann anhand der Anzahl der Proben eine obere und eine untere Schranke abgelesen werden. Die statistische Sicherheit liegt in der Regel bei 90 %. Sobald der Prüfwert außerhalb dieser Schranken liegt, ist keine Normalverteilung vorhanden.

Median und Modalwert[Bearbeiten]

Das oben genannte arithmetrische Mittel reagiert relativ stark auf Extremwerte, daher ist es evtl sinnvoll, den Median bzw. den Modalwert zu bestimmen.

Der Median ist der mittlere Wert, wenn alle Messwerte der Reihe nach sortiert werden. Bsp: Man hat 51 Körpergrößen gemessen. Diese sortiert man dann der Reihe nach von klein nach groß. Der 26. Wert innerhalb dieser Reihenfolge entspricht dann dem Median. (Hat man nur 50 Größen bestimmt, gibt es so gesehen keinen mittleren Wert. Hier addiert man den 25. und den 26. Wert und teilt durch 2)

Der Modalwert entspricht dem häufigsten Wert den eine Datenreihe enthält.

Sind die Unterschiede zwischen Mittel-, Modalwert und Median zu groß, kann dies auch als Anzeichen gewertet werden, dass keine Normalverteilung herrscht.


Korrekturen[Bearbeiten]

Bei wenigen Stichproben kann meist nicht gewährleistet werden, dass das Ergebnis wirklich repräsentativ ist. Dies kann man über die Student-t-Verteilung ausgleichen. Sie wird angewendet, wenn man zwischen 5 und 29 Stichproben hat. Bei mehr als 30 Stichproben geht man von einer repräsentativen Verteilung der Ergebnisse aus. Sind es weniger wird die ermittelte Standardabweichung größer angenommen, als sie ist um mögliche Fehler auszubügeln.