AUSWERTUNG CHEMISCHE RINGVERSUCHE

Ringversuche werten wir prinzipiell mit drei verschiedenen statistischen Modellen gleichzeitig aus. Der Grund dafür ist, dass es nicht die ideale Statistik gibt, genauso wie es den idealen Datensatz für eine Auswertung nicht gibt.

Zwar wird im idealen Modell angenommen, dass für gemessene Größen wie „Konzentration“ oder „Gewicht“ die Streuung der Daten in einem Datensatz normal verteilt ist, so können doch in einem realen Datensatz Ausreißer bzw. Einflüsse vorliegen, die Daten systematisch oder unsystematisch beeinflussen. Ziel der verschiedenen statistischen Verfahren ist es, die Ausreißer zu eliminieren beziehungsweise die Störungen eines Datensatzes zu erkennen und herauszurechnen um somit den Besten Schätzwert ermitteln zu können.

Die sensible Statistik

Hier werden der Mittelwert und die Standardabweichung berechnet. Eine Ausreißereliminierung findet nicht statt. Befürworter dieses Verfahrens sagen unter anderem, dass hierbei keine falsche Ausreißereliminierung stattfindet und somit wichtige Werte nicht vernachlässigt werden können.

Die sensible Statistik mit Ausreißereliminierung

Hier werden der Mittelwert und die Standardabweichung berechnet. Eine Ausreißerprüfung und -eliminierung findet statt. Befürworter dieses Verfahrens sagen unter anderem, dass Ausreißer eliminiert werden sollen, um zu vermeiden, dass offensichtlich verfälschte Mittelwerte und Standardabweichungen erzeugt werden.

Die robuste Statistik

Hier werden für die Berechnung der robusten Standardabweichung die Q-Methode und für den robusten Mittelwert der Hampelschätzer angewendet. Bei diesen Verfahren werden über Allgorythmen flexible Grenzen, iterative Annnäherungen und Gewichtungen in Abhängigkeit der Häufigkeit berechnet.

Durch robuste Verfahren wird eine Ausreißerdiskussion vermieden. Trotzdem sind der generierte Mittelwert und die Standardabweichungen sehr vertrauenswürdig, wie Langzeitstudien gezeigt haben. Alle drei statistischen Verfahren haben ihre Vor- und Nachteile.

Mit dem nächsten Verfahren kann nun geprüft werden, welche der drei Statistiken die vertrauenswürdigsten Ergebnisse liefert.

Qualitätsmessung der drei statistischen Verfahren

Zur Überprüfung der Qualität der statistischen Verfahren wird der chi²-Anpassungstest durchgeführt. Dieser Test bestimmt über den jeweiligen Mittelwert und Standardabweichung der unterschiedlichen statistischen Verfahren die dazugehörigen Dichtefunktionen. Diese Funktionen werden mit idealen Dichtefunktionen verglichen.

Je größer die Abweichung von idealer zu realer Dichtefunktion ist, umso geringer ist der normalverteilte Anteil von Daten in einem Datensatz. Die Abweichung wird mit dem chi²-Wert bestimmt.

Vergleicht man die verschiedenen chi²-Werte der drei statistischen Verfahren, kann man beurteilen, welches der Verfahren den normalverteilten Anteil im Datensatz am besten erkannt hat. Für unseren Einsatzzweck wird über dieses Verfahren die Qualität der drei Statistiken beurteilt. Je kleiner der chi²-Wert, desto „besser“. Ist der chi²-Wert größer als 7,82 so ist der Datensatz als nicht normalverteilt erkannt worden und das statistische Verfahren ist für den entsprechenden Datensatz nicht sinnvoll anwendbar.

Ist keines der drei statistischen Verfahren geeignet, wird der Median zur Bestimmung des Besten Schätzwertes verwendet.

Laborbewertungen

Die Laborbewertung erfolgt über drei verschiedene Maßstäbe.

  1. Der z-score benutzt ausschließlich Referenzwerte aus den jeweiligen Normen und Standards. Die erhaltenen z-scores geben somit Auskunft über die Laborleistung imVergleich zu den Referenzmethoden. Die Praxis hat gezeigt, dass in einigen Fällen die Referenzwerte der Methoden nicht praxisnah sind. Daher wurde eine weitere Laborbewertung eingeführt.
  2. Der z’-score bezieht sich ausschließlich auf Werte der Teilnehmer eines Ringversuchs. Allerdings werden nur die Werte zur Berechnung des Besten Schätzwertes herangezogen, die mit der Referenzanalytik bestimmt worden sind. Zusätzlich wird die Unsicherheit des verwendeten Probenmaterials stärker gewichtet. Dadurch sind die zwei verschiedenen zscores vergleichbar und geben letztendlich auch eine Information über die Qualität der Referenzmethoden.
  3. Beim CRD-Wert wird die einzelne Laborabweichung zum Besten Schätzwert mit der Kritischen Differenz verglichen. Bei der Kritischen Differenz handelt es sich letztendlich um die Methodenunsicherheit bereinigt durch die Unsicherheit aus derWiederholbarkeit.