GütekriterienVor dem Einsatz eines Assessment-Instrumentes ist die Frage zu klären:Taugt das Instrument überhaupt füt die Absicht? Zur Frage der Eignung eines Messinstrumentes für den praktischen Einsatz gibt es eine Vielzahl von Prüfkriterien, die Gütekriterien genannt werden. Die meisten stammen aus der klassischen Messtheorie, sind also innerhalb der Psychologie bei der Entwicklung von Tests entwickelt worden. Die Methodenentwicklung der Psychologie hat also ein wichtiges Fundament für die Bewertung von Assessment-Instrumenten gelegt. Hier gibt es einen großen Fundus an Richtlinien für die Entwicklung, die Bewertung und Durchführung von Messverfahren (siehe z.B. http://www.zpid.de/redact/category.php?cat=88). Aufgrund der psychologischen Grundlagenarbeit wird daher oft auch von psychometrischen Bewertungskriterien gesprochen. Das ist eigentlich falsch, denn die Zuordnung von Skalen zu empirischen Relativen, die psychologisch relevant sind (z.B. Empfinden, Verhalten etc.) findet man in der Pflegewissenschaft nur selten. Es sollte stattdessen von messtheoretischen Bewertungskriterien gesprochen werden. |
|||||
Es ist wichtig, vor dem Einsatz eines Assessments in der Praxis möglichst viele dieser Güteriterien zu prüfen. Wenn bespielsweise vor dem Einsatz gefragt wird: "Ist das Verfahren valide?", dann ist dies nicht ausreichend, denn ein valides Verfahren muss nicht zwingend ein geeigntes Verfahren sein! | |||||
Es müssen drei Klassen von Bewertungskriterien unterschieden werden:
1) Bewertungskriterien für die Durchführung von Assessments:
2) Klassischen Gütekriterien zählen:
Objektivität:Wenn Personen, die das Verfahren durchführen, auswerten oder interpretieren zu gleichen Ergebnissen kommen, ist das Assessment objektiv. Die Durchführungsobjektivität kann durch eine genaue Regelung wann, wie und durch wen die Messung durchzuführen ist, erhöht werden. Ebenso sollte geklärt werden, wie mit nicht beurteilbaren Kriterien umzugehen ist. Raum, Zeit und andere Rahmenbedingungen sollten keinen Einfluss haben. Die Auswertungsobjektivität ist gesichert, wenn eine klare Zuordnung von Bewertungskriterien zu Zahlenwerten möglich ist, d.h. ein Bewertungsschlüssel vorliegt. Hier sind beispielsweise computergestütze Assessments ("electronic diaries") im Vorteil, da es dort eine ganz klar Zuordnung von Kriterien und Scores gibt und die Verrechung automatisch erfolgt. Auch Beobachtungsfehler können die Auswertungsobjektivität bedrohen. Daher sind manchmal Beobachterschulungen empfehlenswert. |
|||||
Beobachterschulungen und klare Durchführungsrichtlinien können die Objektivität des Assessments erhöhen! |
|||||
Die Interpretationsobjektivität ist gesichert, wenn verschiedene Pflegende dem gleichen Pflegezustand die selbe Wertigkeit auf der Messskala zuordnen. Ob man nun ein Wert als hoch oder niedrig bewertet, hängt auch von einem Vergleich mit Vergleichsnormen ab, die an früheren Stichproben gesammelt wurde.
ReliabilitätReliabilität = Messgenauigkeit, Zuverlässigkeit Unter Reliabilität versteht man die Messgenauigkeit, Präzision oder Zuverlässigkeit eines Verfahrens. Wenn Sie versuchen, die Größe einer Person mit einem elastischen Gummiband zu messen, dann werden Sie immer wieder zu anderen Ergebnissen kommen. Die Messung ist fehlerbehaftet und daher nicht reliabel. Kommen Sie aber bei mehrmaliger Messung zu gleichen Ergebnissen, dann ist eine hohe Reliabilität gesichert. Assessmentverfahren sollen nicht zu systematischen Fehlmessungen führen! Es gibt drei wichtige Parameter zur Bestimmung der Reliabilität, die alle auf der Berechnung des Korrelationskoeffizienten beruhen. Er ist ein Maß für den Zusammenhang zweier Meßwerte. Dabei gilt: „Je höher der Reliabilitätskoeffizient , desto zuverlässiger ist die Messung und desto weniger Gedanken muss sich ein Auswerter darüber machen, wie ernst er das Messergebnis nehmen soll“ (Kanning, 2002, S.67). Verfahren mit einer niedrigen Reliabilität, sind meist fehlerhaft und erlauben nur eine sehr grobe Einschätzung des Patienten. Da es in der Literatur viele verschiedene Validitäts- und Reliabilitätsprüfungen gibt, werden häufig Metaanalysen herangezogen, bei der Einzelstudien zur gleichen Fragestellung zusammengefasst werden. Man erhält dadurch einen mittleren Korrelationskoeffizienten als grobe Richtschnur für die Brauchbarkeit des Verfahrens. Dies ist jedoch nicht ganz unumschritten, da hier Stichprobenunterschiede vernachlässigt werden. Alle Reliabilitätsindizes arbeiten nach dem gleichen Prinzip: Die Zuverlässigkeit wird durch wiederholte Messungen oder durch Erhebungen mit einem ähnlichen Verfahren bestimmt. Ähneln sich die Ausprägungen oder stimmen sie überein, dann ist das Messverfahren reliabel, d.h., die Fehler bei der Messung sind gering. Ein wichtiger Qualitätsbeweis des Verfahrens ist damit erbracht. Drei Arten von Reliabilitäten werden unterschieden:
ValiditätValidität = Gültigkeit, Brauchbarkeit einer Messung Validität bezeichnet die Gültigkeit der Messung. Manchmal ist auch von Brauchbarkeit oder Tauglichkeit die Rede. Hierbei geht es um die Frage: Misst das Verfahren das, was es messen soll oder misst es eine andere Dimensionen? Misst ein Verfahren nicht das eigentliche Kriterium, sondern andere Aspekte, ist die Validität bedroht! Es gibt drei wesentliche Validitätsarten:
Die Validität kann durch die Kombination mehrerer Assessmentverfahren erhöht werden. Da Validitätskoeffizienten von 1 nie erreicht werden, wird deutlich, dass es eine völlige Sicherheit bei der Anwendung von Assessments auch statistisch nicht gibt. Pflegephänomene sind eben nicht gänzlich durchschaubar und jedes Verfahren hat auch seine Mängel. Dies macht nochmals deutlich, dass ergänzend das Fallverstehen wichtig ist.
3. Weitere Kriterien für den Einsatz in der Praxis:
Neben den klassischen Bewertungskriterien, die innerhalb der Messtheorie entstanden sind, gibt es inzwischen eine Vielzahl von weiteren Kriterien, die bei der Bewertung von Assessment-Instrumenten beachtet werden müssen:
Eine Entscheidung für ein Assessment-Instrument muss daher auch die Kosten und Nutzen berücksichtigen. Spezifität und Sensitivität geben nur die Wahrscheinlichkeiten richtiger Diagnosen an, sagen aber nichts über die möglichen Kosten von Fehlentscheidungen aus. Eine Kompromisslösung stellen sukzessive Assessements dar. Hierzu zählen auch sogenannte Screening-Methoden. Hierbei werden zunächst Diagnosen gestellt, die einen ersten Verdachtmoment liefern und erst bei Überschreitung eines Grenzwertes werden weitere aufwändiger Assessments durchgeführt. Es handelt sich also um eine Schnelldiagnostik, die zur vertiefenden Diagnostik fphren kann. Das Screening ist dabei meist mit einer höheren Fehlerwahrscheinlichkeit bei geringen Kosten (Testkosten, Aufwand) verbunden. Um die Anzahl an Prüfkriterien (Itmes) in einem Assessmentverfahren möglichst gering zu halten sollten statistische Methoden der Itemselektion zur Anwendung kommen. Ziel muss stets ein ökonomisches Verfahren sein, dass dennoch die relevanten Pflegephänomene oder Risiken genau erfasst. |
|||||
Stand: 01.08.2006 by. B.R.