Aspekte zu Messunsicherheit im Unterricht

Bei der quantitativen Betrachtung von Messunsicherheit fallen an vielen Stellen Möglichkeiten an, um die fachmethodische Vorgehensweise der Physik kritisch zu diskutieren. Wann sollte ein Messwert von einer Messreihe ausgeschlossen werden? Wie viele Messungen müssen durchgeführt werden? Fragen wie diese zielen direkt auf fachmethodisches Vorgehen der Physik ab, sind in vielen Fällen aber nicht einfach bzw. überhaupt nicht eindeutig zu beantworten, da gerade hier ein oft ignorierter Teil der Physik zu tritt: Faustregeln mit begrenzter Gültigkeit, Traditionen und Approximationen. Ein der „exakten Wissenschaft“ scheinbar widersprechender Charakter.

Doch gerade hier besteht die Chance über fachphysikalisches Vorgehen zu lernen. Eine kritische Diskussion dieser Aspekte erlaubt Einblicke und tiefes Verständnis des naturwissenschaftlichen Vorgehens. Im Folgenden haben wir 8 solcher Aspekte aufgeführt, die unserer Meinung nach für eine solche kritische Diskussion herangezogen werden können, bzw. die bei der Auswertung der Unsicherheit einer Messung zu Tage treten können. Nach der Erläuterung findet dann eine kurze, kritische Diskussion des jeweiligen Aspekts statt.

Hinweis: Es wird auf das Nutzen von „ungefähr gleich“ Zeichen verzichtet, da diese von WordPress nicht angenommen werden.

Beispiel: Die folgenden Betrachtungen finden der Anschaulichkeit halber am Beispiel eines typischen Schulversuchs statt: Die Bestimmung der spezifischen Masse eines Elektrons $\frac{e}{m}$ mithilfe eines Fadenstrahlrohrs.

Ein Elektronenstrahl mit Beschleunigungsspannung U wird durch das Magnetfeld B einer Helmholtzspule auf eine Kreisbahn umgelenkt. Mit Radius r der Kreisbahn ergibt sich die spezifische Masse eines Elektrons durch $\frac{e}{m} = \frac{2U}{r^2 B^2} \text{ .}$

Aspekt 1: Abschätzen von Messunsicherheiten bei einer einzelnen Messungen

Aspekt 2: Anzahl der Messwerte

Aspekt 3: Ausschluss einzelner Messwerte

Aspekt 4: Die Mittelwertbildung

Aspekt 5: Abschätzung / Berechnung der Unsicherheit bei indirekten Messungen

Aspekt 6: Angabe des e/m Ergebniswertes (Anzahl signifikanter Stellen und Runden)

Aspekt 7: im Falle der grafischen Auswertung: Das Hinzufügen des Nulldurchgangs

Aspekt 8: Die graphische Auswertung

Aspekt 1: Abschätzen von Messunsicherheiten bei einer einzelnen Messungen

Eine typische Antwort auf die rechts dargestellte Messsituation von r:

$r = (95 \pm 2) \text{ mm .}$

Bei der Durchführung von Einzelmessungen wirken mehrere Einflussfaktoren auf die Genauigkeit des Messwertes. Die folgende Liste beschreibt typische Einflüsse, ist aber nicht abschließend.

Messung von r (Radius des Leuchtrings)

Es gibt verschiedene Einflussfaktoren, die die Genauigkeit des Messwertes von r betreffen, wie beispielsweise: Ableseungenauigkeit, Geräteungenauigkeit (Herstellerangabe) und die endliche Breite des Leuchtrings.

Diese lassen sich jeweils als WDF darstellen, eine standardisierte Unsicherheit daraus ableiten und quadratisch summieren zu einer Gesamtvarianz (ausführlicher hier) zusammenrechnen. In der hier gebotenen Kürze und einem für den Unterricht realistischen Blick fokussieren wir lediglich auf den jeweils größten Einflussfaktor: In diesem Fall ist dies die Breite des Leuchtrings (Abbildung 1).

Abbildung 1: Messung des Radius des Leuchtrings

Messung von U (Spannung an Spulenpaar)

Auch im Fall des digitalen Messgerätes sind die Ableseungenauigkeit (aufgrund der Rundung), Geräteungenauigkeit (Herstellerangabe) und eventuell die Realisierung der Messgröße (ist die angezeigte Spannung tatsächlich diejenige, die an der Spule anliegt?) zu betrachten. Hierbei erweist sich die Geräteungenauigkeit als der größte Einflussfaktor.

Die standardisierten Unsicherheiten könnten in einer Rechnung ähnlich der klassischen Fehlerrechnung nun anhand von partiellen Ableitungen der Gleichung verrechnet werden (Fehlerfortpflanzung). Eine solche Rechnung wird allerdings in den meisten Grund- und Leistungskursen nicht geführt. Wir beschreiben daher hier eine Alternative.

a. Anzeige- / Ableseungenauigkeit

übliche Methode: halbe Skaleneinheit / Hälfte der letzten angezeigten Stelle

$r = (95 \pm 0,5) \text{ mm}$

Kritik: Die “übliche Methode” beschreibt ein 100%-Vertrauensintervall, d.h. enthält alle aufgrund von Rundung in Frage kommenden Werte, entspricht aber bis auf die folgende Gewichtung dem Vorgehen nach GUM: Hier wird diese Größe an das gewählte Vertrauensintervall (bspw. etwa 65% oder 95%) der restlichen Betrachtungen angepasst. Die möglichen Messwerte werden dabei je nach Art der Anzeige (digital oder analog) unterschiedlich gewichtet: Für eine digitale Anzeige sind alle Werte in dem gerundeten Intervall gleich wahrscheinlich (Rechteckverteilung, für Beispiel s. Abb. 2), für analoge Anzeigen ist dies nicht der Fall. Hier sind mittig liegende Werte wahrscheinlicher (Dreieckverteilung).

Für das obige Beispiel führt bei einem Vertrauensniveau von 65% zu einem angepassten Intervall von $r = (95 \pm \frac{0,5}{\sqrt{6}} ) \text{ mm } = (95 \pm 0,2) \text{ mm .}$

b. Definiertheit des zu messenden Wertes – Dicke des Leuchtringes ist endlich / angezeigter Wert auf digitalem Messgerät schwankt

übliche Methode: Intervall, dass minimalen und maximalen Wert einschließt wird gebildet

$r = (95 \pm 2,5) \text{ mm}$

Kritik: Für diesen Aspekt können verschiedene Einflussgrößen verantwortlich sein, in diesem Fall trägt vor allem die Breite der Leuchtspur stark zur Unsicherheit der Messung von r bei. Diese kann hier auf 5 mm abgeschätzt werden (s. Abb. 1). Auch hierfür kann als WDF auch eine Dreieckverteilung hinzugezogen werden:

$r = (95 \pm \frac{2,5}{\sqrt{6}}) \text{ mm} = (95 \pm 1) \text{ mm}$

c. Geräteungenauigkeit – teilweise den Herstellerdaten zu entnehmen, dort sind die Angaben aber oftmals nur sehr grob, Beispiel … (Voltmeter)

übliche Methode: Wird in Überlegungen häufig weggelassen.

Beispiel: $U= \text{..} \pm 0,05$ %+3 Digits entspricht hier $271,4 \text{ V}\pm (0,0005 \cdot 271,4 + 0,3) = 271,4 \pm 0,4 \text{ V}$ . Eine Größenordnung von 0,05% Unsicherheit (d.h. 0,5 mm auf 1 m Länge) führt bei der Linealmessung von r =95,0 mm auf das Ergebnis: $r =(95,0 \pm 0,05) \text{ mm}$

Fazit: Im Falle der Messung von r ist für die Unsicherheit die mangelnde Definiertheit des Messwertes der größte Faktor. Rechnet man alle drei zusammen ergibt sich durch Verknüpfung verschiedener Einflussfaktoren auf dieselbe Größe: $r = \sqrt{ r_{Anzeige}^2 +r_{Definiertheit}^2+r_{Geraeteungenauigkeit}^2} = \sqrt{ (0,2 \text{ mm})^2 +(1 \text{ mm})^2 +(0,5 \text{ mm})^2} = 1,1 \text{ mm}$ und demnach $r = (95 \pm 1,1) \text{ mm}$ .

Faktoren wie diese sind typisch für Schulexperimente. Sie hängen stark von Apparatur, Aufbau, Umgebung etc. ab und müssen daher diskutiert und individuell abgeschätzt werden.

Anwendung: Die Notwendigkeit einer Diskussion der Einflüsse ist jedoch auch die Stärke für die Einführung und Besprechung im Unterricht. Statt lediglich Faustregeln zu geben die ggf. nicht verstanden werden kann hier gemeinsam mit der Klasse diskutiert werden welches Ausmaß an Unsicherheit angemessen ist. Eine erleichterte Diskussion wird hier ebenso durch die Visualisierung mithilfe von WDFs erlangt. Beispielsweise können Gruppen “WDF-Vorschläge” zeichnen und diese dann im Plenum diskutieren bzw. verteidigen. Die konkrete Besprechung von Einflussfaktoren auf eine Messung wird so gefördert.

Abbildung 2: Messwert für die angelegte Beschleunigungsspannung U.

Aspekt 2: Anzahl der Messwerte

U/V	0	69	80	88	110	120	130	140	160	178
r/mm	0	78	83	86	99	103	108	113	119	124
e/m in 10^11 C/kg	–	1,750	1,792	1,836	1,732	1,746	1,720	1,692	1,744	1,786

übliche Methode: Limitiert durch verfügbare Zeit werden 1-5 Messungen durchgeführt

Kritik:

Mehrfachmessung haben aus messtechnischen und -theoretischen Gründen noch keine lange Tradition in der Wissenschaft. Gauß hielt eine Statistik nicht unter 20-30 für sinnvoll (siehe Mittelwertbildung).
Messtechnisch kann das Messen enden, wenn eine Sättigung erreicht ist, wenn also weitere Messungen voraussichtlich keine nennenswerten weiteren Informationen beisteuern. Daneben müssen wir im Unterricht auch ganz pragmatisch zwischen Aufwand, Ressourcen und Informationszugewinn abwägen.
Ein Informationszugewinn zeigt sich durch die Veränderung der Form der WDF.

Messen wir nur ein Mal, verändert sich das Ergebnis der Messung um bis zu 10% je nachdem welcher Wert von den neun realisiert würde (siehe obenstehende Ergebnistabelle).

Bei weiteren Messungen verändert sich die Verteilung beispielsweise wie in Abbildung 3 gezeigt.

Anwendung: Zur expliziten Thematisierung im Unterricht empfiehlt sich hier die Darstellung des “laufenden Mittelwertes” (siehe Tabelle, alle Zahlenwerte in $10^12$ C/kg). Ab ca. der 6. Messung ändert sich nicht mehr viel (Nach 100 Messungen beispielsweise: $0,1753 \cdot 10^12$ C/kg). Diese Anzahl variiert natürlich je nach Experiment. In aller Regel pendelt sich der Mittelwert allerdings innerhalb der ersten 10 Messungen für unterrichtliche Zwecke hinreichend ein.

Abbildung 3 zeigt zwei mögliche laufende Mittelwerte für eine solche Messung (in diesem Fall durch zufälliges variieren der Messwerte künstlich generiert)

Abbildung 3: Zwei Beispiele für die Darstellung laufender Mittelwerte. Hier wurden zu Zwecken des Beispiels die Messwerte aus der Tabelle vervielfacht und zufällig gemischt.

Aspekt 3: Ausschluss einzelner Messwerte

Übliche Methode: Auslassen des größten und kleinsten Messwertes oder Streichen von starken Ausreißern.

Kritik: Historisch hat das Streichen von Messwerten des Öfteren in den Wissenschaften zu großen Streitigkeiten geführt (bekannt z.B. als Disput zwischen Millikan und Fletcher). Es sollte adäquaterweise nur aus dem Messprozess heraus begründet erfolgen (wenn also die Messung nicht korrekt durchgeführt wurde), nicht nur auf Basis des erhaltenen (unpassenden) Messwertes. Eine Faustregel wie das Auslassen von Randwerten oder das unbedachte Streichen von Ausreißern ist daher kritisch zu hinterfragen. Zu unterscheiden ist, ob die zu streichenden Werte einen Informationszugewinn bezüglich der gewünschten Messung liefern (bspw. eine bisher unterschätzte Streuung verdeutlichen) oder ob diese einen physikalischen Sachverhalt messen, der nicht betrachtet werden soll (bspw. hervorgerufen durch Wackeln an einer Apparatur, Tropfenbildung durch Kondenswasser, Spannungspeaks durch einen weiteren Verbraucher im selben Stromnetz, …). Die Unterscheidung zwischen beiden Fällen kann allerdings schwierig sein, sofern keine direkten Beobachtung von Störungen vorliegen. Sie erfordert unter Umständen eine hohe Vertrautheit mit den Apparaturen.

Anwendung: Eine explizite Thematisierung ist im Physikunterricht anhand offensichtlicher Beispiele von Ausreißern möglich. Im Grunde genommen ist dies bei den meisten Experimenten gut möglich, gerade Experimente im Bereich Mechanik bieten sich allerdings an, da hier offensichtliche Einflüsse oft vorkommen.

Hinweis: Generell kann hier auch eine sprachliche Stütze helfen: Statt von “falschen” Messwerten oder “Ausreißern” zu reden, die ausgeschlossen werden müssen, sollte verdeutlich werden, dass es lediglich Messungen sind, bei denen ein anderer Sachverhalt gemessen wurde. “Physikalische falsche Messungen” gibt es nicht.

Aspekt 4: Die Mittelwertbildung

Übliche Methode: Der Bestwert von Mehrfachmessungen wird mit Hilfe des Mittelwertes gebildet.

Kritik: Die Verwendung des Mittelwertes war ebenfalls bis weit ins 18. Jahrhundert hinein umstritten. Die Kritik bezog sich maßgeblich darauf, dass eine solche reine Statistik nicht mehr die unterschiedliche Qualität der Messdaten berücksichtigen und erfahrungsbasierte Wissenschaft zu einer blinden Rechenoperation mache.

Tatsächlich bietet sich der Mittelwert vor allem bei symmetrischen Verteilungen an. Dies muss aber nicht immer der Fall sein – selbst bei symmetrisch verteilten Eingangsgrößen kann die WDF der Ergebnisgröße schief sein. Die Verteilung lässt sich mit Hilfe eines Histogramms als WDF der Mehrfachmessung nachprüfen (vgl. Aspekt 2).

Anwendung: Soll das Thema explizit thematisiert werden, könnte man beispielsweise so vorgehen: Im Unterricht werden verschiedene Verteilungen von Messwerten betrachtet (symmetrische und unsymmetrische, s. Abbildungen 4 und 5 für einen Vergleich) und verschiedene Verfahren zur Ermittlung eines “Bestwertes” durchgeführt. Der Bestwert soll ein adäquater Repräsentant der Verteilung sein.

Abbildung 4: Modus, Median und Mittelwert bei einer asymmetrischen Verteilung

Abbildung 5: Modus, Median und Mittelwert bei einer symmetrischen Verteilung

Aspekt 5: Abschätzung / Berechnung der Unsicherheit bei indirekten Messungen (e/m)

Die nach GUM bestimmten einzelnen Unsicherheiten können direkt verrechnet werden, da sie dieselben Vertrauensgrade (beispielsweise 65% oder 95%) beschreiben. Die Berechnung erfolgt anhand partieller Ableitungen und der Summe der Quadrate. und wie auch “herkömmlich” mithilfe Gauß’scher Fehlerfortpflanzung.

$\frac{e}{m} =\sqrt{ (\frac{\partial \frac{e}{m}}{\partial r} \Delta r)^2 + (\frac{\partial \frac{e}{m}}{\partial U} \Delta U)^2 + (\frac{\partial \frac{e}{m}}{\partial B} \Delta B)^2 }$

Eine eventuelle Asymmetrie der Verteilung (“skewness”) kann bei GUM allerdings zusätzlich betrachtet werden.

Alternativ zur Berechnung lassen sich die Verteilungen der Eingangsgrößen auch mithilfe einer von uns entwickelten App falten (http://physikkommunizieren.de/umgang-mit-messunsicherheit/). So fallen die quantifizierenden (und informationsreduzierenden) Schritte weg und man erhält bei Eingabe von WDFs der Eingangsgrößen die WDF der gesuchten Messgröße.

Vorschlag im KC Niedersachsen: Abschätzung der Unsicherheit nach unten durch die größte relative Unsicherheit der Eingangsgrößen. Im Beispiel liegt die größte relative Unsicherheit bei der Messung des Ringdurchmessers vor, wobei dort die Unsicherheit durch die Breite des Ringes dominiert.

$\frac{\Delta \frac{e}{m}}{\frac{e}{m}} \leq \frac{\Delta r}{r} = 1%$

Die Ausführliche Rechnung anhand der vollständigen oben angegebenen Gleichung ergibt im Vergleich ca. 1,7 %.

Kritik: Dieses Vorgehen ist als Faustregel für den Schulunterricht insofern praktikabel, dass es eine Abschätzung der herkömmlich durch Fehlerfortpflanzung zu bestimmenden Unsicherheiten mit geringem mathematischem Aufwand ermöglicht. Die Faustregel liefert besonders dann gute bzw. dem Vorgehen mithilfe Fehlerfortfpflanzung ähnliche Abschätzungen, wenn ein dominierender Einfluss auf die Gesamtunsicherheit vorliegt. Dies ist bei vielen schultypischen Experimenten der Fall (wie in Aspekt 1 bereits angeschnitten).

Zu beachten ist jedoch, dass es sich um eine Abschätzung einer unteren Grenze für die Unsicherheit handelt. Dies widerspricht ein Stück weit dem eigentlichen Sinne einer Unsicherheitsabschätzung. Dieser Umstand muss bei dem Einsatz der Regel im Physikunterricht bedacht und angesprochen werden, um die Vermittlung von falschen Vorstellungen über das wissenschaftliche Vorgehen vorzubeugen.

Aspekt 6: Angabe des e/m Ergebniswertes (Anzahl signifikanter Stellen und Runden)

Übliche Methoden:

Runden auf zwei Nachkommastellen (bzw. eine andere feste Anzahl)
ausgehend von ungenaustem Eingangswert: Anzahl dessen signifikanter Stellen ggf. + 1 signifikante Stellen.

Kritik: Beim Runden eines Wertes ist natürlich immer von der Anzahl signifikanter Stellen und nicht von Nachkommastellen zu reden. Diese Unterscheidung ist unseren Studien unter Studienanfängern der Physik zufolge den Lernenden aber überwiegend nicht klar. Der zweite Vorschlag setzt zudem voraus, dass die Anzahl signifikanter Stellen der Eingangsgrößen an ihre Unsicherheit angepasst bereits ist und sich nicht beispielsweise auf den auf dem Display angezeigten Wert bezieht.

Im hier diskutierten Beispiel taucht zusätzlich die Frage auf, ob r dann 2 oder 3 signifikante Stellen zugesprochen werden können, da sowohl 2- als auch 3-stellige Messwerte in der Ergebnistabelle enthalten sind.

Anwendung: Als Richtschnur erscheint diese Methode allerdings hilfreich. Mathematisch ist sie dem zuvor diskutierten Abschätzen anhand der Unsicherheit der ungenausten Eingangsgröße äquivalent.

Aspekt 7: im Falle der grafischen Auswertung: Das Hinzufügen des Nulldurchgangs (0/0)

Übliche Methode: Häufig ergänzen wir in Messungen den Null-Zustand in unseren Tabellen. In diesem Fall wäre das Argument: Solange keine Beschleunigungsspannung anliegt, entsteht auch kein gerichteter Elektronenstrahl, der sich auf eine Kreisbahn vom Radius r krümmen könnte.

Kritik: Zu diesem Aspekt gibt es unterschiedliche Ansätze. Generell ist zu bedenken, in welches Verhältnis sie theoretische Erwartung und experimentelle Messergebnisse bringen. Die Ergänzung des Punktes 0/0 als Datenpunkt konnotiert ein theoriebasiertes Vorgehen, das der experimentellen Handlung einen Teil der Erkenntnis bereits vorwegnimmt.

Anwendungen: Mögliche Vorgehensweisen

0/0 kann nur ergänzt werden, wenn es auch gemessen wird (z.B. um festzustellen, ob es keinen Offset gibt)
0/0 muss behandelt werden wie jeder andere Messwert auch, d.h. eine Ausgleichsgerade muss nicht zwangsläufig durch 0/0 gehen. Ansonsten reduzieren wir auf einen Freiheitsgrad und zwar anhand von theoretischen Überlegungen. Die Erkenntnisse aus Steigung und Achsendurchgang sind aber experimentell gesehen nur endlich genau, also ebenfalls unsicherheitsbehaftet.

Aspekt 8: Die graphische Auswertung (z.B. $U \rightarrow r^2$ )

Die graphische Auswertung von Messdaten findet in der Regel bei Messdaten statt. die unter Parametervariation erhoben werden. Statt der mehrfachen Messung derselben Spannung und des zugehörigen Radius werden beispielsweise Einfachmessungen bei verschiedenen Spannungen durchgeführt. Die gemessenen Spannungen werden gegen das Quadrat der Radien aufgetragen. Auf Grund des Zusammenhangs $U = \frac{e}{m} \cdot \frac{B^2}{2} r^2$ können die Messdaten mithilfe einer Gerade ausgewertet werden. Die Steigung entspricht dabei theoretisch $\frac{e}{m} \cdot \frac{B^2}{2}$ .

Die Analyse der Unsicherheit gestaltet sich hier anders als im Fall einer Mehrfachmessung, da die einzelnen Paare von Messwerten gewichtet werden müssen. Mathematisch basiert das Vorgehen auch hier auf der Methode der kleinsten Quadrate, sodass die Gewichtung letztlich mithilfe der zugehordneten Unsicherheit durchgeführt werden kann (in der Regel wird dazu auf Software zurückgegriffen).

Ein Einbezug der Unsicherheiten wird im GUM nicht direkt aufgeführt. Da GUM eine Reduktion der verschiedenen WDFs zu einer jeweils standardisierten Unsicherheit vorschlägt, kann die grafische Auswertung genau wie im „klassischen“ Vorgehen umgesetzt werden und muss somit nicht extra behandelt werden. Für ein vereinfachtes Vorgehen für den Schuleinsatz, dass auf diese mathematische Reduktion verzichtet, beispielsweise indem auf die von uns angeboteten Software Lösung zurückgegriffen wird, stellt sich hier ein Problem dar. Ein Problem, dass bislang noch ungelöst ist. Denkbar ist etwa eine Gewichtung durch die WDFs selbst, was jedoch mit erheblichem Rechenaufwand verbunden ist.

Aspekt 1: Abschätzen von Messunsicherheiten bei einer einzelnen Messungen

Aspekt 2: Anzahl der Messwerte

Aspekt 3: Ausschluss einzelner Messwerte

Aspekt 4: Die Mittelwertbildung

Aspekt 5: Abschätzung / Berechnung der Unsicherheit bei indirekten Messungen (e/m)

Aspekt 6: Angabe des e/m Ergebniswertes (Anzahl signifikanter Stellen und Runden)

Aspekt 7: im Falle der grafischen Auswertung: Das Hinzufügen des Nulldurchgangs (0/0)

Aspekt 8: Die graphische Auswertung (z.B. )

Aspekt 8: Die graphische Auswertung (z.B. $U \rightarrow r^2$ )