Statistik: Erwartungen und Wahrheiten bei Zahlen aus der Presse etc.

  • Guten Tag zusammen,

    ich habe gestern ein bissl gelesen hier und festgestellt, dass die "gefühlte Gefährdung" sehr unterschiedlich empfunden wird. Da oft statistische Daten als Begründung oder Rechtfertigung für Vorsorge und angepasstes Handeln genutzt werden, wollte ich dazu ein wenig aus meiner Erfahrung dazu beitragen.


    Statistik (i.S.v. Interpretation von Zahlenhaufen) ist nicht sehr tief in unserer Schulausbildung verbreitet. Die wissentschaftliche Auslegung ist auch sehr trocken und abstrakt. Wer aber schon den TV einschaltet, bekommt Statistiken zu Klima, Wetter, Kriminalität und anderen "Bedrohungen" zietiert, ohne dass man darüber nachdenkt, was einem da eigentlich erzählt wird. Im ersten Moment glaubt man es (die meisten tun das ja gerne), weil es "amtlich" oder öffentlich mitgeteilt wird. Nachdem ich im beruflichen Umfeld mal mit der Kriminalstatistik zu tun hatte, stellte ich fest, dass die Realität und die Erwartungen sehr weit auseinander lagen. Deshalb möchte ich mal die Methoden aufzeigen, weil man damit eben selten in Kontakt kommt.


    "Statistisch gesehen ist die Gefahr, Opfer eines Schadensereignisses zu werden, ähnlich der eines Lottogewinns" Wer hat sich für den Lottogewinn vorbereitet?


    Wie wird eine Statistik gemacht? Ganz einfach: Man nimmt mehr als 1000 Rohdatensätze, sortiert nach Gusto und fügt eine Interpretation hinzu. Man bekommt dann mathematisch genau eine 90%tige Wahrheit. Erfundenes Beispiel: Stuttgart hat 1500 Bushaltestellen, diese werden mehrfach am Tag angefahren. Im Schnitt wird also jede ca. 9,38 mal am Tag "bedient". Wie man sieht, eine mathematisch richtige, aber für Einzelbürger nutzlose Information.


    Jetzt wirds politisch: Der Bürgermeister verfügt, dass ab jetzt jede Haltestelle 1x mehr angefahren wird, damit verbessern wir den ÖPNV. Auch mathematisch richtig, aber ebenso sinnlos in der Realität. Denn welche Haltestellen sind gemeint? Und hier ist der Hund begraben: Keiner kennt die Rohdaten, keiner kennt die Auswahlmethoden UND die kausale Interpretation IM GANZEN. Ausser der, der die Statistik gemacht hat. Und so lässt sich damit "alles" begründen, egal, wie die Zahlen aussehen.


    Beispiele aus meinem Arbeitsleben:

    Regenmengen (Starkregenereignisse) in der Vorderpfalz seit 1968: Häufung in den 80ern, abnehmende Häufung bis heute (Hoppla, dass wird aber ganz anders kommuniziert?). Was wird gemacht? Man nimmt zur Bemessung von Kanälen jetzt ein 30-jähriges Ereignis, nicht mehr nur fünfjährig. Gleiches beim Hochwasser. Und schon wachsen die Rohrdurchmesser.


    Kriminaltität: Rohdaten gehen von der PI an das Innenministerium, diese werden um die Randgruppen beschnitten, dann werden die Erhebungen für die Rohdaten der Folgejahre angepasst. Das, was im TV präsentiert wird, ist eine recht freie Darstellung der Realität. Wenn es kein Feld zum Anklicken für "Straftäter aus Land X" gibt, dann gibt es dies Straftat eben nicht. Sie fehlt in den Rohdaten. Oder wird nicht mit einbezogen. Wer weiß das schon?


    Feuerwehr: Rund 30% der Einsätze sind Brandeinsätze. Seit 60 Jahren so, abnehmende Tendenz. Deshalb wird die Ausrüstung, Ausbildung und Mannschaft darauf ausgelegt. Keine Feuerwehr ist (alleine) für ein besonderes Einzelereignis ausgerüstet. Warum? Statistisch unwahrscheinlich. Trotzdem sollte man einen Feuerlöscher haben. Und eine Tauchpumpe, und...?


    Erhebung von Wohnraum: Es werden zufällig und anonym Bürger per Brief befragt. Keiner kann nachprüfen, wie real die Daten sind, die an die Gemeinde zurück gegeben werden. Oft werden Wohnungsgrößen oder Mieten anderst angegeben - aus Angst vor dem Finanzamt. Wohnungsnot? Kann sein - oder eben nicht...


    Was will ich damit sagen? Lasst euch nicht den eigenen Verstand ausreden. Die Realität ist das, was ihr um euch herum seht und erlebt. Wie oft regnet es, wie oft gibt es Hochwasser? Muss ich mich vorbereiten? Jeder muss es selbst entscheiden. Und man trifft mit einiger Sicherheit dann so rund 80% der Wahrscheinlichkeit. Das ist schon ein guter Wert! Mit einer gesunden Auslegung der Gefährdung hat man eine gute Basis für Vorbereitung und Lagerhaltung. Jedes Wirtschaftssystem analysiert die Vergangenheit, um Prognosen zu erstellen. Bei dieser Analyse ist die Qualität der Rohdaten entscheident. Das Problem für alle hier im Alltag ist, die richtigen Rohdaten, also die Wahrheit, zu erfahren. Bleibt skeptisch, jede amtliche Mitteilung kann amtlich widerlegt werden. In jedem Ministerium arbeiten in der Kommunikation Menschen den ganzen Tag daran, Informationen "maßzuschneidern". Im Allgemeinen ist das Hintergrundwissen der Politiker weit geringer als angenommen. Was bleibt, sind Fachleute (Feuerwehr, THW etc.) vor Ort, wenn etwas passiert. Und da lohnt es sich, hinzuschauen, abzuschauen, mitzuhelfen und vorzusorgen!


    Ich bin jetzt absichtlich nicht auf mathematische Details eingegangen, bitte einfach Fragen. Und wer hat Angst vorm "Klima"? Ich nicht. Change my mind :-)


    Viele Grüße,

    Etzwiesel

    QTH: JN49FH

    Einmal editiert, zuletzt von Etzwiesel ()

  • Etzwiesel

    Hat den Titel des Themas von „Statistik: Erwartungen und Wahrheiten von Zahlen“ zu „Statistik: Erwartungen und Wahrheiten bei Zahlen aus der Presse etc.“ geändert.
  • In ähnlicher Weise ist mir das selbst auch schon bei der Zählung von Extremwetterlagen aufgefallen. Angeblich sollen die seit Jahren ansteigen, aber wenn in die Reports der schweizerischen Elementarschadenversicherung schaut, dann gibt es dort noch keinen Anstieg. (Die Elementarschäden werden jedoch 2 Jahre verzögert raportiert.)


    Vermutlich sind das unterschiedliche Zählweisen und Gebiete. In Südeuropa gab es in den letzten Jahren - glaube ich - im Verhältnis (prozentual) einen größeren Anstieg an Extremwetterlagen als bei uns. Bei uns halten die Alpen einiges ab. Wollen wir mal hoffen, dass das auch so bleibt ...

    Die Zukunft schwer zu sehen sie ist. (Aus Starwars)

    Einmal editiert, zuletzt von consuli () aus folgendem Grund: Fehlerkorrektur

  • Ja, das hat Einiges für sich. Allerdings sollte das allgemein geübte Praxis sein: Bei Statistiken und ganz ähnlich bei wissenschaftlichen Arbeiten und Befragungen/Erhebungen sollte man sich zur fundierten Auseinandersetzung natürlich mit Datenbasis, Erhebungsmethode, genauer Fragestellung, befragte Gruppe etc. befassen. Dabei stößt die Behandlung und Rezeption im Rahmen von Medienberichten wegen der nötigen Kürze natürgemäß an ihre Grenze, allerdings ist man dann halt gefordert, sich das komplette zugrundeliegende Werk zu Gemüte zu führen, wenn man so tief einsteigen will.


    Hinzuzufügen zu den Ausführungen ist noch, dass keine Statistik für sich alleine Aussagekraft hat. Sie erhält sie erst im Vergleich zu auf gleicher oder vergleichbarer Grundlage erhobenen Daten in einer möglichst langen zeitlichen oder räumlichen Reihe. Am Beispiel: Die 9,38 Busbedienungen für sich sagen exakt nichts aus. Aussagekraft erhalten sie erst im Umfeld von mit gleicher Methode erhobenen Daten aus den Vorjahren und/oder aus anderen, möglichst vergleichbaren Kommunen.


    Ich finde auch das Beispiel mit den Rohrdurchmessern keineswegs bemerkenswert. Es ist ja transparent, dass man nun das 30-Jahre-Ereignis als Grundlage nimmt. Dieser Beschluss wird eine Grundlage in Verwaltung oder Politik haben, Im Idealfall lässt sich irgendwo die Begründung dazu finden. Der kann man nun folgen oder nicht. Mit Statistik hat das allerdings wenig zu tun.


    Klar ist auch, dass sowohl quantitative (die Einsatzstatistik) als auch qualitative (die Erfahrung der Feuerwehrleute) Informationen Teil eines Gesamtbilds sind. Die eine Quelle ist per se nicht besser oder schlechter als die andere. Sie decken nur verschiedene Heransgehensweisen ab und lösen im Idealfall in der Zusammenschau Erkenntnisse aus.


    Ebenso wie mit korrekten Zahlen sollte man mit korrekten Begriffen arbeiten: Das auch langjährige Wetter in der Oberpfalz hat mit dem Klima in seiner Gesamtheit nicht allzu viel zu tun. Insofern sind die dortigen Regenmengen auch weder ein Beleg noch eine Widerlegung des Klimawandels.


    Dass die persönliche Verhaltensweise wiederum die Folge der persönlichen Gewichtung der vorliegenden Fakten ist, stellt ebenfalls eine Selbstverständlichkeit dar. Ich persönlich bereite mich nicht primär auf irgendwelche sozialen Unruhen oder einen systemischen Blackout vor, sehr wohl hingegen auf Versorgungsunterbrechungen und andere Misslichkeiten durch Wetterereignisse. Andere mögen das anders bewerten.

  • Versorgungsunterbrechungen und andere Misslichkeiten durch Wetterereignisse...


    ...auch für mich die statistisch wahrscheinlichste Situation, für die man Vorsorgen sollte. Aus meiner Erfahrung, aus meiner Sicht. Leider wird in den letzten Jahren wenig sinnvolle Information verbreitet, wie sich die Risiken derzeit tatsächlich im Bundesgebiet darstellen. Deshalb rate ich zu großer Vorsicht bei "veröffentlichten" Zahlenwerken und deren oft politisch gefärbten Handlungsempfehlungen. Und eine gute Nase, um die nicht enthaltenen Informationen zu finden.

  • Etzwiesel Danke für den Beitrag, gut erklärt.


    Dasselbe ist es im Übrigen bei der Arbeitslosenstatistik (wie bereits an anderer Stelle erwähnt, werden u.a. Menschen über 58, 1€-Jobber oder kranke Arbeitslose überhaupt nicht als solche geführt. So werden dann aus eigentlich 3,1 Mio. Arbeitslosen mal schnell 2,2 Mio. gemacht und der Öffentlichkeit so präsentiert - Quelle: https://www.die-linke.de/theme…he-arbeitslosigkeit/2019/)


    Auch bei der Kriminalitätsstatistik wird m.E. kräftig manipuliert, um der Öffentlichkeit bloß nicht zu bestätigen, dass gewisse politische Entscheidungen großer Tragweite Auswirkungen auf die Sicherheitslage hatten / haben. Wäre ja auch äußerst ungünstig für das eigene Image. (Wir alle wissen hoffentlich mittlerweile, dass die Politik die Inhalte öffentlich-rechtlicher Medien im besten Falle "mitbestimmt".)


    Ein weiteres Thema sind dann natürlich auch wissenschaftliche Studien, wo man immer auch darauf achten sollte, wer der Auftraggeber der Studie ist (und diese somit auch finanziert hat). So ist eine von Bayer in Auftrag gegebene Studie mit dem Ergebnis "Glyphosat ist harmlos" im Grunde völlig wertlos.


    Die Fähigkeit, Dargebotenes kritisch zu hinterfragen, wird in Zukunft immer bedeutsamer werden. Zwei gute Leitfragen können dabei sein: Wer verbreitet die Information? Und wem nützt die Verbreitung dieser Information? Wenn die Antwort zweimal dieselbe ist, ist Argwohn durchaus angebracht ;)

  • Versorgungsunterbrechungen und andere Misslichkeiten durch Wetterereignisse...


    ...auch für mich die statistisch wahrscheinlichste Situation, für die man Vorsorgen sollte. Aus meiner Erfahrung, aus meiner Sicht. Leider wird in den letzten Jahren wenig sinnvolle Information verbreitet, wie sich die Risiken derzeit tatsächlich im Bundesgebiet darstellen. Deshalb rate ich zu großer Vorsicht bei "veröffentlichten" Zahlenwerken und deren oft politisch gefärbten Handlungsempfehlungen. Und eine gute Nase, um die nicht enthaltenen Informationen zu finden.


    Die beste Möglichkeit um zu objektiven Informationen zu kommen, sind m.E. solche Zahlen, die keiner Zählweise-Interpretation bedürfen. Z.B. die Schäden in der Elementarschadenversicherung. Entweder die Elementarschadenversicherung zahlt Schäden aus, oder nicht. Da gibt es keine Interpretationsmöglichkeiten.


    Wenn man solche objektiven Zahlen mit den Google-Hits und den Google-Suchnfragenzahlen vergleicht, kann sehr viel über die aktuelle Stimmung herausbekommen. Auch über die Stimmung, die von Social-Media-Influencer-Farmen gemacht wird ...

    Die Zukunft schwer zu sehen sie ist. (Aus Starwars)

  • Lasst euch nicht den eigenen Verstand ausreden. Die Realität ist das, was ihr um euch herum seht und erlebt.

    Da stimme ich Dir zu, aber ....


    Wer kennt es nicht ? Die Aussage, das früher zu Weihnachten viel mehr Schnee war.

    Leider macht uns unser Gehirn da manchmal auch was vor.


    Für den Bereich Köln gab es am 1. Weihnachtstag genau 4 mal Schnee und das in den letzten 70 Jahren !!!

    Quelle: Weihnachtswetter

  • Wie heisst es doch so schön?

    Traue keiner Statistik die Du nicht selbst gefälscht hast...

    Die grösste Verwundbarkeit ist die Unwissenheit - Sun Tsu

  • Zu dem Thema noch ein kleines "Schätzchen" auf DeinerRöhre.


    Der Horst Lüning (ein ehemaliger VW-Ingenieur, der als Online-Whiskey-Händler wohl genug Geld verdient hat, dass er sich nun um "andere" Dinge kümmern kann) hat in diesem Video analysiert wie gesammelte Klima-Daten (der Insel Norfork im absoluten nirgendwo im Südwest-Pazifik) nachweißlich nachträglich geändert und "homogenisiert" wurden um in das "Schema" zu passen.


    Es sei gesagt, ich bin kein Klimaleugner oder das Gegenteil, finde es nur erschreckend wie wir von allen Seiten belogen und betrogen werden!


    Die Zusammenfassung des Videos (für jene die keine Lust haben es sich an zu sehen :-):


    Auf der Norfolk Insel im Südwest-Pazifik, 800km nördlich von Neuseeland und 1.400km östlich von Australien, werden seit 1915 Temperaturen gemessen. Die Originaldaten sind beim australischen Bureau of Meterology und auch im Goddard Institute in New York City abrufbar. Es gibt im GISS-System 'justierte', 'gesäuberte' und 'homogenisierte' Daten, die ganz andere Tendenzen im Temperaturverlauf zeigen. Zeigen die Rohdaten einen ziemlich konstanten Temperaturverlauf über 100 Jahre, so sind die 'adjusted, cleaned und homogenized' Daten auf einen deutlich ansteigenden Verlauf getrimmt. Besonders interessant ist, dass bis 1975 die Temperaturen abgesenkt sind und danach angehoben wurden. Zur Erinnerung: Norfolk Island liegt mitten im Pazifik. Da gibt es keine benachbarten Messstellen, die eine Mittelung, Justierung oder Anpassung erforderlich machen.

    Besonders zu erwähnen ist, dass der Großteil der Klimaforschung diese 'korrigierten' Daten verwendet.

    Glaube wenig. Hinterfrage alles. Denke selbst.


    Albrecht Müller

  • Gestern im SWR-Nachrichtenfeed: niedrigste Arbeitslosenquote in D seit Jahren....


    -Was du denken sollst: tolle Wirtschaftspolitik!


    -Die Wahrheit: Wir nennen keinen Bezugsgrößen, nur den Quotient.


    -Es fehlt/fehlen:

    1. Personen, die dem Arbeitsmarkt zur Verfügung stehen

    2. Personen, die in "Maßnahmen" sind und als "nicht arbeitssuchend" gelten

    3. Zahl der tatsächlich Erwerbstätigen

    4. "offen" gemeldete Arbeitsstellen

    5. friktionale und saisonale Arbeitslosigkeit (in monatlichen Zahlen)

    6. nicht mehr arbeitsfähige Menschen unter 65 -> Sozialhilfeempfänger (Grundsicherung etc.)

    7. für politisch Interessierte: Anteil Nichtdeutscher darunter und Anteil EU-Bürger darunter...

    8. Vergleichszahlen der letzten Jahre


    -> damit könnte man sich ein reelles Bild machen, würde aber wahrscheinlich verunsichert werden....und deshalb funktioniert die "mathematische" Pressearbeit so gut, weil es keinen Interessiert oder keiner nachfragen soll, warum man dann noch die Steuern erhöhen "muss"... :-(


    VG

    Etzwiesel

  • Tatsächlich sind Statistiken weitaus zuverlässiger als das Bauchgefühl. Natürlich darf jeder gerne was anderes glauben aus dem Bauchgefühl heraus....


    Wie gut Leute Zahlen schätzen können, kann man ja problemlos testen. Ich nehme mal als für jeden mitmachbares Beispiel mal einen durchschnittlichen (Median) Lohn eines Vollzeit Arbeitnehmers in Deutschland oder wieviel man verdienen muss um zu den oberen 10% zu gehören (nach Nettoäquivalenzeinkommen)


    Geh auf die Straße, frage 20 Leute und staune ob der Antworten und dann vergleiche mit der Statistik.


  • Nichts davon widerlegt erstmal die Statistik. Das ist maximal Kritik an der Datenerfassung, aber die ist ja transparent.


    Gerne kannst Du eine andere Statsistik erstellen, die all diese Faktoren z.B. seit dem Jahr x berücksichtigt und dann Deine Ergebnisse präsentieren. Wenn Du dann nachvollziehbar(!) zu einem anderen Ergebnis kommst kannst Du DANN das Ergebnis auch tatsächlich zur Diskussion stellen (Recht hast Du noch lange nicht, sondern nur eine andere Methode benutzt), so jedenfalls ist das nur gehaltloses Lästern über die Arbeit anderer ohne es selber auch nur einen Deut besser zu können.

  • Auf der Norfolk Insel im Südwest-Pazifik, 800km nördlich von Neuseeland und 1.400km östlich von Australien, werden seit 1915 Temperaturen gemessen. Die Originaldaten sind beim australischen Bureau of Meterology und auch im Goddard Institute in New York City abrufbar. Es gibt im GISS-System 'justierte', 'gesäuberte' und 'homogenisierte' Daten, die ganz andere Tendenzen im Temperaturverlauf zeigen. Zeigen die Rohdaten einen ziemlich konstanten Temperaturverlauf über 100 Jahre, so sind die 'adjusted, cleaned und homogenized' Daten auf einen deutlich ansteigenden Verlauf getrimmt. Besonders interessant ist, dass bis 1975 die Temperaturen abgesenkt sind und danach angehoben wurden. Zur Erinnerung: Norfolk Island liegt mitten im Pazifik. Da gibt es keine benachbarten Messstellen, die eine Mittelung, Justierung oder Anpassung erforderlich machen.

    Besonders zu erwähnen ist, dass der Großteil der Klimaforschung diese 'korrigierten' Daten verwendet.

    Sicherlich gibt es eine offizielle Begründung dazu, warum die Daten in diesem konkreten Fall korrigiert wurden. Wo kann ich diese finden?


    Warum ist das nicht Bestandteil der Diskussion?

  • Gestern im SWR-Nachrichtenfeed: niedrigste Arbeitslosenquote in D seit Jahren....

    Eben: Nachrichtenfeed. Auf einer einzelnen Zeile eine grundlegende Kritik aufbauen zu wollen, scheint mir etwas gewagt. Die Dinge, die du in der Folge ankreidest, kann man im relative umfangreichen Bericht der Bundesanstalt für Arbeit nachlesen, viele von ihnen sogar in den kürzeren, aber immer noch datenreichen Monatsberichten der örtlichen Arbeitsagenturen. Allerdings kann die einzelne Zeile eines Feeds oder eine Kurzmeldung das auch nicht leisten. Sie bietet eine knappe Zusammenfassung, die notwendigerweise viele Aspekte weglässt. Wer tiefer einsteigen möchte, kann den entsprechenden Langtext im Wirtschaftsteil oder die genannten Agenturberichte durcharbeiten, die durchaus viel davon differenzieren.


    Zitat
    -Was du denken sollst: tolle Wirtschaftspolitik!


    Das ist halt Interpretation deinerseits, so lange du nicht in der Kommunikationsabteilung der Bundesanstalt für Arbeit dabei warst. Ich persönlich denke bei Arbeitslosenzahlen so ziemlich als letztes an die Wirtschaftspolitik, weil ich die staatlichen Möglichkeiten zur Beeinflussung der Konjunkturentwicklung für sehr begrenzt halte.


    Zitat
    -Die Wahrheit: Wir nennen keinen Bezugsgrößen, nur den Quotient.

    Stimmt so nicht. Die Berechnung der Arbeitslosenzahlen ist einigermaßen kompliziert und man kann durchaus kritsieren, dass bestimmte Gruppen herausgerechnet werden. Allerdings ist die Quote in Vergleich mit der nach dem gleichen Verfahren erhobenen der Vergangenheit sehr wohl aussagekräftig. Iirc um das Jahr 2000 herum gab es mal eine größere Umstellung. Da muss man natürlich darauf achten, dass die Werte davor und danach nicht ohne Weiteres vergleichbar sind.


    Die Punkte, die du im Folgenden aufzählst, stehen wie gesagt in der Langform der Berichte, nur kann man sie eben nicht in einem Newsfeed transportieren. Mag ja sein, dass bei den Veröffentlichungen der Agenturen bestimmte Sichtweisen nahegelegt werden, aber dass die Statistik an sich frisiert wäre, dafür sehe ich keine Indizien.

  • Ein anderes Beispiel ist die "Anpassung der Daten an die Gegenwart". Konkretes Beispiel wären hier die Temperaturmesserte in Wien. DIE Wiener Temperatur wird an der "Hohen Warte" gemessen, seit mindestens 1872. Damals war das alles viel Wald und wenig Stadt. Mittlerweile ist die Stadt auch dorthin gewachsen und alleine durch das zubetonieren und weniger Wald steigen die gemessenen Temperaturen. Um das Auszugleichen werden die gemessenen Temperaturen "angepasst" um dem Stadteffekt vorzubeugen.


    Und damit sind die Werte von der Größenordnung her ok, aber genau schauen darf man nicht denn angepasste Werte sind keine gemessenen/echten Werte :(

  • aber dass die Statistik an sich frisiert wäre, dafür sehe ich keine Indizien.

    Ich möchte deutlich darauf hinweisen, dass ich diese Aussage nicht getätigt habe. Ich habe die verkürzte Presseaussage der eigentlich notwendigen Randiformation gegenüber gestellt.


    Jeder, der sich auf Schadenereignisse vorbereitet, darf sich selbst eine Meinung aus den Statistiken bilden, und wie er mit den ihm zur Verfügung stehenden Mitteln umgehen möchte und sich dann konkret vorbereitet. Ich wollte mit meinem Text eigentlich die informieren, die sich vorher damit noch nicht mit diesem Thema beschäftigt haben. Alle hier, die sich mit Statistik und deren Kommunikationsmöglichkeiten auskennen, wissen sowieso, wie der Hase läuft.

  • Thema Schadenssumme: Die Schadenssumme eines Jahres ergibt sich aus der Anzahl der Vorfälle * dem durchschnittlichen Schaden. Wenn jetzt die Schadenssumme steigt, so sagt das noch nichts über die Ursache aus.

    Es könnten sich (Beispiel) die Anzahl der Hochwasserereignisse erhöhen oder es hat jeder einen Partykeller mit Sauna und TV im Keller. Egal was die Ursache ist, die Gesamtsumme steigt und damit kann man es interpretieren wie man möchte.