Fußball, schlechte Mathematik und vorgebliche Wissenschaft: Wie Metin Tolan dieses Blog inspirierte

Eigentlich ist heute ein Arbeits- und Champions-League-Tag, an dem ich nicht damit gerechnet hatte, überhaupt etwas zu schreiben. Gleichzeitig ist es aber auch der Tag, an dem Metin Tolan seinen ersten Blogpost bei den Wissenslogs veröffentlich hat, und das muss hier Erwähnung finden. Denn Metin Tolan ist mit der Entstehung dieses Blogs mehr verbunden, als ihm bewusst sein kann. Schon deswegen heiße ich ihn in meinem Feedreader herzlich Willkommen!

Die Geschichte beginnt etwa vier Monate vor Einrichtung dieses Blogs; vier Monate etwas mit mir rumzutragen, bevor ich es dann tatsächlich mache, ist übrigens für mich keine unübliche Zeitspanne. Letzten Februar saß ich also im Büro und las, wie es sich für einen guten und anständig bezahlten Doktoranden gehört, SpiegelOnline. Zu einer Zeit, als Schalke 04 Tabellenführer war, verdientermaßen, was durch die wöchentlich erneuerte Tabelle an meiner Bürotür auch bei der Arbeit jederzeit präsent war. Natürlich musste ich da den unter Wissenschaft einsortierten Artikel lesen: Fußball ist Glücksspiel, geschrieben von Holger Dambeck unter großzügiger Bezugnahme auf den Dortmunder Physiker Metin Tolan [1]. Je länger ich mir den Artikel durchlas und mir die vor allem in der Foto-Galerie dargestellten Ergebnisse ansah, um so heftiger überkamen mich Unglauben und heftiger körperlicher Schmerz. So sehr, dass mir der Artikel im Hinterkopf blieb als gern angeführtes Beispiel in gelegentliche Kollegen-Diskussionen über zweifelhafte Wissenschaft und fragwürdigen Wissenschaftsjournalismus. Aus dieser Episode entstand dann jedenfalls unter anderem die Idee, dieses Blog zu begründen. Meine Ansichten über fahrlässigen Umgang mit Statistiken und anmaßende Behauptungen über die Relevanz der eigenen Ergebnisse sind hier vielleicht schon mal angesprochen worden. Und die Analyse des somit blogbegründenden Spiegel-Artikels, die vielleicht einiges zeigt, was im Zusammenspiel von Wissenschaftlern und Journalisten falsch laufen kann, gibt’s jetzt:

 

Erst mal möchte ich feststellen, dass Holger Dambeck unter dem Titel Numerator schreibt. Das ist begrenzt albern, für SpiegelOnline-Verhältnisse, aber vor allem eine Verpflichtung: wer so eindrücklich auf seine mathematische Kompetenz hinweist, muss veröffentlichte Fehler mitverantworten. Das Ganze war im Übrigen ja auch im Wissenschafts-Ressort abgelegt, nicht bei Sport. Aber das Journalisten-Handwerk beherrscht er fast schon lehrbuchmäßig. Es gibt zwei einleitende Absätze: der erste widerspricht dem Rest des Artikel (”scheint zu stimmen (…) ausgerechnet für Fußball aber nicht”, wenn es doch für die allerwenigsten Sportarten gilt und für keine absolut) — aber wenigstens behält Dambeck die unsinnige Behauptung bis zum Artikelende bei; guter Journalismus will den Leser ja nicht verwirren. Der zweite Absatz besteht aus sinnfreien Übertreibungen, wohl um noch mehr Interesse zu wecken: kein Informationswert, aber schön (auf)gespielt.

Es folgen Banalitäten. Manchmal entscheidet ein Tor über ein Spiel. Ein Tor zu schießen ist schwierig, darum hat der Zufall seine Hand im Spiel. Manchmal siegt die “schwächere” Mannschaft. Bis es dann endlich Zahlen gibt, die aussagen, dass beim Fußball etwa in 45% der Spiele der “Underdog” gewinnt, im Baseball bei 44%, im Hockey bei 41% und beim American Football und Basketball in je 36% der Fälle. Die letzten vier Zahlen stammen übrigens aus einer US-Studie, woher die erste stammt, bleibt unklar. Inwiefern das einen für den Artikel vorausgesetzten nicht nur quantitativen, sondern qualitativen Unterschied ausmachen soll, wird nicht erläutert.

Die Hauptthese, dass Fußball vom Zufall regiert werde, wird nämlich durch Herrn Tolan begründet. Der hat für eine Computersimulation angenommen, dass Sieg und Niederlage rein zufällig einer Mannschaft zufällt. Der einzige Parameter, der dann noch in die Simulation eingebaut werden musste, ist die Häufigkeit eines Unentschiedens (hier als 25% geschätzt). Das ergibt dann eine (Entschuldigung: eine(!) — offensichtlich war Metin Tolans Rechenzeit sehr begrenzt, denn es gibt tatsächlich nur diese einzige eine) Zufallstabelle, die man dann mit tatsächlichen Fußballtabellen vergleichen kann. Im Text vollzieht Holger Dambeck das nur andeutungsweise (”unterscheidet sich kaum”), aber tatsächliche Ergebnisse gibt es in der ersten Bildergalerie. Bild 2 zeigt die Endtabelle 2005 im Vergleich mit Metin Tolans Zufallstabelle, inklusive echter nach Mathematik aussehender Formeln und Zahlen.

Schlechte Mathematik, Ausstellungsstück A: die statistische Fluktuationen (wie sehr die Punktzahlen um den Mittelwert schwanken, wohl die Standardabweichung) stimmen überhaupt nicht miteinander überein. 76%ige Abweichung. Holger Dambeck interessiert’s nicht: “ähnelt (…) auf verdächtige Weise”. Richtig Herr Dambeck, sind in beiden Tabellen 18 Mannschaften. Und Metin Tolan kümmert’s wenig.

SM, Ex B: Damit’s ein bisschen ähnlicher wird, rechnet Tolan die beiden Extrema, Erster und Letzter, aus der Bundesliga-Tabelle heraus, wodurch logischerweise die Varianz fällt. Die beiden Werte sind sich jetzt deutlich ähnlicher, was wohl beim Leser einen “Aha, stimmt ja doch”-Effekt bewirken soll. Dummerweise sind die beiden Zahlen nicht mehr vergleichbar. Rechnet man aus Tolans Zufallstabelle die Extrema raus, fällt da ja auch die Varianz. Vielleicht war die Bestimmung einer weiteren Standardabweichung zu umständlich, aber vielleicht fehlt die auch im Bild, weil es so vermeintlich besser ausgedrückt wird, was Metin Tolan eh beweisen wollte.

SM, Ex C: Darüber gibt’s noch die durchschnittliche Punktzahl aller Teams, und, alle Achtung: die stimmen fast überein. Also muss Metin Tolan wohl doch recht haben. Diese erstaunliche Übereinstimmung… der Beweis. Nun ist die Sache mit der durchschnittlichen Punktzahl eine besondere: es gibt halt in jedem Spiel drei Punkte zu verteilen. Dass heißt, jede Mannschaft nimmt pro Spiel durchschnittlich 1,5 Punkte mit, unabhängig vom Ausgang. Es gibt eine Ausnahme, nämlich das Unentschieden, wenn beide Mannschaften nur 1 Punkt bekommen. Damit ist aber die durchschnittliche Gesamtpunktzahl nur von einer Variablen abhängig: wie häufig Spiele unentschieden ausgehen. Das war aber auch die einzige Variable, die nicht aus Tolans Simulation rauskommt. Die Übereinstimmung der Werte beruht also nur darauf, dass in der vorgestellten Saison tatsächlich ungefähr ein Viertel der Spiele unentschieden endete. Herr Tolan hätte auch einfach die tatsächliche Häufigkeit der Unentschieden in der Saison in seine Simulation stecken können, dann hätte auf beiden Seite die exakt gleiche Zahl gestanden. Es ist natürlich ein verwerflich schlechter Gedanke, dass er das deshalb nicht gemacht hat, weil eine leichte Abweichung, wie sie jetzt da steht, viel überzeugender und wissenschaftlicher aussieht. Auch wenn der Zahlenwert überhaupt gar nichts mit der eigentlichen Simulation zu tun hat, weil der vorher schon feststand.

Das Ganze wird nicht dadurch besser, dass man noch zwei Fußballtabellen dagegenhält, ganz egal wie oft man das behauptet. Dass kann schon deshalb nicht sein, weil die Ähnlichkeit zweier Tabellen nichts über die zugrunde liegenden Ursachen aussagt. Nehmen wir als Beispiel die Ergebnisse einer Klausur. Die Einzelnoten sind, im idealisierten Fall, wie eine Glockenkurve verteilt. Jetzt simuliere ich die, indem ich Zufallszahlen um einen Mittelwert auswürfele und, siehe da, ich kriege ebenfalls eine vergleichbare Glockenkurve. Metin Tolan müsste daraus jetzt folgern, dass Klausurerfolg Zufall ist; und Numerator Holger Dambeck könnte einen Artikel schreiben, dass die Wissenschaft endlich bewiesen hat, dass Lernen und Bildung nichts bringt.

Das ist natürlich widersinnig, so widersinnig wie die Ergebnisse hier. Nur um das mal zusammenzufassen: Metin Tolan erstellt eine(!) Zufallstabelle, aus der er genau einen statistischen Wert berechnen kann — und der stimmt nicht nicht mit der Realität überein. Und Holger Dambeck zelebriert mit Metin Tolan die wissenschaftliche Beweisführung. Glückwunsch!

Dass an der Zufallsbehauptung nichts dran ist, sieht man nicht nur an der abweichenden statistischen Varianz, die immerhin sogar Tolan aufgefallen ist, wohlgemerkt als einzig erwähnte Abweichung zwischen Realität und Simulation. Dabei ist ohne pseudowissenschaftlichen Firlefanz viel entscheidender, dass jedes Jahr fast dieselben Mannschaften am Ende oben in der Tabelle stehen und man schon vor der Saison einen guten Tipp abgeben kann, wer wohl in den Abstiegskampf gerät. Reine Erfahrung allein sagt so schon aus, dass an dem Zufallsmodell nichts dran ist, so sehr der auch einzelne Spiele entscheiden kann. Dass dazu Spielergebnisse wie Endtabellen vor allem auch in psychologischer Dynamik entschieden werden, nicht statistisch, ist da nur noch eine Banalität. Gerade für einen Schalker.

Die Besprechung des Spielstärkemodells, dass in dem Artikel nur angedeutet wird, erspare ich mir. Die Illustration (Galerie 1, Bild 5) legt einige grobe Fehler nahe, die ich aber mangels Erläuterung nicht beweisen kann, unter anderem den, dass Spielstärke und resultierende Punktzahl unzulässig miteinander vermischt werden, obwohl das zwei grundsätzlich unterschiedliche Skalen sind, die eben nicht linear zusammenhängen. Es kann auch einfach sein, dass die enigmatische Beschreibung zu dem Bild einfach nur fehlerhaft ist.

Alles in allem ist der Artikel eine wunderbare Veranschaulichung, was passiert, wenn ein entsprechender Wissenschaftler auf einen entsprechenden Wissenschaftsjournalisten trifft [2]. Ein sehr inspirierter Artikel mit eingängiger Folgerung, die leider absoluter, durch nichts zu rechtfertigender Blödsinn ist, der aber bis zum Ende durchgehalten wird. Natürlich weiß ich auch, dass das ganze keine bierernste Wissenschaft ist. Aber selbst wenn man mit Wissenschaft unterhalten will und unter dem Anspruch arbeitet, habe ich wenig Toleranz für solche hanebüchen schlechte Artikel. Es war schließlich der 20. Februar, nicht der 1. April.

 

Metin Tolan eröffnet derweil seinen Wissenslogs-Blog [3] mit einer Korrelation zwischen geschossenen Toren und der Wahrscheinlichkeit eines unentschiedenen Spielausgangs. Dass es eine Korrelation gibt, ist schon klar. Metin Tolan möchte aber gleich eine starke Korrelation feststellen (und wählt dazu das Beispiel des kausalen Zusammenhangs zwischen Wassertemperatur und Heizplatte), die zudem noch mathematisch exakt beschreibbar sein soll. Damit macht er aus einer relativ banalen Richtigkeit, die eines Physik-Dozenten wenig würdig erscheint, eine ungleich kompliziertere Falschheit. Herr Tolan und ich werden bestimmt noch sehr viel Spaß miteinander haben.

Im Übrigen scheint mein Verein immer zu verlieren, wenn ich den hier erwähne. Mit entsprechenden Simulationen lässt sich das aber bestimmt als Zufall entlarven. Oder einfach durch einen Sieg heute abend. Glück Auf!

 

[1] Die ganze Geschichte wird nicht besser dadurch, dass Metin Tolan ausgerechnet in Dortmund lehrt, dazu aber Stuttgart-Fan ist. Angesichts des Ausgangs der Saison 2007 ist das vermutlich nur ein weiteres Indiz für die durchgehend gottlose Schlechtigkeit dieser Welt.

[2] Tiefere persönlichere Bewertungen spar ich mir hier. Ich seh wesentlich weniger Schuld bei Holger Dambeck, aber Wissenschaftsjournalismus (eine Profession, die ich nicht beneide) erfordert nun mal eine gewisse kritische Beschäftigung mit dem Thema, auch wenn es den Artikel dann weniger aufregend macht — oder man am Ende den gar nicht schreiben kann, weil sich alles als heiße Luft herausstellt.

[3] Ich weiß, beabsichtigt ist vermutlich die Bezeichnung Wissenslog, aber für die Verwendung oder Etablierung von Markennamen bin ich nicht in der Stimmung.

9 Responses to “Fußball, schlechte Mathematik und vorgebliche Wissenschaft: Wie Metin Tolan dieses Blog inspirierte”

  1. Sehr schön auseinandergenommen. Stimme Dir 100%ig zu.

  2. [...] Dambeck, dessen kritische Fähigkeiten hier schon Thema waren, leitet für SpiegelOnline (”Hormonthese: Das Geheimnis des männlichen Witzes”) [...]

  3. [...] Zufall Fußball und der Bettelmann Veröffentlicht in 26. Februar 2008 von kamenin Holger Dambeck legt nach, und hat sich diesmal Verstärkung aus Münster geholt: sich andauernd auf Metin Tolan zu [...]

  4. Hallo!

    Interessanter Themenkomplex. Ich bin auf dieser Seite gelandet, weil ich eine mathematische Formel zum Thema Fußball suche, von der ich mal gehört habe.

    Es geht um die Berechnung der Mindestpunktzahl für den Klassenerhalt mit den Variablen “Anzahl der Mannschaften” und “Anzahl der Absteiger”. Können Sie mir da einen Tipp geben?

    Danke
    MfG
    G. Theis

  5. Von einer entsprechenden Formel habe ich noch nichts gehört. Allerdings ist mir auch die eigentliche Frage nicht ganz klar. Geht es um die absolut minimalste Punktzahl, mit der man eine absolut nur theoretische Chance auf den Klassenerhalt hätte?

    Schauen wir für die Bundesliga nach und betrachten wir die vier schlechtesten Mannschaften. Die Minimalpunktzahl, die alle vier erreichen könnten, wäre jeweils 6 Punkte (verlieren immer, spielen untereinander unentschieden). Für alle wäre die Tordifferenz ausgeglichen, aber in dem Fall zählt die Zahl der erzielten Tore, was hier einen Unterschied machen kann; selbst wenn nicht, müsste eine der vier 6-Punkte-Mannschaften schließlich doch in der Klasse bleiben, ob per Losentscheid oder Entscheidungsspiel oder wie es der DFB gerne hätte. Die Minimalstpunktzahl für einen Klassenerhalt müsste damit sein (Beweis per vollständiger Induktion kann man gerne selbst versuchen ;-):

    MPZ = 2 * Zahl der Absteiger

    Zumindest sehe ich gerade nicht, wie man mit noch weniger Punkten abschließen könnte, ohne dass eine andere Mannschaft noch an einem vorbeizieht. Den unmathematischen Fall von Punktabzügen durch den DFB natürlich außen vor gelassen.

    Die Anzahl der Mannschaften spielt dabei nicht rein, solange sie (sinnhafterweise) größer ist als die Zahl der absteigenden Mannschaften. Von daher bin ich mir fast sicher, dass Ihre Frage doch ein etwas anderes Ziel hatte.

  6. Auch interessant.

    Mir geht es aber um die mindestens benötigte Anzahl an Punkten, die man für einen sicheren Klassenerhalt benötigt.

    Nach Anwendung der Formel sollte man ungefähr sagen können: Wir spielen in einer Gruppe von 16 Mannschaften, von denen 2 absteigen, also brauchen wir mindestens X Punkte (um drittletzter zu werden und somit dem Abstieg zu entgehen).

  7. Jetzt habe ich es besser verstanden, aber immer noch meine Schwierigkeiten, weil es meiner Meinung nach keine ganz in sich konsistente Frage ist.

    Zum einen kann man natürlich ähnlich berechnen, wie viele Punkte man braucht, um 100%ig nicht abzusteigen (sicherer Klassenerhalt); aber das ist natürlich nicht die Punktzahl die man “mindestens” braucht. Mindestens braucht man die Zahl aus oben angegebener Formel, um überhaupt eine Chance zu haben, nicht abzusteigen. Wieviele man braucht, um garantiert nicht abzusteigen, werde ich in einem Post (hoffentlich) morgen erklären. Das finden Sie dann, indem sie den Trackback, der als nächster Kommentar erscheinen wird, anklicken.

    Aber wenn meine kurze Vorüberlegung stimmt, wird diese “sichere” Zahl sehr hoch sein, unrealistisch hoch, und darum praktisch keine Bedeutung haben. Die tatsächliche Punktzahl am Ende der Saison, mit der man nicht absteigt, wird weit niedriger liegen. Aber für die wird man dann nur Wahrscheinlichkeiten angeben können, etwa: “mit welcher Punktzahl steige ich zu 50% (oder 75 oder 90%) nicht ab?” Das ist mathematisch wesentlich aufwendiger und auch nicht exakt, weil es mathematisch nicht herleitbare Annahmen, etwa die Verteilung der Spielstärken und die Chancen auf ein Untentschieden, voraussetzt. In dem Fall wäre es vermutlich einfacher (und möglicherweise sogar genauer), die Wahrscheinlichkeiten aus den Statistiken aller schon verfügbaren Tabellen mit derselben Mannschaftszahl abzuschätzen.
    Oder man macht es über Metin Tolans Ansatz, nimmt ein vereinfachtes Spielmodell und lässt für eine Woche den Rechner Tabellen simulieren, um am Ende zu sagen: Punktzahl X hat in 75% der Fälle gereicht, um nicht abzusteigen.

    Aber erst morgen die Antwort auf die Frage, mit wie vielen Punkten man ganz sicher den Klassenerhalt geschafft hat bzw. in keinem denkbaren Fall mehr absteigen kann.

  8. Danke für die Ausführungen, da ist mir doch einiges klarer geworden.

    >wird diese “sichere” Zahl sehr hoch sein

    Das denke ich jetzt auch.

    Bleibt die Frage, ob man im Verlauf der Saison - etwa nach Ende der Hinrunde - unter Berücksichtigung der bis dahin zustandegekommenen Daten genaueres sagen kann.

  9. [...] ist eine Nachfrage von Kommentator G. Theis, der wissen wollte, ob man für eine gegebene Zahl an Mannschaften und Absteigern schon vor Beginn [...]

Leave a Reply